- Docente: Fabio Tamburini
- Crediti formativi: 9
- SSD: L-LIN/01
- Lingua di insegnamento: Italiano
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Bologna
- Corso: Laurea Magistrale in Lingua, societa' e comunicazione (cod. 0982)
Conoscenze e abilità da conseguire
Lo studente possiede una conoscenza approfondita delle tecniche per il trattamento automatico del linguaggio naturale. E' abile nella creazione, annotazione e sfruttamento di corpora elettronici
Contenuti
- Parte I: Tecniche avanzate per la gestione e l'analisi di corpora
- Metodi statistici per l'analisi testuale
- Espressioni regolari
- Metodologie di annotazione dei testi
- XML e TEI
- Parte II: La costruzione e la valutazione di applicazioni
- Tecniche di Machine Learning
- Metodologie per la valutazione dei prodotti della Linguistica Computazionale
- Cenni di Stilometria e Dialettometria
- Parte III: Grammatiche formali per l'analisi della lingua
- Linguaggi formali e linguaggio naturale
- Grammatiche context-free
- Grammatiche categoriali
- Rappresentazione del significato
- Categorial Type Logic
Testi/Bibliografia
- Lenci, A., Montemagni, S. and Pirrelli, V. (2005). Testo e
computer. Carocci.
- Ritchie C. and Mellish C. (2000). Techniques in Natural
Language Processing.
- Oakes M.P. (1998). Statistics for Corpus Linguistics.
Edimburgh Textbooks in Empirical Linguistics.
- Mitkow R. (ed.) (2003). The Oxford Handbook of Computational
Linguistics.
- D. Jurafsky and J.H. Martin (in press). Speech and Language
Processing, 2nd ed., Prentice Hall.
Per gli studenti che non hanno MAI seguito un corso di Linguistica
Informatica o Linguistica Computazionale durante la Laurea
Triennale consiglio di leggere PRELIMINARMENTE:
- Lenci A., Montemagni S. and Pirrelli V. (2005). Testo e computer. Carocci. [Cap. 1, 7, Par. 8, 8.1, 8.2, 8.3]
- Chiari I. (2007). Introduzione alla linguistica computazionale. Laterza. [Cap 1, 2]
Metodi didattici
Il corso di svolge in aula e laboratorio. Comprende circa 30 ore di lezione e esercitazioni in laboratorio.
Modalità di verifica e valutazione dell'apprendimento
L'esame consiste in una prova orale.
Strumenti a supporto della didattica
Il sito web del corso è stato progettato per essere il fulcro degli strumenti didattici. Contiene la maggior parte dei materiali didattici in formato elettronico, un'indicazione di tutte le procedure e le modalità di erogazione del corso, nonché una ricca raccolta di software del settore.
E' stato inoltre predisposto un CD-ROM a disposizione degli studenti contenente un ambiente di lavoro completo per sperimentare le metodologie proposte nel corso. Questo strumento verrà utilizzato anche nelle esercitazioni in laboratorio.
Link ad altre eventuali informazioni
http://corpora.dslo.unibo.it/LingCompLM_LET/
Orario di ricevimento
Consulta il sito web di Fabio Tamburini