- Docente: Fabio Tamburini
- Crediti formativi: 9
- SSD: L-LIN/01
- Lingua di insegnamento: Italiano
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Bologna
-
Corso:
Laurea Magistrale in
Lingua, società e comunicazione (cod. 0982)
Valido anche per Laurea Magistrale in Semiotica (cod. 0968)
Laurea Magistrale in Italianistica, culture letterarie europee, scienze linguistiche (cod. 0973)
Laurea Magistrale in Italianistica, culture letterarie europee, scienze linguistiche (cod. 0973)
Conoscenze e abilità da conseguire
Lo studente possiede una conoscenza approfondita delle tecniche per il trattamento automatico del linguaggio naturale. E' abile nella creazione, annotazione e sfruttamento di corpora elettronici
Contenuti
Introduzione
- Natural Language Processing - Problemi e prospettive
- Breve ripasso di Linguistica dei Corpora
- Modelli probabilistici del linguaggio
Trattamento automatico delle lingue
- Tecniche di machine learning.
- Metodologie per la valutazione dei prodotti della Linguistica Computazionale.
- I livelli di analisi linguistica da un punto di vista computazionale.
- Fonetica computazionale
- Caratteristiche del campione audio - foni e formanti - parametri significativi
- Analisi in frequenza – Spettrogrammi – Tratti soprasegmentali
- Applicazioni per l'elaborazione automatica della lingua parlata.
- Morfologia computazionale
- Generazione e analisi morfologica. Lemmari
- Metodologie basate su Automi a Stati Finiti (FSA).
- Sintassi computazionale
- Part-of-speech tagging
- Grammatiche per il linguaggio naturale
- Parsing del linguaggio naturale - metodologie e problematiche
- Approfondimento: Grammatiche formali per l'analisi della lingua
- Linguaggi formali e linguaggio naturale. Grammatiche context-free
- La complessità del linguaggio naturale
- Grammatiche a Dipendenze
- Treebank
- Semantica computazionale
- Semantica lessicale: WordNet, FrameNet...
- Word Sense Disambiguation
- Modelli lessico-semantici distribuzionali
- Cenni di semantica della frase
- Machine Translation
- Question answering
- Speaker diarisation/recognition
- Dialettometria e Stilometria
Testi/Bibliografia
Capitoli tratti dai seguenti volumi:
- Lenci, A., Montemagni, S. and Pirrelli, V. (2005). Testo e
computer. Carocci.
- D. Jurafsky and J.H. Martin (2008). Speech and Language
Processing, 2nd ed., Prentice Hall.
- A. Clark, C. Fox, S. Lappin (2010). The Handbook of Computational
Linguistics and Natural Language Processing, Blackwell Handbooks in
Linguistics.
Metodi didattici
Il corso di svolge in aula e laboratorio. Comprende circa 30 ore di
lezione e esercitazioni in laboratorio.
Modalità di verifica e valutazione dell'apprendimento
L'esame consiste in una prova orale.
E' obbligatorio iscriversi all'esame utilizzando la procedura online.
Strumenti a supporto della didattica
Il sito web del corso è stato progettato per essere il fulcro degli
strumenti didattici. Contiene la maggior parte dei materiali
didattici in formato elettronico, un'indicazione di tutte le
procedure e le modalità di erogazione del corso, nonché una ricca
raccolta di software del settore.
E' stato inoltre predisposto un CD-ROM a disposizione degli
studenti contenente un ambiente di lavoro completo per sperimentare
le metodologie proposte nel corso. Questo strumento verrà
utilizzato anche nelle esercitazioni in laboratorio.
Link ad altre eventuali informazioni
http://corpora.dslo.unibo.it/LingCompLM/
Orario di ricevimento
Consulta il sito web di Fabio Tamburini