- Docente: Fabio Tamburini
- Crediti formativi: 6
- SSD: L-LIN/01
- Lingua di insegnamento: Italiano
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Bologna
-
Corso:
Laurea Magistrale in
Italianistica, culture letterarie europee, scienze linguistiche (cod. 9220)
Valido anche per Laurea Magistrale in Dati, metodi e modelli per le scienze linguistiche (cod. 5946)
Laurea Magistrale in Dati, metodi e modelli per le scienze linguistiche (cod. 5946)
Laurea Magistrale in Italianistica e culture letterarie europee (cod. 6051)
Laurea Magistrale in Language, Society and Communication (cod. 8874)
Laurea Magistrale in Semiotica (cod. 8886)
-
dal 10/02/2025 al 21/03/2025
Conoscenze e abilità da conseguire
Il corso fornisce un'introduzione generale al Trattamento autormatico delle lingue (Natural Language Processing), con particolare attenzione alle metodologie statistico/algoritmiche alla base di questo tipo di analisi. Si studieranno e, laddove possibile, applicheranno metodi e strumenti del Natural Language Processing ai vari livelli di analisi linguistica.
Contenuti
Il programma d'esame si compone in modo incrementale a seconda dei CFU:
-------------------------------------------------
PROGRAMMA PER 6 CFU
-------------------------------------------------
Introduzione
- Natural Language Processing - Problemi e prospettive
- Breve ripasso di Linguistica dei Corpora
- Modelli probabilistici, n-grammi
Trattamento automatico delle lingue
- Tecniche di machine learning.
- Metodologie per la valutazione dei prodotti della Linguistica Computazionale.
- Tokenizzazione e sentence splitting
- I livelli di analisi linguistica da un punto di vista computazionale.
- FONETICA COMPUTAZIONALE
- Caratteristiche del campione audio - foni e formanti - parametri significativi
- Analisi in frequenza – Spettrogrammi – Tratti soprasegmentali
- Applicazioni per l'elaborazione automatica della lingua parlata.
- MORFOLOGIA COMPUTAZIONALE
- Generazione e analisi morfologica. Lemmari
- Metodologie basate su Automi a Stati Finiti (FSA).
- SINTASSI COMPUTAZIONALE
- Part-of-speech tagging
- Grammatiche per il linguaggio naturale
- Parsing del linguaggio naturale - metodologie e problematiche
- Approfondimento: Grammatiche formali per l'analisi della lingua
- Linguaggi formali e linguaggio naturale. Grammatiche context-free
- La complessità del linguaggio naturale
- Grammatiche a Dipendenze
- Treebank
- SEMANTICA COMPUTAZIONALE
- Semantica lessicale: WordNet, FrameNet...
- Word Sense Disambiguation
- Modelli lessico-semantici distribuzionali
- Word/Sentence Embeddings
- FONETICA COMPUTAZIONALE
-------------------------------------------------------------
PROGRAMMA AGGIUNTIVO PER 9 CFU
-------------------------------------------------------------
- Solving downstream tasks with Large Language Models
- Prompting Pre-Trained Language Models
- Identificazione Automatica della Prominenza Prosodica
- Cenni di Stilometria e Dialettometria.
------------------------------------------------------------
PROGRAMMA AGGIUNTIVO PER 12 CFU
------------------------------------------------------------
Analisi statistica dei dati linguistici.
- Importanza dell'analisi quantitativa dei dati linguistici.
- Nozioni fondamentali sull'uso del pacchetto statistico R.
- Statistica descrittiva.
- Statistica analitica/inferenziale.
Studenti/sse con DSA o disabilità temporanee o permanenti: si suggerisce di mettersi subito in contatto con l’ufficio di Ateneo responsabile (https://site.unibo.it/studenti-con-disabilita-e-dsa/it) e con il/la docente, per cercare insieme le strategie più efficaci nel seguire le lezioni e/o nel preparare l’esame.
Testi/Bibliografia
Capitoli tratti dai seguenti volumi:
- Tamburini F. (2022). Neural Models for the Automatic Processing of Italian, Bologna: Pàtron.
- D. Jurafsky and J.H. Martin (in press). Speech and Language Processing, Prentice Hall. (3rd Edition DRAFT).
- James Briggs (2022). Natural Language Processing for Semantic Search.
- Gries S. (2008). Statistics for Linguistics with R. Mouton de Gruyter.
Slide, dispense e articoli scaricabili direttamente dal sito web del corso https://corpora.ficlit.unibo.it/TAL/ .
Il programma per NON frequentanti non cambia. Si raccomanda tuttavia agli studenti NON frequentanti di contattare il docente, in orario di ricevimento, prima di iniziare lo studio in modo da ricevere tutte le spiegazioni riguardanti i materiali da studiare per l'esame ed evitare così ogni fraintendimento o problema.
Metodi didattici
Il corso di svolge in aula e laboratorio. Comprende 30/45/60 ore di lezione e esercitazioni in laboratorio a seconda dei crediti.
Modalità di verifica e valutazione dell'apprendimento
L'esame consiste in un colloquio orale sul programma d'esame atto a valutare le capacità critiche e le conoscenze metodologiche maturate dallo studente.
Il raggiungimento da parte dello studente di una visione organica dei temi affrontati a lezione, la dimostrazione del possesso di una padronanza espressiva e di linguaggio specifico saranno valutati con voti di eccellenza. La conoscenza per lo più meccanica e/o mnemonica della materia, capacità di sintesi e di analisi non articolate e/o un linguaggio corretto ma non sempre appropriato porteranno a valutazioni discrete; lacune formative e/o linguaggio inappropriato – seppur in un contesto di conoscenze minimali del materiale d'esame - condurranno a voti che non supereranno la sufficienza. Lacune formative, linguaggio inappropriato, mancanza di orientamento all'interno degli argomenti discussi durante il corso non potranno che essere valutati negativamente.
E' obbligatorio iscriversi all'esame utilizzando la procedura online [https://almaesami.unibo.it/almaesami/welcome.htm] .
Studenti/sse con DSA o disabilità temporanee o permanenti: si raccomanda di contattare per tempo l’ufficio di Ateneo responsabile (https://site.unibo.it/studenti-con-disabilita-e-dsa/it): sarà sua cura proporre agli/lle studenti/sse interessati/e eventuali adattamenti, che dovranno comunque essere sottoposti, con un anticipo di 15 giorni, all’approvazione del/la docente, che ne valuterà l'opportunità anche in relazione agli obiettivi formativi dell'insegnamento.
Strumenti a supporto della didattica
Il sito web del corso è stato progettato per essere il fulcro degli strumenti didattici. Contiene la maggior parte dei materiali didattici in formato elettronico, un'indicazione di tutte le procedure e le modalità di erogazione del corso, nonché una ricca raccolta di software del settore.
Link ad altre eventuali informazioni
https://corpora.ficlit.unibo.it/TAL
Orario di ricevimento
Consulta il sito web di Fabio Tamburini
SDGs


L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.