- Docente: Fabio Tamburini
- Crediti formativi: 9
- SSD: L-LIN/01
- Lingua di insegnamento: Italiano
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Bologna
-
Corso:
Laurea in
Lingue e letterature straniere (cod. 0979)
Valido anche per Laurea in Lettere (cod. 8850)
Laurea in Scienze della comunicazione (cod. 8885)
Conoscenze e abilità da conseguire
Al termine del corso lo studente apprende un quadro d'insieme della linguistica applicata (principali caratteristiche e problematiche) e dei suoi rapporti con la linguistica generale. Inoltre, acquisisce le tecniche di base della linguistica dei corpora (trattamento dei testi elettronici, costruzione di corpora, ricerca basata su dati reali duso, tokenizzazione, lemmatizzazione, concordanze). Apprende le basi dell'analisi statistico-quantitativa del linguaggio naturale (liste di frequenza, clusters, collocazioni) e sa usare grandi corpora elettronici attraverso interfacce web dedicate.
Contenuti
LINGUISTICA APPLICATA - 6 CFU:
- I CORPORA
- Cos'è un corpus, come si usa e che tipo di informazioni si possono ricavare.
- Parametri per la progettazione di un corpus.
- Rappresentatività e bilanciamento.
- Analisi sintagmatica e paradigmatica.
- Concordanze, collocazioni e indici di significatività.
- Annotazioni, tipologie e formati.
- I testi in formato elettronico, codifiche, mark-up e conversione di formati.
- Modalità di reperimento .
- Metodi di accesso al corpus e text retrieval.
- Case study: i corpora CORIS/CODIS, BoLC e DiaCORIS
- Web as corpus.
- Consultazione di un corpus annotato in
laboratorio.
- DIDATTICA DELLE LINGUE IN AMBIENTI TECNOLOGICAMENTE AVANZATI
LINGUISTICA APPLICATA - 12 CFU:
Al programma da 6CFU si aggiungono i seguenti argomenti:
- PROGETTAZIONE E COSTRUZIONE DI UN CORPUS ANNOTATO IN LABORATORIO
- TRATTAMENTO AUTOMATICO DELLE LINGUE
- Fonetica computazionale: Caratteristiche del campione audio - foni e formanti - Analisi in frequenza - Tratti soprasegmentali.
- Morfologia computazionale: Generazione e analisi morfologica - Lemmari.
- Sintassi computazionale: Part-of-speech tagging - Analisi sintattica della frase - Grammatiche per il linguaggio natural
- Semantica computazionale: Semantica lessicale – WordNet.
- Laboratorio di Linguistica Computazionale
- Laboratorio di Machine Learning
Testi/Bibliografia
Studenti FREQUENTANTI
Capitoli tratti dai seguenti volumi, indicati esplicitamente sul sito web del corso:
- Lenci, A., Montemagni, S. and Pirrelli, V. (2005). Testo e
computer, Carocci.
- McEnery T., Wilson A. (2001). Corpus Linguistics,
Edinburgh University Press.
Slide, dispense e articoli scaricabili direttamente dal sito web
del corso.
Studenti NON FREQUENTANTI
In aggiunta alla bibliografia indicata per gli studenti frequentanti, studiare anche:
- Cresti E., Panunzi, A. (2013). Introduzione ai corpora dell'italiano, Il Mulino.
In ogni caso, si raccomanda di contattare il docente, in orario di ricevimento, prima di iniziare lo studio in modo da ricevere tutte le spiegazioni riguardanti i materiali da studiare per l'esame ed evitare così ogni fraintendimento o problema.
Metodi didattici
Il corso di svolge in aula e comprende circa 60 ore di lezioni frontali (12CFU) o 30 ore di lezione (6CFU). All'interno delle 60 ore del corso da 12 CFU è prevista un'attività da svolgersi in laboratorio sotto la supervisione del docente.
Modalità di verifica e valutazione dell'apprendimento
L'esame consiste in un colloquio orale sul programma d'esame atto a
valutare le capacità critiche e le conoscenze metodologiche
maturate dallo studente.
Il raggiungimento da parte dello studente di una visione organica
dei temi affrontati a lezione, la dimostrazione del possesso di una
padronanza espressiva e di linguaggio specifico saranno valutati
con voti di eccellenza. La conoscenza per lo più meccanica e/o
mnemonica della materia, capacità di sintesi e di analisi non
articolate e/o un linguaggio corretto ma non sempre appropriato
porteranno a valutazioni discrete; lacune formative e/o linguaggio
inappropriato – seppur in un contesto di conoscenze minimali del
materiale d'esame - condurranno a voti che non supereranno la
sufficienza. Lacune formative, linguaggio inappropriato, mancanza
di orientamento all'interno degli argomenti discussi durante il
corso non potranno che essere valutati negativamente.
E' SEMPRE obbligatorio iscriversi all'esame utilizzando la
procedura online.
Strumenti a supporto della didattica
Il sito web del corso è stato progettato per essere il fulcro degli strumenti didattici. Contiene la maggior parte dei materiali didattici in formato elettronico, un'indicazione di tutte le procedure e le modalità di erogazione del corso, nonché una ricca raccolta di software del settore.
E' stato inoltre predisposto un CD-ROM/USB a disposizione degli studenti contenente un ambiente di lavoro completo per sperimentare le metodologie proposte nel corso. Questo strumento verrà utilizzato anche nelle esercitazioni in laboratorio.
Link ad altre eventuali informazioni
http://corpora.ficlit.unibo.it/LingAppl/
Orario di ricevimento
Consulta il sito web di Fabio Tamburini
SDGs


L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.