29853 - LINGUISTICA COMPUTAZIONALE (LM)

Anno Accademico 2008/2009

  • Docente: Fabio Tamburini
  • Crediti formativi: 9
  • SSD: L-LIN/01
  • Lingua di insegnamento: Italiano
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Bologna
  • Corso: Laurea Magistrale in Lingua, societa' e comunicazione (cod. 0982)

Conoscenze e abilità da conseguire

Lo studente possiede una conoscenza approfondita delle tecniche per il trattamento automatico del linguaggio naturale. E' abile nella creazione, annotazione e sfruttamento di corpora elettronici

Contenuti

  • Parte I: Tecniche avanzate per la gestione e l'analisi di corpora
    • Metodi statistici per l'analisi testuale
    • Espressioni regolari
    • Metodologie di annotazione dei testi
      • XML e TEI
  • Parte II: La costruzione e la valutazione di applicazioni
    • Tecniche di Machine Learning
    • Metodologie per la valutazione dei prodotti della Linguistica Computazionale
    • Cenni di Stilometria e Dialettometria
  • Parte III: Grammatiche formali per l'analisi della lingua
    • Linguaggi formali e linguaggio naturale
    • Grammatiche context-free
    • Grammatiche categoriali
    • Rappresentazione del significato
    • Categorial Type Logic

Testi/Bibliografia

- Lenci, A., Montemagni, S. and Pirrelli, V. (2005). Testo e computer. Carocci.
- Ritchie C. and Mellish C. (2000). Techniques in Natural Language Processing.
- Oakes M.P. (1998). Statistics for Corpus Linguistics. Edimburgh Textbooks in Empirical Linguistics.
- Mitkow R. (ed.) (2003). The Oxford Handbook of Computational Linguistics.
- D. Jurafsky and J.H. Martin (in press). Speech and Language Processing, 2nd ed., Prentice Hall.

Per gli studenti che non hanno MAI seguito un corso di Linguistica Informatica o Linguistica Computazionale durante la Laurea Triennale consiglio di leggere PRELIMINARMENTE:

  • Lenci A., Montemagni S. and Pirrelli V. (2005). Testo e computer. Carocci. [Cap. 1, 7, Par. 8, 8.1, 8.2, 8.3]
  • Chiari I. (2007). Introduzione alla linguistica computazionale. Laterza. [Cap 1, 2]

Metodi didattici

Il corso di svolge in aula e laboratorio. Comprende circa 30 ore di lezione e esercitazioni in laboratorio.

Modalità di verifica e valutazione dell'apprendimento

L'esame consiste in una prova orale.

Strumenti a supporto della didattica

Il sito web del corso è stato progettato per essere il fulcro degli strumenti didattici. Contiene la maggior parte dei materiali didattici in formato elettronico, un'indicazione di tutte le procedure e le modalità di erogazione del corso, nonché una ricca raccolta di software del settore.

E' stato inoltre predisposto un CD-ROM a disposizione degli studenti contenente un ambiente di lavoro completo per sperimentare le metodologie proposte nel corso. Questo strumento verrà utilizzato anche nelle esercitazioni in laboratorio.

Link ad altre eventuali informazioni

http://corpora.dslo.unibo.it/LingCompLM_LET/

Orario di ricevimento

Consulta il sito web di Fabio Tamburini