- Docente: Luis Alberto Barron Cedeno
- Crediti formativi: 3
- SSD: L-LIN/02
- Lingua di insegnamento: Inglese
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Forli
-
Corso:
Laurea Magistrale in
Specialized translation (cod. 9174)
Valido anche per Laurea Magistrale in Specialized translation (cod. 9174)
-
dal 09/10/2024 al 11/12/2024
Conoscenze e abilità da conseguire
Lo/a studente/ssa conosce i principali formati per l'annotazione dei dati e le principali strategie per ottenere l'annotazione da parte di esperti e/o piattaforme di crowdsourcing; è in grado di definire un problema complesso in contesti di elaborazione del linguaggio naturale, di identificare i dati appropriati che devono essere raccolti per affrontarlo e di implementare soluzioni che vanno oltre i metodi supervisionati; ha anche familiarità con argomenti rilevanti nel campo dell’elaborazione del linguaggio naturale e dell'intelligenza artificiale in generale, inclusi gli aspetti etici e l'upscaling dei processi.
Contenuti
Creazione di dataset per NLP
Questo modulo intende di preparare lo studente ad affrontare il problema della produzione di un dataset (supervisionato) da zero, al fine di disporre di materiale per l'apprendimento di un modello.
I moduli sono.
- Definizione del problema, schema di annotazione e linee guida.
- Raccolta delle istanze (documenti, frasi, post sui social media).
- Annotazione da esperti.
- Annotazione tramite crowdsourcing (piattaforme, accordo tra annotatori, consolidamento).
- Aspetti etici dei compiti, dell'annotazione e del crowdsourcing.
- Prompting
* Post-editato dalla traduzione con www.DeepL.com/Translator
Modalità di verifica e valutazione dell'apprendimento
Modalità di valutazione
- 30-30L: Conoscenza approfondita dell'argomento, eccezionale capacità di applicare i concetti. La/o studente(ssa) esegue rigorosi esperimenti formali e produce una relazione eccezionale, di qualità paragonabile a una presentazione nell'ambito di una conferenza nazionale nel campo.
- 27-29: Conoscenza approfondita dell'argomento, solida capacità di applicare i concetti e buone capacità analitiche. La/o studente(ssa) esegue buoni esperimenti formali e produce una relazione di alta qualità.
- 24-26: Discreta conoscenza dell'argomento e ragionevole capacità di applicare correttamente i concetti. La/o studente(ssa) esegue alcuni esperimenti ragionevoli e produce una buona relazione.
- 21-23: Conoscenza adeguata, ma non approfondita, dell'argomento e parziale capacità di applicare i concetti. La/o studente(ssa) esegue esperimenti imprecisi e produce una relazione ragionevole.
- 18-20: Conoscenza appena adeguata e solo superficiale dell'argomento che denota scarsa coerenza nell'applicare i concetti. La/o studente(ssa) esegue esperimenti sbagliati e produce una relazione approssimativa.
- < 18 insufficiente: Conoscenza inadeguata dell'argomento, errori significativi nell'applicazione dei concetti. Sia gli esperimenti che la relazione sono di scarsa qualità.
Orario di ricevimento
Consulta il sito web di Luis Alberto Barron Cedeno