- Docente: Assimo Maris
- Crediti formativi: 6
- SSD: CHIM/02
- Lingua di insegnamento: Italiano
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Ravenna
- Corso: Laurea Magistrale in Analisi e gestione dell'ambiente (cod. 5900)
-
dal 27/10/2023 al 02/02/2024
Conoscenze e abilità da conseguire
Conoscere e sapere applicare principali metodi di analisi e di modellazione di dati monovariati, bivariati e multivariati.
Contenuti
Prerequisiti
Fondamenti di statistica e teoria delle probabilità.
Programma
Elementi di ingegneria dei dati
- big data
- raccolta di dati grezzi
- trasformazione dei dati
- condivisione di dati (database, data lake, data wharehouse)
Statistica descrittiva
- Rappresentazione dei dati in forma sintetica (tabelle, grafici)
- Ordinamento e distribuzione dei dati
- Matrici codevianza, covarianza e correlazione
- Riduzione della dimensionalità dei dati (decomposizione ai valori singolari, analisi delle componenti principali, analisi dei fattori)
- Riconoscimento di strutture di relazione implicite fra i dati
Metodi di apprendimento
- Apprendimento supervisionato parametrico: regressione lineare
- Apprendimento supervisionato non parametrico: classificazione
- Apprendimento non supervisionato non parametrico: clustering
- Apprendimento automatico (Machine Learning, ML)
- Reti neurali artificiali (Artificial Neural Networks, ANN)
- Algoritmi genetici (Genetic Algorithms, GA)
Elementi di statistica inferenziale
Fondamenti di programmazione in R
Indagine statistica anonima
Una volta raggiunto il limite dei 2/3 delle lezioni svolte verrà effettuata una rilevazione statistica per conoscere le opinioni degli studenti in merito al corso allo scopo di poterlo rendere più efficace. Siti di riferimento:
- https://opinionistudenti.unibo.it
- https://val.unibo.it/ (studente)
- https://val.unibo.it/demo.php (questionario)
- https://gestioneval.unibo.it (docente)
Calendario
- 27/10/2023 TH datascience.pdf LAB calcolatrice.r
- 03/11/2023 TH statistica.pdf LAB plotter.r
- 10/11/2023 TH descrittori.pdf LAB variabili.r, io.r, cicli.r
- 17/11/2023 TH descrittori.pdf LAB tss.r
- 24/11/2023 LAB vettorinum.r, vettoricat.r
- 01/12/2023 TH descrittori.pdf LAB matrici.r iris.r janitor.r
- 15/12/2023 TH regressione.pdf LAB janitor.r +pratica
- 08/01/2024 Prova parziale intermedia (2h)
- 08/01/2024 TH regressione.pdf (2h)
- 12/01/2024 TH regressione.pdf LAB lm.r
- 15/01/2024 TH EA.pdf LAB lm_ols_chlorella.r
- 19/01/2024 TH PCA.pdf LAB lm_ga_chlorella.r
- 22/01/2024 LAB pca_chlorella.r (2h)
- 26/01/2024 TH PCA.pdf
- 29/01/2024 TH classificazione (2h)
- 02/02/2024 TH clustering/reti neurali + Rilevazione statistica
- 06/02/2024 Prova parziale finale, h 11 Aula Master
Testi/Bibliografia
- Data Science e Machine Learning: dai Dati alla Conoscenza
Michele di Nuzzo - Data Science. Guida ai Principi e alle Tecniche Base della Scienza dei Dati
Sinan Ozdemir - Statistica per Data Science con R
Enrico Pegoraro - R for Data Science
Garrett Grolemund - Hadley Wickham - Metodi Statistici per la Sperimentazione Biologica
Alessandro Camussi, Frank Möller, Ercole Ottaviano, Mirella Sari Gorla
Zanichelli, II edizione, 1995
Metodi didattici
L’insegnamento si compone di 6 CFU suddivisi in due moduli:
- modulo di teoria, 4 CFU, 32 h
- modulo di laboratorio, 2 CFU, 24 h
La lezione tipicamente ha una durata di 4 ore e prevede una parte teorica seguita da esercizi numerici ed esercitazioni pratiche svolte utilizzando i computer degli studenti, in modo che da acquisire dimestichezza con alcuni dei metodi alla base della materia.
Il software utilizzato è R e ogni studente dovrà installare tale programma sul proprio computer prima dell'inizio delle lezioni.
Il programma è gratuito e disponibile per i principali sistemi operativi:
- Linux
- MacOS (installare anche XQuartz per attivare l'interfaccia grafica)
- Windows
Si richiede altresì di installare l'ultima versione di:
E' possibile installare a uso facoltativo:
In considerazione delle tipologie di attività e metodi didattici adottati, la frequenza di questa attività formativa richiede lo svolgimento dei moduli 1 e 2 in modalità e-learning:
Modalità di verifica e valutazione dell'apprendimento
La verifica dell'apprendimento è volta ad accertare l'acquisizione sia delle conoscenze teoriche che delle abilità pratiche attese.
Durante il corso si prevedono 2 prove parziali:
- prova intermedia a metà corso
- scritto: domande di teoria ed esercizi numerici
- pratico: programmazione in R con accesso alle risorse online - prova finale al termine del corso
- scritto: domande di teoria
- pratico: programmazione in R con accesso alle risorse online
Il voto finale è dato dalla media dei voti delle 2 prove.
Nelle sessioni di esame ordinarie la verifica dell'apprendimento avviene attraverso un singolo esame, che accerta l'acquisizione delle conoscenze e delle abilità attese tramite lo svolgimento di una prova orale affiancata da una prova pratica di programmazione in R.
Il voto finale esprime una valutazione sui contenuti espressi durante la prova finale.
Strumenti a supporto della didattica
Lezioni tenute alla lavagna e con supporto del video-proiettore.
Esercizi numerici.
Esercitazioni al computer (personale).
Il materiale didattico presentato a lezione verrà messo a disposizione dello studente in formato elettronico sul sito istituzionale del corso:
Coloro che necessitino di strumenti compensativi per ragioni dipendenti da disabilità, patologie o disturbi psicologici, o disturbi specifici dell’apprendimento (DSA) possono concordare l’adozione delle misure più opportune. rivolgendosi a:
Orario di ricevimento
Consulta il sito web di Assimo Maris
SDGs

L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.