- Docente: Assimo Maris
- Crediti formativi: 6
- SSD: CHIM/02
- Lingua di insegnamento: Italiano
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Ravenna
- Corso: Laurea Magistrale in Scienze e tecnologie per la sostenibilità ambientale (cod. 6055)
-
dal 18/10/2024 al 17/01/2025
Conoscenze e abilità da conseguire
Conoscere e sapere applicare principali metodi di analisi e di modellazione di dati monovariati, bivariati e multivariati.
Contenuti
Prerequisiti
Fondamenti di statistica e teoria delle probabilità.
Programma
Elementi di ingegneria dei dati
- big data
- raccolta di dati grezzi
- trasformazione dei dati
- condivisione di dati (database, data lake, data wharehouse)
Statistica descrittiva
- Rappresentazione dei dati in forma sintetica (tabelle, grafici)
- Ordinamento e distribuzione dei dati
- Matrici codevianza, covarianza e correlazione
- Riduzione della dimensionalità dei dati (decomposizione ai valori singolari, analisi delle componenti principali, analisi dei fattori)
- Riconoscimento di strutture di relazione implicite fra i dati
Metodi di apprendimento
- Apprendimento supervisionato parametrico: regressione lineare
- Apprendimento supervisionato non parametrico: classificazione
- Apprendimento non supervisionato non parametrico: clustering
- Apprendimento automatico (Machine Learning, ML)
- Reti neurali artificiali (Artificial Neural Networks, ANN)
- Algoritmi genetici (Genetic Algorithms, GA)
Elementi di statistica inferenziale
Fondamenti di programmazione in R
Indagine statistica anonima
Una volta raggiunto il limite dei 2/3 delle lezioni svolte verrà effettuata una rilevazione statistica per conoscere le opinioni degli studenti in merito al corso allo scopo di poterlo rendere più efficace. Siti di riferimento:
- https://opinionistudenti.unibo.it
- https://val.unibo.it/ (studente)
- https://val.unibo.it/demo.php (questionario)
- https://gestioneval.unibo.it (docente)
Calendario
- 18/10/2024 9:00-13:00
- 25/10/2024 9:00-13:00
- 08/11/2024 9:00-13:00
- 15/11/2024 9:00-13:00
- 22/11/2024 9:00-13:00
- 29/11/2024 9:00-13:00
- 06/12/2024 9:00-13:00
- 13/12/2024 9:00-13:00
- 20/12/2024 9:00-13:00
- 08/01/2025 9:00-13:00
- 10/01/2025 9:00-13:00
- 13/01/2025 9:00-13:00
- 15/01/2025 9:00-13:00
- 17/01/2025 9:00-13:00
Testi/Bibliografia
- Data Science e Machine Learning: dai Dati alla Conoscenza
Michele di Nuzzo - Data Science. Guida ai Principi e alle Tecniche Base della Scienza dei Dati
Sinan Ozdemir - Modern Statistics with R From Wrangling and Exploring Data to Inference and Predictive Modelling
Måns Thulin - Statistica per Data Science con R
Enrico Pegoraro - R for Data Science
Garrett Grolemund - Hadley Wickham - Metodi Statistici per la Sperimentazione Biologica
Alessandro Camussi, Frank Möller, Ercole Ottaviano, Mirella Sari Gorla
Zanichelli, II edizione, 1995
Metodi didattici
L’insegnamento si compone di 6 CFU suddivisi in due moduli:
- modulo di teoria, 4 CFU, 32 h
- modulo di laboratorio, 2 CFU, 24 h
La lezione tipicamente ha una durata di 4 ore e prevede una parte teorica seguita da esercizi numerici ed esercitazioni pratiche svolte utilizzando i computer degli studenti, in modo che da acquisire dimestichezza con alcuni dei metodi alla base della materia.
Il software utilizzato è R e ogni studente dovrà installare tale programma sul proprio computer prima dell'inizio delle lezioni.
Il programma è gratuito e disponibile per i principali sistemi operativi:
- Linux
- MacOS (installare anche XQuartz per attivare l'interfaccia grafica)
- Windows
Si richiede altresì di installare l'ultima versione di:
- Pandoc (pandoc-3.5-windows-x86_64.msi)
E' possibile installare a uso facoltativo:
In considerazione delle tipologie di attività e metodi didattici adottati, la frequenza di questa attività formativa richiede lo svolgimento dei moduli 1 e 2 in modalità e-learning:
Modalità di verifica e valutazione dell'apprendimento
La verifica dell'apprendimento è volta ad accertare l'acquisizione sia delle conoscenze teoriche che delle abilità pratiche attese.
Lo studente dovrà presentare un programma scritto in linguaggio R per l'analisi di un insieme di dati concordato con la docente, che fungerà da base per la discussione degli argomenti svolti a lezione.
Il voto finale esprime una valutazione sui contenuti espressi durante la prova finale.
Strumenti a supporto della didattica
Lezioni tenute alla lavagna e con supporto del video-proiettore.
Esercizi numerici.
Esercitazioni al computer (personale).
Il materiale didattico presentato a lezione verrà messo a disposizione dello studente in formato elettronico sul sito istituzionale del corso.
Coloro che necessitino di strumenti compensativi per ragioni dipendenti da disabilità, patologie o disturbi psicologici, o disturbi specifici dell’apprendimento (DSA) possono concordare l’adozione delle misure più opportune. rivolgendosi a:
Orario di ricevimento
Consulta il sito web di Assimo Maris
SDGs

L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.