85302 - DATA SCIENCE

Anno Accademico 2024/2025

  • Docente: Domenico Di Sante
  • Crediti formativi: 6
  • SSD: FIS/07
  • Lingua di insegnamento: Italiano
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Bologna
  • Corso: Laurea in Scienza dei materiali (cod. 5940)

Conoscenze e abilità da conseguire

Al termine del corso lo studente possiede una conoscenza dei metodi fondamentali di analisi di dati complessi. Conosce gli algoritmi principali e più moderni per l'analisi dei dati e sa implementarli in un linguaggio di programmazione. L'attività laboratoriale permette allo studente di implementare ed eseguire analisi di dati al calcolatore ed applicare le metodologie studiate a casi prova.

Contenuti

Sillabo sintetico:

  • Parte I: Introduzione ai metodi fondamentali del calcolo scientifico (algebra lineare, ottimizzazione, equazioni differenziali, calcolo integrale)
  • Parte II: Statistica (distribuzioni di probabilita’, statistica bayesiana, modelli lineari)
  • Parte III: Machine Learning

 

Sillabo dettagliato:

Parte I: Introduzione ai metodi fondamentali del calcolo scientifico

1 – Introduzione: informazioni di carattere generale ed amministrativo.

2 – Algebra lineare:

  •  Spazi vettoriali, operazioni con matrici
  •  Problemi agli autovalori
  •  Decomposizione SVD
  •  Altri tipi di decomposizione (LU, QR, Cholesky)
  •  Sistemi di equazioni lineari

3 – Ottimizzazione:

  •  Derivate, gradienti, Jacobiano, Hessiano
  •  Diversi tipi di ottimizzazione (locale, globale, convessa, non-convessa)
  •  Metodi di ottimizzazione (first-order, second-order)
  •  Stochastic gradient descent SGD

4 – Equazioni differenziali:

  •  Equazioni differenziali ordinarie del primo ordine (metodi di Euler e Runge-Kutta)
  •  Sistemi di equazioni differenziali ordinarie
  •  Equazioni differenziali alle derivate parziali

5 – Calcolo integrale:

  •  Integrazione numerica (formule del punto medio, del trapezio e di Simpson)
  •  Formule di quadratura interpolatorie
  •  La Formula di Simpson adattiva

Parte II: Statistica

1 – Distribuzioni di probabilita’ ad una variabile:

  •  Modelli ad una variabile
  •  Variabili random
  •  Regola di Bayes
  •  Distribuzioni di Bernoulli e binomiale
  •  Distribuzione multinomiale
  •  Distribuzione gaussiana
  •  Altre distribuzioni (t-Student, Cauchy)

2 – Distribuzioni di probabilita’ a piu’ variabili:

  •  Covarianza e Correlazione
  •  Distribuzione Gaussiana a piu’ variabili

3 – Modelli lineari:

  •  Regressione binaria (logistica)
  •  Regressione lineare ai minimi quadrati
  •  Regolarizzazione (l1 e sparsita’)
  •  Splines
  •  Modelli lineari generalizzati

Parte III: Machine Learning

1 – Strutturare i dati senza reti neurali:

  •  Riduzione della dimensionalita’
  •  Principal component analysis (PCA)
  •  Kernel PCA
  •  Algoritmi di raggruppamento (k-means)

2 – Supervised Learning:

  •  Reti neurali
  •  Training e regolarizzazione
  •  Convolutional Neural Network (CNN)
  •  Recurrent Neural Network

3 – Unsupervised Learning:

  •  Maximum Likelihood Estimation (MLE)
  •  Restricted Boltzmann machine
  •  (Variational) Autoencoders (VAE)
  •  Generative adversarial networks (GANs)

Testi/Bibliografia

Letture Necessarie:

Appunti delle lezioni

Testi consigliati:

  1. Calcolo scientifico. Esercizi e problemi risolti con MATLAB e Octave, A. Quarteroni et al., Springer Verlag (2017)
  2. Data-driven modeling & scientific computation: methods for complex systems & big data, J. N. Kutz, Oxford University Press (2013)
  3. Probabilistic Machine Learning: An Introduction, K. P. Murphy, The MIT Press (2022)
  4. Lecture Notes: Machine Learning for the Sciences, T. Neupert et al., arXiv:2102.04883v2 (2022)
  5. Modern applications of machine learning in quantum sciences, A. Dawid et al., arXiv:2204.04198 (2022)

Metodi didattici

Lezioni frontali alla lavagna e frequentazione dei laboratori informatici.

In considerazione della tipologia di attività e dei metodi didattici adottati, la frequenza di questa attività formativa richiede la preventiva partecipazione di tutti gli studenti ai moduli 1 e 2 di formazione sulla sicurezza nei luoghi di studio, in modalità e-learning.

Modalità di verifica e valutazione dell'apprendimento

La valutazione finale consta di due contributi:

1) valutazione delle relazioni di laboratorio (30%)

2) esame orale sui contenuti del corso (70%)

Strumenti a supporto della didattica

Lavagna, Proiettore, Laboratorio informatico.

Orario di ricevimento

Consulta il sito web di Domenico Di Sante