B3095 - LABORATORIO DI BIG DATA, DATA MINING E DATA ANALYTICS - CE

Anno Accademico 2024/2025

  • Docente: Marco Calbucci
  • Crediti formativi: 6
  • Lingua di insegnamento: Italiano
  • Moduli: Marco Calbucci (Modulo 1) Stefano Castagnoli (Modulo 2)
  • Modalità didattica: Convenzionale - Lezioni in presenza (Modulo 1) Convenzionale - Lezioni in presenza (Modulo 2)
  • Campus: Cesena
  • Corso: Laurea in Tecnologie dei sistemi informatici (cod. 6007)

Conoscenze e abilità da conseguire

Al termine del corso, lo studente possiede competenze avanzate e capacità pratiche legate alle basi di dati relazionali e non relazionali, nonché la capacità di realizzare applicazioni centrate sull'utilizzo di DBMS. Conosce gli ambiti applicativi in cui utilizzare le tecnologie dei Big Data e le relative problematiche; Conosce le architetture hardware e software proposte per la loro gestione; Conosce le tecniche per la memorizzazione, utilizza i linguaggi e i paradigmi di programmazione adottati in questo tipo di sistemi; Conosce le metodologie di progettazione per le diverse tipologie di applicazioni in ambito Big Data. Possiede competenze pratiche nell'utilizzo delle diverse. Conosce le principali tecniche di data mining e text mining; Conosce le metodologie di gestione e sviluppo di progetto; Sviluppa competenze pratiche nella generazione, nell'analisi e interpretazione dei risultati mediante esercitazioni pratiche svolte con tool commerciali e/o open source.

Contenuti

  • Introduzione a python e alle librerie numpy e pandas.
  • Nozioni di statistica ed esercitazioni con la libreria statsmodels
  • Visualizzazione dati con matplotlib e seaborn.
  • Processi di raccolta e pulizia dati.
  • Modelli di analisi predittiva (regressioni, classificazioni) con scikit-learn.
  • Embeddings e database vettoriali

Testi/Bibliografia

Foster Provost, Tom Fawcett

Data science for business, O'Reilly (2013)

 

John V. Guttag,

Introduction to computation and programming using Python, The MIT Press (2016)

 

Cole Nussbaumer Knaflic,

Storytelling with data, Wiley (2015)

Metodi didattici

Lezione frontale con diapositive Power Point

Esercitazioni in laboratorio

In considerazione della tipologia di attività e dei metodi didattici adottati, la frequenza di questa attività formativa richiede la preventiva partecipazione di tutti gli studenti ai Moduli 1 e 2 di formazione sulla sicurezza nei luoghi di studio, in modalità e-learning https://corsi.unibo.it/laurea/TecnologieSistemiInformatici/formazione-obbligatoria-su-sicurezza-e-salute.

Modalità di verifica e valutazione dell'apprendimento

Esercitazioni in laboratorio

Progetto di analisi dati con Pandas

Prova orale: discussione del progetto e domande sugli argomenti trattati

Strumenti a supporto della didattica

Diapositive Power Point

Ambiente di sviluppo Anaconda, editor Visual Studio Code

Orario di ricevimento

Consulta il sito web di Marco Calbucci

Consulta il sito web di Stefano Castagnoli