- Docente: Ignazio Drudi
- Crediti formativi: 8
- SSD: SECS-S/03
- Lingua di insegnamento: Italiano
- Moduli: Ignazio Drudi (Modulo 1) Fabrizio Alboni (Modulo 2)
- Modalità didattica: Convenzionale - Lezioni in presenza (Modulo 1) Convenzionale - Lezioni in presenza (Modulo 2)
- Campus: Bologna
- Corso: Laurea in Scienze statistiche (cod. 8873)
Conoscenze e abilità da conseguire
Il corso si propone di introdurre alla complessità della moderna organizzazione dei dati statistici, in particolare di quelli disponibili in Internet, sia in forma strutturata che destrutturata. Lobiettivo principale del corso consiste nella formazione di competenze statistiche in grado di coniugare i fondamenti irrinunciabili della misura e della metodologia statistica nel passaggio che porta alle sogle della analisi statistica dei fenomeni, che consiste nella valutazione, selezione e sintesi dei giacimenti di dati oggi disponibili con relativa facilità. Più in dettaglio, alla fine del corso lo studente avrà le competenze per: 1. Orientarsi, mediante ricerche finalizzate, nelle principali molteplici e disomogenee fonti di dati oggi disponibili. Sia per quanto riguarda le fonti ufficiali (Istat, Eurostat, OCSE, Banca Mondiale, ); sia per quanto attiene alle fonti non convenzionali (le statistiche di Google, FaceBook, Twitter, E-bay, trip-advisor, .) 2. Avere una conoscenza di base del principale linguaggio di interrogazione delle grandi banche dati cioè della logica e della sintassi del linguaggio SQL, con particolare attenzione alla capacità di affrontare i problemi connessi alla integrazione dei dati, con riferimento specifico ai problemi del matching, sia esatto che statistico mediante lutilizzo del linguaggio SQL 3. Definire un efficace strategia di estrazione e sintesi di dati da grandi banche dati (i cosiddetti Big-data), mediante lutilizzo delle più appropriate tecniche statistiche finalizzate a definire le basi di dati più appropriate per lanalisi statistica dei fenomeni.
Contenuti
PRIMA PARTE
- Definizione concettuale ed operativa di data- base statistico, differenze ed analogie con il concetto di data-base informatico
- Introduzione al linguaggio SQL con particolare attenzione alla valenza statistica delle query di interrogazione
- Il matching dei deterministico e stocastico dei dati. Tecniche di abbinamento per punteggi, per post-stratificazione, mediante regole esterne
- Introduzione ai criteri di ricerca delle banche dati strutturate disponibili on-line. Esercitazioni ed esempi di consultazione ed abbinamento di banche dati
SECONDA PARTE
- La disponibilità on line di informazioni non strutturate: statistiche disponibili su Google, e sui principali social network
- La valenza statistica delle informazioni non strutturate, considerazione sulla qualità dei dati, sui metodi di pretrattamento, sulle tecniche statistiche utilizzabili
- Introduzione ai data base non-relazionale, limiti e vantaggi. La famiglia di software NOSQL primi esempi di utilizzazione.
- Software per il data capturing dei dati online e la visualizzazione di informazioni complesse.
Testi/Bibliografia
Data la velocità di cambiamento del materiale disponibile on-line, bibliografia e sitografia saranno indicati durante il corso.
Metodi didattici
- Lezioni frontali
- Esercitazioni guidate di laboratorio
- 2 Studi caso assegnati a gruppi di studenti sulla prima e seconda parte del programma
- Gli studi di caso formeranno parte della valutazione finale
Modalità di verifica e valutazione dell'apprendimento
La prova d'esame mira a verificare il raggiungimento dei seguenti obiettivi didattici:
- conoscenza dei fondamenti logici e concettuali dei data-base statistici
- capacità di formulare query di contenuto statistico in linguaggio SQL
- capacità di individuare fonti e di trattare dati strutturati e no-strutturati
- capacità di stendere report scritti sulle fonti di informazione, sulle elaborazioni effettuati e sui risultati ottenuti
La valutazione e quindi la prova d'esame è articolata in:
- 2 relazioni di studio di caso (secondo le modalità indicate nel punto "Metodi")
- 1 prova scritta con domande a risposta multipla
Relazioni
- Le relazioni verranno svolte individualmente o in gruppo in forma scritta su un tema concordato col docente. l'assegnazione dei temi avverrà 15 giorni prima della fine del primo ciclo di lezioni (per la prima relazione) e 15 giorni prima della fine del secondo ciclo (seconda relazione)
- Le relazioni dovranno essere inviate per mail al docente e verranno valutate entro 10 giorni dalla data di ricevimento. La valutazione sarà espressa in trentesimi e comunicata via mail. Le valutazioni delle 2 relazioni concorreranno alla formulazione del punteggio finale per il 70% (35%+35%)
Prova scritta
- La prova scritta verterà su tutti gli argomenti affrontati nel corso, in particolare sui principi di organizzazione di un data-base, la capacità di individuare problemi nella qualità dei dati, la capacità di individuare le tecniche di trattamento più appropriate. Tale prova sarà costituita da 10 domande con 4 possibili risposte e verrà valutata in trentesimi attribuendo 3 punti a ciascuna risposta esatta) , concorrendo alla formulazione del punteggio finale per il 30%
- Sul sito del docente (www2.stat.unibo.it/drudi/) saranno disponibili testi di prova che consentono l'inserimento delle risposte e la correzione automatica e immediata.
Calendario di massima
- La prova scritta verrà effettuata alla fine del corso, mentre le 2 relazioni dovranno essere consegnate almeno 10 giorni prima della data di sostenimento della prova scritta. Orientativamente la prima relazione potrebbe essere predisposta dopo la fine del primo ciclo di lezioni.
- La verbalizzazione della valutazione conseguita avviene nelle date indicata in Almaesami. Di norma sono previsti 3 appelli nella sessione estiva, 1 in quella autunnale e 3 nella sessione straordinaria invernale
- E' possibile prendere visione del compito e chiedere chiarimenti in occasione della data di verbalizzazione immediatamente successiva all'appello in cui si è sostenuto l'esame.
- La verbalizzazione può avvenire in assenza dello studente.
- Gli studenti laureandi che superano l'esame e necessitano di verbalizzare il voto in anticipo rispetto alla data prevista, sono invitati a comunicarlo al docente mediante un messaggio di posta elettronica da inviare subito dopo aver sostenuto la prova.
Le date d'esame saranno pubblicate su almaesami.unibo.it [http://www.almaesami.unibo.it/]
Strumenti a supporto della didattica
- PC con videoproiettore e accesso a Internet
- Laboratorio atrezzato
Nel sito docente saranno disponibili:
- File di slides scaricabili e consultabili on-line
- Materiale didattico scaricabile e consultabile on-line
- Link a banche dati statistiche
- Esercizi interattivi disponibili on-line con correzione interattiva immediata
Orario di ricevimento
Consulta il sito web di Ignazio Drudi
Consulta il sito web di Fabrizio Alboni