- Docente: Marco Novelli
- Crediti formativi: 6
- SSD: SECS-S/01
- Lingua di insegnamento: Italiano
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Bologna
- Corso: Laurea Magistrale in Economia e diritto (cod. 5913)
-
dal 20/09/2024 al 25/10/2024
Conoscenze e abilità da conseguire
L'obiettivo del corso è quello di fornire competenze nell'uso degli strumenti e delle tecniche di analisi dei dati in ambito descrittivo e inferenziale. Al termine del corso lo studente è in grado di utilizzare i comandi di base di uno degli strumenti software per l'analisi dei dati di maggiore diffusione in ambito applicativo. Inoltre lo studente conosce e sa applicare in modo critico i principali strumenti di statistica descrittiva ed inferenziale in ambito univariato e per il confronto di due o più popolazioni. L'attività di laboratorio si pone l'obiettivo di favorire negli studenti autonomia rispetto all'elaborazione dei dati.
Contenuti
Questo non è un corso introduttivo di Statistica. Gli studenti senza le conoscenze di base richieste in statistica e probabilità sono tenuti a colmare le loro lacune prima di prepararsi per l'esame.
Conoscenze di base richieste in statistica
- Distribuzioni di frequenza empiriche.
- Misure di posizione (moda, mediana, media aritmetica).
- Misure di dispersione, correlazione lineare e regressione lineare semplice.
- Misure di associazione, dipendenza media, chi-quadrato, V di Cramer.
- Fondamenti di stima parametrica e test delle ipotesi.
- Tabelle statistiche per la distribuzione normale standard e la distribuzione t di Student.
Conoscenze di base richieste in probabilità
- Esperimenti casuali e spazi campionari. Eventi semplici, composti e disgiunti. Eventi impossibili e certi. Eventi ottenuti per intersezione, unione e negazione.
- Definizioni e assiomi di probabilità. Probabilità condizionale. Eventi indipendenti. La legge della probabilità totale. Teorema di Bayes.
- Variabili casuali. Regole per il calcolo delle probabilità per qualsiasi variabile casuale. La funzione di distribuzione di una variabile casuale. Funzione di massa di probabilità. Funzione di densità di probabilità.
- Teoremi limite e convergenza.
Contenuti del Corso
Introduzione all'ambiente statistico R e all'ambiente di sviluppo integrato Rstudio.
Aritmetica, matematica e logica con R. Le strutture dati in R.
Creazione e gestione di variabili e di data frame. Importazione di dati.
Strutture di controllo iterativo/cicli.
Strutture di controllo condizionale/istruzioni condizionali.
Scrittura di funzioni definite dall'utente.
Analisi descrittiva dei dati e rappresentazioni grafiche.
Inferenza statistica per la media di una popolazione normale e per una proporzione.
Confronto delle medie di due popolazioni.
Regressione lineare.
Testi/Bibliografia
I seguenti libri (in inglese) sono disponibili su internet gratuitamente.
Wickham, Hadley, and Grolemund, Garrett. R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. Stati Uniti, O'Reilly Media, 2016. https://r4ds.had.co.nz [https://r4ds.had.co.nz/]
Måns Thulin, Modern statistics with R, 2021. http://modernstatisticswithr.com/
Il seguente libro (in italiano) è invece disponibile in libreria:
Alan Agresti, Maria Kateri, Statistica per data scientists con R e Python, ed. EGEA, 2022.
https://www.egeaeditore.it/ita/prodotti/matematica-statistica-demografia/statistica-per-data-scientists.aspx
Metodi didattici
Lezioni frontali in aula.
Lo studente deve assicurarsi di venire a lezione con il proprio laptop ed il software già installato alla prima lezione. Installare il software è molto semplice. È sufficiente eseguire i seguenti due passi *nell'ordine*
1. Andare su https://www.cran.r-project.org/ e accedere al CRAN. Selezionare il link relativo al sistema operativo in uso, seguire le istruzioni relative. Se si possiede già una distribuzione di R sul computer, è bene eseguire un aggiornamento all'ultima versione.
2. Andare su https://www.rstudio.org/download/desktop scegliere la distribuzione FREE e selezionare la voce relativa al sistema operativo in uso. Seguire le istruzioni per installare RStudio.
In considerazione della tipologia di attività e dei metodi didattici adottati, la frequenza di questa attività formativa richiede la preventiva partecipazione di tutti gli studenti ai Moduli 1 e 2 di formazione sulla sicurezza nei luoghi di studio Modulo I e II, in modalità e-learning.Modalità di verifica e valutazione dell'apprendimento
L'esame consisterà in una prova pratica di analisi dei dati in laboratorio informatico strutturata in 2/3 esercizi. La durata della prova è di 60 minuti.
Criteri di valutazioneinsufficiente: <18; sufficiente: 18-23; buono: 24-27; ottimo: 28-30; eccellente: 30 e lode
Strumenti a supporto della didattica
- materiale didattico fornito dal docente sarà reso disponibile su Virtuale virtuale.unibo.it [https://virtuale.unibo.it/]
- software statistico R www.r-project.org [https://www.r-project.org/]
- ambiente di sviluppo integrato RStudio www.rstudio.com [https://www.rstudio.com/]
Gli studenti con disabilità o disturbi specifici dell'apprendimento (DSA) sono pregati di informare il docente della propria condizione al fine di individuare l’adozione degli accorgimenti più opportuni alle loro esigenze.
Orario di ricevimento
Consulta il sito web di Marco Novelli