B5557 - DATA SCIENCE FOR SOCIAL SCIENCES AND POPULATION ANALYTICS

Anno Accademico 2024/2025

  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Rimini
  • Corso: Laurea Magistrale in Scienze statistiche, finanziarie e attuariali (cod. 8877)

Conoscenze e abilità da conseguire

Gli studenti acquisiranno competenze specialistiche per impiegare la scienza dei dati in ambiti come le scienze sociali e l'analisi demografica. Gli obiettivi formativi includono la comprensione dei fondamenti della scienza dei dati, l'uso di un linguaggio di programmazione per analizzare dati demografici e sociali, la conoscenza dei principi dell’open science. Gli studenti saranno in grado di implementare progetti di ricerca, e comunicare i risultati in modo efficace.

Contenuti

Descrizione del Corso: Questo corso si concentra sull'applicazione delle tecniche di data science per analizzare i dati delle scienze sociali e della popolazione. Utilizzando dati reali di censimento e la programmazione in R, con cenni all'utilizzo di Python, gli studenti impareranno a gestire, analizzare e interpretare grandi dataset per derivare informazioni e conoscenze significative nell'ambito delle scienze sociali.

Obiettivi di Apprendimento: Al termine del corso, gli studenti saranno in grado di:

  1. Comprendere e applicare le tecniche fondamentali di data science nel contesto delle scienze sociali.
  2. Processare e analizzare dati reali di censimento utilizzando R, con cenni a Python.
  3. Visualizzare i dati in modo efficace per comunicare i risultati.
  4. Sviluppare capacità di pensiero critico per valutare e interpretare i risultati dell'analisi dei dati.
  5. Applicare le conoscenze a problemi reali nelle scienze sociali e nell'analisi della popolazione.
  6. Utilizzare l'intelligenza artificiale generativa come supporto alla programmazione per la scienza dei dati.

Contenuti del Corso:

  1. Introduzione alla Data Science:

    • Panoramica della data science nelle scienze sociali
    • Tipi di dati: strutturati e non strutturati
    • Metodi di raccolta dati e fonti
    • gli open data nell'ambito delle scienze demografiche e sociali
  2. Visualizzazione dei Dati:

    • Principi di visualizzazione efficace dei dati
    • Creazione di visualizzazioni con R, e cenni a Python
    • Interpretazione e presentazione dei dati visivamente
  3. Analisi Esplorativa dei Dati (EDA):

    • Tecniche per l'EDA
    • Statistiche descrittive e distribuzioni dei dati
    • Identificazione di pattern e anomalie
  4. Analisi Statistica:

    • Concetti statistici di base
    • Test delle ipotesi e statistica inferenziale
    • Analisi di regressione e correlazione
  5. Lavorare con Dati Reali di Censimento:

    • Comprensione della struttura dei dati di censimento
    • Importazione e gestione di grandi dataset
    • Studi di caso ed esercizi pratici
  6. Applicazioni nelle Scienze Sociali:

    • Analisi demografica
    • Indicatori socio-economici
    • Politiche pubbliche e studi sulla popolazione

  7. Introduzione all'utilizzo dell'intelligenza artificale generativa per la scienza dei dati
  • principali modelli di IA generativa
  • esempi di prompt engineering

Prerequisiti:

Conoscenza elementari di base in statistica
Familiarità con concetti di programmazione (esperienza e conoscenza pregressa di R e Python è utile ma non obbligatoria)

Testi/Bibliografia

Hadley Wickham, Garrett Grolemund, R for Data Science: Import, Tidy, Transform, Visualize, and Model Data, O'Reilly Media, 2017.

Norman Matloff, The Art of R Programming: A Tour of Statistical Software Design, No Starch Press, 2011.

Metodi didattici

  • Lezioni e sessioni interattive
  • Esercizi pratici di programmazione
  • Progetti di gruppo e apprendimento collaborativo
  • Studi di caso reali e applicazioni
  • Modalità di verifica e valutazione dell'apprendimento

  • Discussione di un project work (singolarmente o in gruppi di massimo tre persone) elaborando dati demografici reali. Per il Project Work, i dati da elaborare verranno forniti dal docente e provengono dalle fonti censuarie IPUMS. Le analisi si baseranno sugli script di R illustrati durante le lezioni. Le presentazioni dovranno essere preparate in PowerPoint e i contenuti saranno concordati con il docente.
  • Gli studenti riceveranno una valutazione di idoneità in base alla loro performance e impegno nella fase di preparazione e presentazione del project work.
  • Strumenti a supporto della didattica

  • Slide del corso e appunti delle lezioni (forniti sulla piattaforma del corso Virtuale)
  • Libri di testo e materiali di lettura consigliati
  • Accesso a dataset di censimento disponibili su https://www.ipums.org/ e strumenti software rilevanti e linguaggi di programmazione come R/Python
  • Orario di ricevimento

    Consulta il sito web di Francesco Scalone