Descrizione
Il corso di data science, integrando tecniche di analisi Statistica dei Dati, di Data Mining, di Modellazione, Segmentazione e Scoring, unisce le conoscenze di data management e data exploitation, per una rigorosa interpretazione e corretta presentazione dei risultati. La Data Science combina campi come statistica, metodi scientifici, AI e analisi di dati per estrarre valore dai dati. Si occupa in particolare di analisi, pulizia, manipolazione e aggregazione di dati con l’obiettivo di eseguire analisi avanzate.
Obiettivi
La finalità generale del corso di data science è di fornire ai partecipanti le competenze teoriche introduttive per l’analisi dei dati, con un particolare accento sulla gestione dei dati con Python.
Conoscenze in uscita
Al termine del corso i partecipanti avranno acquisito alcune competenze sulla data science, e in particolare sui concetti di analisi, manipolazione e aggregazione dei dati.
Programma didattico
- Data Science: concetti e fondamenti
- Data Science: il processo
- Le Skills del Data Scientist
- R o Python?
- Python per la data science
- Data Exploration
- Selezione dei modelli
- Analisi statistiche e non statistiche
- Data Distribution
- Pulizia di un dataset, normalizzazione dei dati, variabili dummy
- Cenni a Machine Learning con Python
- Clustering
- Regole di associazione
Caratteristiche del corso
24 ore | |
Esercitazione di gruppo, Esercitazione individuale, Lezione frontale in laboratorio informatico | |
Dispense | |
Data Analyst | |
Attestato di frequenza e profitto. |