Descrizione

Il corso Machine Learning con Python fornisce le competenze tecniche e teoriche per trattare con successo  veri problemi di machine learning, accompagnando lo studente lungo l’intera filiera di lavorazione dal dato: potrai imparare a programmare in Python le tecniche di acquisizione dei dati, pre-processing e data quality, valutazione degli algoritmi, ottimizzazione dei parametri e valutazione finale dei risultati ottenuti.

Obiettivi

Implementare algoritmi di machine learning utilizzando Python e le sue più famose librerie, comprendendo la teoria sottostante e permettendo allo studente di affrontare con autonomia e successo problemi di analisi dei dati che richiedono un approccio predittivo e non dichiarativo.

Conoscenze in uscita

A fine corso i partecipanti saranno in grado di:

  • Utilizzare Python in combinazione con la libreria Beautiful Soup e le espressioni regolari per acquisire dati dal web (es: Github o Instagram);
  • Costruire delle piccole intelligenze artificiali capaci di risolvere problemi di classificazione e regressione di testo e immagini.

Tecnologie utilizzate: Python, Anaconda, Spyder, principali librerie di Python: Pycaret, Pandas, Numpy, Seaborn, MatplotLib, Scikit-Learn, Beautiful Soup, requests e JSON.

Programma didattico

  • Breve introduzione alla sintassi di Python e al paradigma della programmazione a oggetti
  • Acquisizione dei dati da file .csv, excel, dal web e da database
  • Visualizzare e analizzare i dati con la libreria Seaborn
  • Filtrare, raggruppare e lavorare i dati con la libreria Pandas
  • Le tecniche di pre processing del machine learning implementate con Scikit-Learn e Pycaret:
    • Imputazione dati mancanti
    • Codifica variabili categoriche
    • Valutazione degli outliers
    • Normalizzazione dei dati
    • Algoritmi per la selezione ed estrazione delle caratteristiche
  • Campionamento dei dati per attività di training, test e validazione
  • Implementazione di algoritmi di classificazione supervisionata con Scikit-Learn e Pycaret
  • Algoritmi di regressione logistica, discesa del gradiente, alberi decisionali, random forest, Knn.
  • Tuning degli algoritmi, convalida incrociata e analisi di problematiche di overfitting
  •  Valutazione dei risultati ottenuti: matrice di confusione, accuratezza e precisione
  • Introduzione alla regressione statistica e alla correlazione
  • Algoritmi di regressione con Scikit-Learn e Pycaret.
  • Combinare i risultati di algoritmi differenti per ottenere risultati più robusti
  • Introduzione allo scraping dal web e alla sentiment analysis tramite le librerie Beautiful
  • Soup, requests, json e l’utilizzo di espressioni regolari.
  • Introduzione a problemi di classificazione non supervisionata:
    • Clustering
    • Regole associative
    • Anomaly detection
Caratteristiche del corso
20 ore
Esercitazione individuale, Lezione frontale in laboratorio informatico, Aula Virtuale
Dispense
Personale tecnico, Programmatori, Software developer
Attestato di frequenza e profitto.