Le tecniche di Data Mining offrono oggi un supporto sempre più rilevante alle decisioni aziendali attraverso l'analisi dei dati su larga scala. Le metodologie di analisi e gli algoritmi proposti trovano applicazione in svariati ambiti sia commerciali, come il marketing e la competitive intelligence, sia scientifici, come l'analisi di dati biologici e clinici per lo studio di malattie genetiche e la validazione di terapie mediche. Il corso presenta il processo di analisi ed elaborazione dei dati al fine di estrapolare informazioni utili per il supporto alle decisioni aziendali. Verranno presentate le principali tecniche di analisi dei dati, quali la classificazione, l'estrazione di associazioni, il clustering e le loro principali applicazioni in ambito aziendale. Lezioni teoriche si alterneranno allo sviluppo di casi di studio, la cui progettazione sarà a cura dei partecipanti. I casi di studio prevedono l'utilizzo del software open source Rapid Miner e saranno mirati all'applicazione delle tecniche apprese, all'analisi critica e alla validazione dei risultati.
Durata 3 giorni
Programma
- Introduzione al Data Mining: fondamenti ed applicazioni:
- classificazione delle tecniche di data mining
- analisi dei contesti applicativi.
- Preparazione dei dati per l'analisi:
- integrazione e filtraggio dei dati
- aggregazione, discretizzazione e campionamento dei dati
- feature selection
- misure di distanza.
- Tecniche di analisi dei dati.
- Classificazione:
- alberi di decisione
- classificazione basata su regole
- classificazione Bayesiana
- tecniche di validazione.
- Estrazione di regole di associazione:
- principali algoritmi
- indici di qualità.
- Clustering:
- principali algoritmi
- tecniche di validazione.
- Strumenti per il Data Mining:
- classificazione dei software
- introduzione al software open source Rapid Miner
- uso di Rapid Miner per la preparazione, classificazione, clustering e visualizzazione dei dati.
- Casi di studio:
- creazione di una base di dati e preparazione dei dati da analizzare mediante Rapid Miner
- classificazione di dati mediante Rapid Miner
- estrazione di regole di associazione mediante Rapid Miner.