L'analisi dei dati è una problematica di fondamentale importanza all'interno del contesto aziendale. Se le basi di dati e i relativi sistemi di gestione consentono oggi di gestire collezioni di dati di dimensioni sempre maggiori, la scelta delle tecniche di analisi più opportune per la generazione di conoscenza fruibile a partire dai dati stessi rappresenta il passo più complesso e decisivo per il supporto alle decisioni aziendali. Il corso analizza lo sviluppo del processo di estrazione di conoscenza basato su tecniche di Data Mining (KDD) applicato a contesti reali di analisi in ambito aziendale. Viene illustrata l'applicazione delle principali tecniche di analisi dei dati e validazione dei risultati finalizzate alle risoluzione di problematiche aziendali quali la personalizzazione dei servizi, la segmentazione dei clienti, il cross-marketing e i recommendation system. Il corso si conclude con un caso di studio, interamente progettato dai partecipanti, che prevede l'utilizzo di tecniche e algoritmi di Data Mining e del software open source Rapid Miner.
Durata 2 giorni
Programma
- Il processo di estrazione di conoscenza:
- preparazione dei dati all'analisi
- classificazione delle tecniche di analisi
- validazione dei risultati e reporting.
- La personalizzazione dei servizi:
- analisi del contesto applicativo
- estrazione di regole di associazione per la personalizzazione dell'offerta
- profiling di utenti e servizi
- validazione dei risultati ottenuti.
- La segmentazione della clientela:
- analisi del contesto applicativo
- applicazione di tecniche di clustering per la segmentazione dei clienti
- misure di qualità.
- I recommendation system:
- analisi del contesto applicativo
- applicazione di tecniche di classificazione per la raccomandazione di prodotti o servizi
- validazione dei risultati
- applicazione al cross-marketing.
- Strumenti per il Data Mining:
- categorie di software
- introduzione al software open source Rapid Miner
- uso di Rapid Miner per l'analisi dei dati.
- Caso di studio:
- definizione di un contesto applicativo di interesse
- creazione di una base di dati da analizzare
- analisi dei dati mediante Rapid Miner
- validazione dell'analisi.