Nell’articolo “Dalla business intelligence ai sistemi di predictive analytics” (v. https://www.dataskills.it/dalla-business-intelligence-ai-sistemi-di-predictive-analytics/ ) ho parlato dell’evoluzione dei processi di analisi dei dati, descrivendo un percorso evolutivo che ha portato dall’eseguire semplici query su tabelle relazionali a sistemi di business intelligence (BI) e da questi ultimi all’utilizzo di strumenti di predictive analytics. In questo articolo parlerò invece di un ulteriore passaggio verso tecniche innovative di analisi predittiva, che vanno sotto il nome di prescriptive analytics.
Se, invece di tracciare una timeline come nell’articolo precedente, esaminiamo le tecniche di analisi disponibili considerando l’output che esse producono, possiamo classificarle in tre categorie:
Le tecniche descrittive (descriptive analytics)
Le tecniche predittive (predictive analytics)
Le tecniche prescrittive (prescriptive analytics)
Sommario
Descriptive Analytics
Se pensiamo alla Business Intelligence, le componenti e l’output stesso del sistema rientrano nella categoria dell’analisi descrittiva. Attraverso il data warehouse, i motori OLAP ed i tool di reportistica, dai più semplici ai più sofisticati, ciò che facciamo è analizzare i dati del passato, categorizzandoli, filtrandoli, aggregandoli ed applicando funzioni matematiche o statistiche, puramente descrittive (somme, medie, varianze,…). Con i motori OLAP si possono effettuare facilmente operazioni di slicing, dicing, drill down, drill-up, drill-across, ma si tratta pur sempre di analisi che descrivono il passato.
Predictive Analytics
Le tecniche predittive, invece utilizzano il passato per avere una insight sul futuro. Si tratta di tecniche di data mining, che sfruttano metodi di analisi statistica, machine learning oltre che di modellazione, preparazione e querying dei dati proprie dei sistemi database. Chiariamo che le tecniche di predictive analytics non ci dicono cosa accadrà nel futuro, ma soltanto cosa potrebbe accadere con un certo grado di probabilità.
Esempi di predictive analytics, applicate al business, possono essere:
Churn Analysis. La churn analysis consiste nell’analisi della clientela per determinare i clienti che presentano un’alta probabilità di passare alla concorrenza, al fine di intervenire in anticipo ed evitarne la migrazione.
Ricerca di anomalie. In questo caso gli algoritmi di machine learning sono in gradi di identificare situazioni anomale, come possono essere, per esempio i comportamenti fraudolenti nell’utilizzo di carte di credito, oppure le frodi assicurative.
Cross Selling / Up Selling. Le tecniche predittive possono essere impiegate per determinare quali clienti siano più propensi ad acquistare un determinato prodotto, dando l’opportunità all’azienda di compiere azioni mirate su un gruppo ben preciso di potenziali acquirenti.
I principali algoritmi di predictive analytics possono essere categorizzati in:
Classification algorithms: essi consentono di assegnare un oggetto ad una classe. Un esempio di problemi di classificazione è l’individuazione dei “churners”; in questo caso le classi su cui dividere i clienti sono quella dei churners e quella dei clienti fedeli.
Clustering algorithms: tali algoritmi aggruppano elementi omogenei in un insieme di dati. Le tecniche di clustering si basano su misure relative alla somiglianza tra gli elementi.
Frequent pattern mining: con questi algoritmi si individuano insiemi di elementi ricorrenti in dataset anche molto grandi.
Prescriptive Analytics
Arriviamo quindi a descrivere la prescriptive analytics. Si tratta di un concetto innovativo (anche se il termine ha fatto la sua comparsa del 2003) è che ha le sue fondamenta nell’analisi predittiva, ma va oltre, fornendo vere e proprie regole direttamente applicabili al business. La conseguenza di tutto ciò è la capacità del modello prescrittivo di abilitare i decision makers ad intraprendere azioni immediate, basate su previsioni probabilistiche e soprattutto su regole chiare e comprensibili che provengono dal modello stesso. Un altro aspetto importante dei modelli di prescriptive analytics consiste nella loro capacità di analizzare anche il feedback che proviene dall’utilizzo delle regole, al fine di tener conto delle azioni intraprese e dei loro effetti sui risultati.
Come già accennato, i modelli di prescriptive analytics sono anche di predictive analytics, ma ad essi aggiungono la capacità di spiegare il perché di un certo evento: i modelli predittivi ci dicono cosa è probabile che avvenga, mentre i modelli prescrittivi ne spiegano le motivazioni (attraverso un insieme di regole).
Come è noto le prediction non sono valide per sempre, per questo le indicazioni che il modello produce devono lasciare tempo sufficiente per agire, altrimenti si dimostrerebbero poco utili a fini decisionali ed esecutivi. Se le regole prodotte dal modello sono semplici e facilmente interpretabili, ecco allora che il tempo necessario all’azione sarà breve, consentendo ai decision maker di rientrare nell’orizzonte temporale di validità della prediction. Ora ci si può domandare quali siano gli algoritmi che, oltre a generare una prediction, creino regole immediatamente utilizzabili. Si tratta di tre classi di algoritmi:
Decision trees
Fuzzy Rule-Based System
Switching Neural Networks (Logic Learning Machine)
Altri sistemi come per esempio le Reti Neurali o le Support Vector Machines, pur essendo efficaci dal punto di vista dell’accuracy, specificity e sensitivity del modello, sono delle black-box machines, ovvero non forniscono alcuna visione di come si giunga ad una determinata prediciton.
I decision tree sono semplici da utilizzare, ma non presentano una performance predittiva particolarmente brillante; tuttavia sono ampiamente utilizzati (forse propri perché tra i pochi sistemi in gradi di produrre regole) e implementati in molti tool di data mining. I sistemi fuzzy sono migliori dal punto di vista predittivo, ma non sono molto diffusi. L’ultimo algoritmo, Switching Neural Networks, è implementato soltanto in un tool di machine learming: Rulex ( www.rulexinc.com ) e presenta una capacità predittiva molto elevata.
Nei prossimi articoli parleremo dei tre algoritmi nel dettaglio.
Riferimenti
Basu, A. T. A. N. U. (2013). Five pillars of prescriptive analytics success. Analytics Magazine.
Bertolucci, J. (April 15, 2013). Prescriptive Analytics and Data: Next Big Thing? InformationWeek.
Riza, Bergmeir, Herrera, Benìtez, 2015 , Fuzzy Rule-Based Systems for Classification and Regression in R – Journal of Statistical Software, Vol 65, Issue 6.
Marco Muselli, 2006, “Switching Neural Networks: A new connectionist model for classification”. WIRN 2005 and NAIS 2005, Lecture Notes on Computer Science
Leave A Comment