La Generative AI sta velocemente cambiando le nostre vite nei modi più disparati, dalle applicazioni più innocue come i meme o i vari “aiutini” che ChatGPT è in grado di fornire, a quelle più controverse, come ad esempio l’utilizzo della Generative AI per scrivere una legge in Brasile o il suo impiego per la creazione di immagini finte e diffamatorie. Il potenziale di questa tecnologia è enorme ed è ormai sulla bocca di tutti, tanto agli addetti ai lavori come data scientist o data engineers, quanto a chi invece è meno a contatto con questa tecnologia ma inevitabilmente si chiede se ed in che modo possa venirgli utile nel proprio lavoro e non solo nella vita di tutti i giorni. Se infatti è evidente come la Generative AI sia una tecnologia che stupisce, quando questa viene inserita in un contesto lavorativo bisogna necessariamente domandarsi quali siano le reali capacità ed i limiti di tale tecnologia e soprattutto come può essere integrata efficacemente dalle aziende nelle infrastrutture e nei sistemi già esistenti.
Sommario
Integrare le IA Generative
Se vogliamo darne una definizione semplice, la Generative AI è un tipo di Intelligenza Artificiale in grado di creare contenuti siano questi in forma di testo, immagini, audio.. Come tutti i modelli di AI, anch’essa ha bisogno di essere “addestrata”, validata e testata come qualunque altra forma di Machine Learning ed è, e probabilmente sarà per lungo tempo, soggetta a bias ed errori simili a quelli umani. Una nota problematica dei Large Language Models (LLM) è che spesso tendono a dare informazioni errate oppure risposte vaghe e questo può essere problematico in alcuni ambiti specifici come ad esempio quello dello sviluppo software, dove questo aspetto può causare bug nel codice e minarne l’integrità e la scalabilità futura. Un ulteriore problema risiede nel fatto che le IA Generative commerciali e più conosciute come Chat GPT o Gemini sono state trainate su enormi quantità di dati ma è possibile che non abbiano informazioni su specifiche piattaforme o determinati processi aziendali e potrebbero fornire risposte non accurate in diversi contesti. In alcuni casi è quindi preferibile utilizzare LLM Open Source, i quali hanno la caratteristica di essere maggiormente personalizzabili e soprattutto forniscono la possibilità di essere allenati con un training set interamente fornito dall’utente, rendendoli quindi potenzialmente più accurati in uno specifico dominio. L’industralizzazione della IA Generativa, ovvero l’integrazione di questa tecnologia all’interno dei processi operativi e dei sistemi di un’azienda, dovrebbe quindi innanzitutto passare attraverso una completa documentazione sia tecnica che procedurale. Il processo rimane sempre e comunque iterativo, nel senso che è possibile dare dei feedback alle risposte fornite dall’IA in modo che la soluzione possa migliorare nel tempo e diventare sempre più accurata.
Due Case Studies di Gen AI applicata
Un esempio di ingegnerizzazione della Generative AI è sicuramente nella generazione di codice e nell’assistere la programmazione. Databricks ha recentemente lanciato DBRX, un LLM open-source che andrà ad integrare i vari vantaggi della Generative AI all’interno della piattaforma. La feature principale è un chatbot trainato specificatamente sulla piattaforma Databricks il quale è in grado di rispondere a domande sulle funzionalità di Databricks, proporre soluzioni ad eventuali bug o fornire direttamente linee di codice come funzioni custom in Python o query SQL per interrogare un database. Un’altra funzionalità che è stata implementata è la possibilità di fornire commenti e documentazione sulle tabelle e sulle singole colonne, con ad esempio informazioni sulla colonna o come una tabella viene utilizzata e che tipo di dati contiene (dati commerciali, anagrafici, tecnici etc.). Come accennato in precedenza, è possibile fornire un feedback ed editare correttamente la risposta fornita in modo da rendere il modello più preciso in futuro.
Un’altro ambito dove la Generative AI ha enormi prospettive di crescita è quello della creazione di contenuti e del marketing. Nel primo caso già oggi possiamo vedere su TikTok o YouTube contenuti interamente generati da un’IA, dalla sequenza di immagini al text-to-speech, dove l’unico contributo umano è la scrittura dei prompt ed in alcuni casi estremi il prompt viene a sua volta generato da un’IA. Questi contenuti sono piuttosto generici e di bassa qualità ma ciò non toglie che in futuro possano migliorare esponenzialmente, soprattutto se questi venissero trainati con contenuti “fatti a mano” in modo che il modello riconosca i pattern e lo stile dell’azienda o dell’autore. Le applicazioni sono tantissime, dalla creazione di contenuti destinati ai social, alla scrittura di articoli in un blog (n.b., questo articolo è scritto da un umano) o alla produzione di advertisment estremamente personalizzato. In questo ultimo caso, un’IA Generativa sarebbe in grado di generare tag personalizzati per un utente e creare autonomamente una pubblicità adatta per l’utente in questione. Ad esempio, l’advertisement per un’automobile potrebbe essere diversa a seconda dell’età del target o della presunta occupazione.
Introdurre le Gen AI nel mondo delle aziende
A grandi linee, possiamo pensare ad una Generative AI come uno stagista alle prime armi:
- non bisogna aspettarsi che conosca già tutti i processi e le caratteristiche aziendali,
- è indubbiamente utile fornirgli la necessaria documentazione funzionale a svolgere il proprio lavoro
- è fondamentale spiegargli i propri compiti e mansioni in maniera chiara e concisa.
Quest’ultimo aspetto si traduce in termini di Generative AI come “prompt engineering”, ovvero l’ottimizzazione e lo sviluppo di prompt (i “compiti” che chiediamo di eseguire ad un LLM) il più possibile semplici e diretti per evitare risposte errate. A questo si aggiunge il training del modello su un dataset personalizzato e mirato ed un costante loop di conferma e miglioramento finchè non si raggiunge una adeguata accuratezza delle risposte. La scelta del modello LLM è altrettanto importante, dove modelli open-source e closed-source presentano vantaggi e svantaggi e possono rilevarsi più o meno adeguati a seconda della situazione. L’industrializzazione della IA Generativa dovrebbe quindi passare attraverso questi step preliminari, pena la produzione di contenuti generici e blandi o, nel peggiore dei casi, di risposte errate che potrebbero causare diversi problemi.
Di Francesco Capuani, Data Scientist
Comments are closed.