Natural Language Processing: un trend da seguire per il futuro

Pexels Photo 247819

Che cosa si intende per Natural Language Processing (NLP)?

Secondo la definizione di Wikipedia, il Natural Language Processing (NLP) è una branca della linguistica, dell’informatica e dell’Intelligenza Artificiale che si occupa di indagare le interazioni tra le macchine e il linguaggio umano, ed in particolare lo sviluppo di programmi in grado di processare ed analizzare una grande mole di dati scritti in “linguaggio naturale”, ovvero da esseri umani.

In altre parole, le tecniche di NLP servono a permettere ai computer di utilizzare il linguaggio umano.

Nella storia dell’intelligenza Artificiale, una delle dimensioni principali attraverso cui misurare “l’intelligenza” di una macchina è sempre stata quella linguistica, non a caso per superare il Test di Turing una macchina intelligente dovrebbe essere in grado di rispondere ad essere umano in modo così naturale da celare la propria natura automatica, rendendo impossibile per l’interlocutore riconoscere l’artificiosità della risposta.

Ad oggi le tecniche di NLP sono utilizzate da tantissimi strumenti con cui interagiamo quotidianamente. Dietro alle quinte di qualsiasi assistente virtuale, chatbot o semplicemente nell’auto-completamento della barra di ricerca di Google, vi sono algoritmi che leggono e processano il linguaggio umano.

Se gestire informazioni numeriche può essere relativamente semplice per una macchina, andare ad estrarre informazioni dal linguaggio è un compito molto più complesso, a causa della natura “non-strutturata” di quest’ultimo, che ingloba un insieme di regole grammaticali e sintattiche non sempre definite, diverse per ogni lingua, dialetto o inflessione regionale.  La funzione dell’NLP è quindi quella di creare una “struttura” al linguaggio, in modo da risolvere le ambiguità in esso presenti e processarlo alla stregua di un dato numerico, rendendo possibile, ad esempio, l’analisi di documenti testuali e il riconoscimento vocale.

Esempi pratici di utilizzo di NLP

L’applicazione pratica di queste tecniche è ancora relativamente recente, e nasconde un enorme potenziale, considerando l’immensa quantità di problemi che potrebbero essere risolti da questo tipo di soluzioni. Oltre ad assistenti virtuali più efficaci nel comprendere le nostre esigenze, c’è una vasta gamma di possibili applicazioni dell’NLP che ancora devono essere pienamente sfruttate, a mano a mano che le tecnologie miglioreranno nei prossimi anni, come ad esempio servizi di traduzione precisi, motori artificiali in grado di generare contenuti testuali automaticamente, e altri servizi in grado di trasformare immagini in linguaggio testuale, di gestire archivi testuali o di estrarre informazioni da documenti, libri e manuali.

Non solo, anche algoritmi di spam e fraud detection possono beneficiare di tecniche di NLP più avanzate andando a stanare i contenuti malevoli e indesiderati attraverso l’analisi linguistica. Noi di Dataskills, ad esempio, abbiamo utilizzato le tecniche di NLP per realizzare due tool in grado di operare una manutenzione automatizzata dei dati aziendali, andando a scovare nelle anagrafiche i dati duplicati e gli utenti fasulli, e permettendo quindi all’azienda di migliorare in termini di Data Quality.

Da un punto di vista aziendale, è quindi importante monitorare attentamente questo trend, per capire se l’NLP possa trovare applicazioni pratiche in grado di risolvere determinati problemi e di agevolare il raggiungimento dei risultati desiderati. In questo senso, il 2020 è stato un anno cruciale per gli sviluppi delle tecniche di NLP.

OpenAI, società di ricerca sull’Intelligenza Artificiale fondata da Elon Musk, ha rilasciato un nuovo modello per la text generation (generazione automatizzata di testi) chiamato GPT-3 (Generative Pre-trained Transformer 3). Il modello è stato trainato su un dataset di circa 570Gb di documenti testuali recuperati da internet attraverso il web scraping (per la maggior parte si tratta di contenuti generati da utenti umani, come risposte nei forum di Reddit). In seguito a questo training, il tool è in grado di portare a termine una grande varietà di compiti piuttosto complessi che comprendono la generazione di stringhe di testo. In altre parole, GPT-3 può fare qualsiasi cosa che abbia a che fare con un linguaggio strutturato: può rispondere a delle domande, prendere appunti, scrivere brevi saggi, riassumere e tradurre testi, e addirittura scrivere pagine di codice per la programmazione. Ad oggi GPT-3 non è ancora disponibile per il grande pubblico e deve essere ulteriormente perfezionato, tuttavia il rilascio di un simile strumento nei prossimi anni ha sicuramente il potenziale per rivoluzionare tantissimi settori, dal marketing alla creazione di contenuti di qualsiasi tipo.

L’analisi dei dati testuali tramite NLP può essere estremamente utile anche per fini di Business Intelligence. Alcuni tool di BI offrono già la possibilità di interrogare i dati attraverso domande scritte in linguaggio naturale (“A quanto ammonta il fatturato per le vendite del prodotto X nel 2019?”) che permettono una visualizzazione rapida ed efficace delle metriche che si intende conoscere, senza la necessità di impiegare tempo per scrivere codice o per la creazione delle modalità visuali necessarie.

Infine, sempre osservando la tecnologia da un punto di vista aziendale, nei prossimi anni si assisterà probabilmente ad un ampio utilizzo delle tecnologie di NLP in ottica di sentiment analysis e customer satisfaction. Già oggi è possibile creare tool che vadano ad analizzare le informazioni circa tweet, recensioni o altri testi riguardanti una specifica azienda o prodotto. In futuro, a mano a mano che ogni società inizierà a dotarsi di questi strumenti, sarà indispensabile, per poter competere, avere accesso a tecnologie analoghe.

Conclusione

Sebbene la mano dell’uomo sia ancora indispensabile per i compiti più importanti e complessi, vi è tutta una serie di azioni di routine che comprendono l’analisi o la generazione di testi che possono o potranno essere automatizzati dalle tecniche di NLP. Per questi motivi, il Natural Language Processing rappresenta, per le aziende, un trend da seguire attentamente per il futuro.

 

In questo articolo abbiamo illustrato che cos’è il Natural Language Processing e perché è importante, esaminando alcune delle principali applicazioni di questa tecnologia. Se se interessato a una consulenza riguardo a soluzioni di NLP o a tema Intelligenza Artificiale, non esitare a contattarci.

 

 

Andrea Bergonzi

Andrea Bergonzi

Sono laureato in Economia, Finanza e Mercati Internazionali. Prima di entrare nel mondo della Data Science ho ricoperto il ruolo di analista dei mercati finanziari e research editor. Dal 2020 sono membro di Dataskills, dove mi occupo di Predictive Analytics e Business Intelligence.

Comments are closed.

Iscrivi alla newsletter














    Dichiaro di aver letto ed accetto l’informativa sulla privacy

    Andrea Bergonzi

    Andrea Bergonzi

    Sono laureato in Economia, Finanza e Mercati Internazionali. Prima di entrare nel mondo della Data Science ho ricoperto il ruolo di analista dei mercati finanziari e research editor. Dal 2020 sono membro di Dataskills, dove mi occupo di Predictive Analytics e Business Intelligence.