ASCOLTA L’ARTICOLO
L’Intelligenza Artificiale per le Risorse Umane
Negli ultimi anni l’Intelligenza Artificiale ha rivoluzionato il modo in cui le aziende operano. L’avvento dei Large Language Models (LLM) ha aperto nuove prospettive e possibilità. Ma cosa sono i LLM?
Come abbiamo visto in un precedente approfondimento, sono modelli di Intelligenza Artificiale basati su una grande quantità di dati in grado di capire ed elaborare il linguaggio naturale e generare testo. Questi modelli sono addestrati su enormi quantità di testo provenienti da internet e sono in grado di generare testo coerente e comprensibile; ad esempio, GPT-4 V, l’architettura su cui si basa il noto ChatGPT, è uno dei LLM di più recente innovazione.
Queste tecnologie avanzate offrono alle aziende una serie di vantaggi unici, che vanno dalla personalizzazione dell’esperienza del cliente alla riduzione dei costi operativi, all’automazione di compiti ripetitivi.
In questo articolo si esplora un caso pratico di utilizzo dei modelli generativi in ambito HR (clicca qui per approfondire un ulteriore esempio, in cui abbiamo utilizzato tecniche diverse), per dare evidenza del perché i modelli generativi possono rappresentare una scelta vantaggiosa in grado di semplificare e velocizzare notevolmente il processo di ricerca e selezione del personale.
Quali sono le esigenze del mondo HR?
Capita spesso che i recruiter si trovino a dover leggere un numero significativo di curricula alla ricerca di skill e caratteristiche che possano adattarsi al meglio ad una specifica posizione lavorativa e cultura aziendale. Ciò richiede non solo molte ore di lavoro, ma comporta anche il rischio di commettere errori, sviste o in qualche caso di introdurre pregiudizi, che possono pregiudicare la qualità finale della ricerca svolta. Per consentire ai recruiter di concentrarsi sugli aspetti più importanti della selezione, i modelli di intelligenza artificiale possono automatizzare e migliorare l’efficacia e l’efficienza del processo di selezione del personale.
È nota l’esistenza di software che riescono ad estrarre informazioni come età e titolo di studio, attraverso meccanismi di taggatura. Spesso, tuttavia, questi sistemi non si basano su algoritmi di intelligenza artificiale e i risultati non sono sempre soddisfacenti ed esaustivi. Inoltre, quei sistemi che dichiarano esplicitamente di fare uso di modelli di machine learning, non forniscono le performance dei modelli stessi, ovvero quelle metriche che servono a valutare la bontà dei modelli.
Caso di studio: un esempio di applicazione
Alla famiglia dei LLM appartengono i modelli GPT, sviluppati da OpenAI. Questi modelli si basano su reti neurali artificiali capaci di elaborare sequenze di dati in modo efficiente e di catturare relazioni a lungo termine all’interno di un testo; per questo motivo sono adatti a svolgere compiti che coinvolgono l’elaborazione del linguaggio naturale.
In questo contesto sono stati testati i modelli GPT nell’ambito delle risorse umane. Più in dettaglio, si è scelto di considerare due diverse tipologie di curricula: da un lato quelli discorsivi, dall’altro quelli a lista. La ragione di questa scelta è presto spiegata: poiché i curricula sono scritti da persone diverse e, dunque, sono tra loro dissimili, si vuole vedere come i modelli si comportano nel caso di tipologie diverse di testo.
Con un processo di selezione, si è deciso di utilizzare uno dei modelli GPT capace di un’ampia varietà di task con poche istruzioni in input, come per “comprendere” profondamente un testo e creare nuovo contenuto.
Si passano i curricula interi al modello con una studiata combinazione di parametri, chiedendo di estrarre le hard skill, le soft skill, gli hobby e le informazioni anagrafiche: i risultati sono sorprendenti per quanto precisi e completi, e non sono paragonabili a quelli ottenuti mediante metodi di estrazione delle keyword, quali ad esempio KeyBERT, o altri modelli open source, seppur comunque validi.
Inoltre, si è notato che la qualità dei risultati non cambia a seconda della tipologia di curriculum passato: sia che si tratti di un testo lungo o di un elenco il modello è in grado di estrarre le informazioni richieste.
Ad esempio, abbiamo scritto un cv (riportato in Figura 1) e, senza alcuna manipolazione del testo, abbiamo passato il cv in formato pdf all’algoritmo, che ha individuato come:
- hard skill: conoscenza dei programmi office, Windows, Ubuntu, C, C++, Python, SQL, Matlab, Wolfram, Mathematica, Spark, Latex.
- Soft skill: buono spirito di lavoro in team, capacità di adeguamento ai diversi ambienti, buone capacità di comunicazione.
- Hobby: ciclismo, immersioni subacquee.
- Informazioni anagrafiche: Nome: Mario Rossi, Data di nascita: 1° aprile 1995, Residenza: Milano, Via Cavour 1, Numero di telefono: 1234567890, E-mail: mariorossi@gmail.com.
- Lingue parlate dal candidato: Mario Rossi conosce l’italiano (madrelingua), l’inglese (avanzato) e il francese (intermedio).
La qualità degli output forniti dimostra non solo che il modello restituisce buoni risultati, attinenti alle richieste che sono state fatte (individuazione di hard skill, soft skill…), ma lo fa senza una pre-elaborazione dei dati forniti, quindi prendendo come input direttamente il cv in formato pdf. Questo, invece, non è possibile con strumenti precedenti quali KeyBERT, una libreria open source che fa uso degli embeddings di BERT e del concetto di similarità del coseno. KeyBERT richiede una pre-elaborazione del testo: oltre ad una eliminazione delle parole poco significative, occorre evidenziare la porzione di testo da cui si vogliono estrarre parole chiave. Ad esempio, le parole chiave estratte da keyBERT dal paragrafo sulle competenze tecniche sono: conoscenza, office, programmazione, Mathematica e linguaggi.
L’accuratezza dei risultati ottenuti con i LLM apre la strada alla popolazione in automatico di database (SQL o NoSQL) o i data lake.
Tuttavia, non sono solo questi i motivi di applicazione dei LLM in ambito HR: con questi strumenti è possibile scendere a più livelli di complessità, quindi non solo usarli per la ricerca e l’estrazione del testo, ma anche per condurre un’analisi semantica. Ad esempio, si possono ricercare i termini con accezione positiva e negativa o il lessico legato all’ambizione.
Quest’analisi risulta particolarmente utile per posizioni lavorative per cui si ricercano candidati con caratteristiche particolari: pensiamo ad esempio al ruolo di responsabile commerciale, per cui si prediligono persone ambiziose. Chiedendo per prova all’algoritmo di estrarre parole con significato positivo dal cv di Mario Rossi otteniamo: appassionato, creativo, professionale, allegro, ambizioso, dedicato, buono, capacità, adeguamento, comunicazione.
Quali vantaggi ne traggono gli HR?
Le prove e i confronti precedenti permettono di vedere che i modelli GPT raggiungono performance esaustive e soddisfacenti, con velocità e poco sforzo da parte dell’utente.
I nuovi modelli superano in termini di bontà e precisione dei risultati le soluzioni preesistenti: queste caratteristiche portano a valutare positivamente l’integrazione di questi strumenti nella routine lavorativa di chi si occupa di selezione del personale, accelerando e migliorando il noto processo piramidale di acquisizione del dato grezzo, trasformazione del dato in informazione e successivamente in conoscenza.
I LLM possono avere anche altri usi nell’ambito delle risorse umane, oltre all’estrazione di informazioni dai curricula. Ad esempio, possono essere utilizzati per creare descrizioni di figure cercate, per rilevare il plagio nel caso in cui i candidati copino descrizioni da fonti esterne, oppure per fornire raccomandazioni personalizzate ai responsabili HR.
Questi strumenti, quindi, possono considerarsi un vantaggio competitivo, collocando l’azienda che li adotta in uno scenario altamente innovativo.