Evoluzione degli LLM

Nell’ultimo anno, l’evoluzione dei Large Language Models (LLM) ha segnato una svolta decisiva nel campo dell’Intelligenza Artificiale (AI). Questi modelli, capaci di comprendere e generare linguaggio umano, hanno trasformato il modo in cui interagiamo con la tecnologia, aprendo nuove frontiere in diversi settori.

Il 2023 ha visto un aumento esponenziale nell’adozione e nell’utilizzo degli LLM. Secondo le stime, milioni di utenti in tutto il mondo fanno ormai affidamento su questi strumenti per svolgere compiti che vanno dalla generazione di contenuti alla programmazione, dalla traduzione linguistica all’assistenza clienti. La loro capacità di elaborare e generare testi in modo coerente e contestualmente rilevante ha permesso di automatizzare processi che prima richiedevano un intervento umano significativo, migliorando l’efficienza e l’accessibilità dei servizi digitali.

Rebranding di Bard in Gemini

In questo contesto, il recente rebranding di Google Bard in Gemini rappresenta un passo significativo per la sua affermazione nel mercato dell’AI, in continua espansione.

La versione Gemini Pro 1.0, disponibile free in 40 lingue e 230 Paesi, qualche giorno fa è stata affiancata da due novità preannunciate: Gemini Advanced e l’applicazione Gemini.

Nel prima caso si tratta della versione “premium” e più evoluta dello strumento, in grado di offrire prestazioni notevolmente più avanzate rispetto alla versione base. Gemini Advanced è accessibile esclusivamente tramite l’abbonamento Google One AI Premium, ad oggi solo in inglese ed offerto in Italia al costo di 21,99 euro mensili, che comprendono 2TB di spazio di archiviazione cloud.

Per quanto riguarda invece l’applicazione – lanciata in primis negli USA con un rollout previsto anche in Italia – su Android sostituirà l’Assistente Google offrendo funzioni vocali e contestuali avanzate, mentre su iOS sarà integrata all’applicazione Google.

Quali sono le differenze tra Gemini Advanced e ChatGPT-4?

Qualche mese fa, nel nostro articolo “Bard vs ChatGPT: quale grande modello linguistico fa per te?“, per far emergere le differenze tra i due LLM, avevamo interrogato direttamente gli strumenti per poi confrontare le loro risposte.

Oggi, andiamo a rivedere quali sono le differenze tra le due offerte, a fronte delle novità in casa Google.

Generazione di immagini

Sia Gemini che ChatGPT sono in grado di convertire il testo in immagini, interpretando i comandi dell’utente riportati in linguaggio naturale. La differenza tra i due risultati risiede nel fatto che Gemini punta al realismo delle immagini offerte vincolando però il risultato al formato quadrato, mentre Dall-E 3 di OpenAI, utilizzato da ChatGPT, predilige la flessibilità delle dimensioni delle immagini, creandole però con uno stile marcatamente cartoon.

Funzioni vocali

Gemini, grazie all’integrazione con Google, offre una funzione di lettura ad alta voce fluida. ChatGPT, d’altro canto, ha il vantaggio di una app mobile che rende le conversazioni accessibili ovunque. Anche in questo caso, la scelta tra i due dipende dalle esigenze specifiche e dall’ambiente di lavoro.

Privacy

In ambito di privacy, entrambe le piattaforme fanno sollevare preoccupazioni sulla gestione dei dati, con ChatGPT che conserva le conversazioni per 30 giorni e Gemini per 18 mesi. Entrambi gli strumenti però offrono la possibilità di eliminare le chat a costo di ottenere risposte meno accurate.

Ricerca

Nel campo della ricerca di informazioni, Gemini, grazie al suo legame diretto con il motore di ricerca più utilizzato al mondo, si posiziona in vantaggio nei confronti di ChatGPT che si basa su Bing. Gemini offre risposte in tempo reale attingendo dalla ricerca di Google, includendo un pulsante per il fact-checking diretto, riducendo dunque le inesattezze o allucinazioni, che ad ogni modo rimangono possibili.

Conclusione

ChatGPT-4 eccelle nell’integrare plugin e GPT personalizzati, offrendo un’ampia personalizzazione e l’opportunità per i creatori di generare entrate. Consente anche modifiche in corso d’opera durante le conversazioni, ottimizzando l’efficienza e preservando il flusso creativo, funzionalità che possono mancare in Gemini. ChatGPT, inoltre, si distingue per la sua abilità nell’analizzare documenti PDF, una funzionalità non presente in Gemini. Inoltre, si caratterizza per l’integrazione con applicazioni di terze parti, offrendo agli utenti una vasta gamma di possibilità.

Gemini Advanced, d’altro canto, include 2TB di archiviazione cloud in Google One, offrendo un valore aggiunto agli utenti dell’ecosistema Google. Attinge le sue risposte in tempo reale da Google, oltre a permettere la personalizzazione dello stile delle risposte, la generazione di bozze multiple e l’integrazione delle Google Apps.

Complessivamente, sia ChatGPT che Gemini rappresentano modelli linguistici avanzati, ognuno con specifiche forze e limitazioni, ma riteniamo che per farsi un’idea più completa dell’offerta di Google bisognerà attendere che tutte le funzionalità annunciate diventino disponibili.

Ti suggeriamo di leggere anche questi articoli: