Gemini è stato sviluppato con la collaborazione di ricercatori provenienti da varie divisioni di intelligenza artificiale di Google, tra cui DeepMind e Google Brain, che ora operano come un’unica entità integrata.
Google ha già rilasciato una versione preliminare di Gemini a un gruppo selezionato di aziende, sottolineando l’importanza strategica di questo progetto.
Questo annuncio ha scatenato un acceso dibattito nella comunità tecnologica, con esperti che cercano di valutare la capacità di Gemini di superare il potente modello linguistico GPT-4.
Secondo un rapporto di SemiAnalysis, Gemini potrebbe vantare una potenza di calcolo cinque volte superiore a quella di GPT-4 e potrebbe raggiungere una performance 20 volte superiore al modello di OpenAI entro la fine del 2024. Questo indica un notevole avanzamento nell’elaborazione del linguaggio naturale.
Gemini si ispira al successo di Alpha Go, un progetto di DeepMind di Google che nel 2016 ha sconfitto un campione umano di Go, rappresentando un punto di svolta nell’intelligenza artificiale. Il modello combina le tecniche utilizzate in Alpha Go con le straordinarie capacità linguistiche dei grandi modelli di intelligenza artificiale, come ChatGPT.
Nonostante i dettagli sull’offerta di Google siano ancora limitati, sappiamo che Gemini è un modello di intelligenza artificiale multimodale in grado di elaborare simultaneamente dati di diverse tipologie. Questa caratteristica consentirà a Gemini di analizzare sia immagini che testo, aprendo la strada a funzionalità avanzate come la generazione di testi, immagini, musica, codice e l’interpretazione di dati visivi mediante richieste testuali.
Google sta anche investendo nello sviluppo delle capacità di generazione di codice di Gemini per competere con GitHub Copilot di Microsoft, basato su OpenAI. Una volta completati i test e i perfezionamenti necessari, il modello sarà reso disponibile in diverse dimensioni e con varie capacità per adattarsi alle esigenze specifiche degli utenti.
Va evidenziato inoltre che Gemini sembra essere meno incline a generare risposte errate, un problema comune nell’intelligenza artificiale, e potrebbe quindi offrire un’esperienza utente più affidabile.
Il progetto Gemini di Google promette di essere un attore fondamentale nell’evoluzione dell’intelligenza artificiale multimodale e costituisce per GPT-4 di OpenAI una seria sfida.
Il confronto tra questi due giganti dell’intelligenza artificiale sarà sicuramente uno dei temi più interessanti e rilevanti nei prossimi anni.