Google apre agli sviluppatori il suo agente Gemini Deep Research più avanzato
Google DeepMind ha annunciato il rilascio di una versione profondamente rinnovata di Gemini Deep Research, il proprio agente di ricerca autonoma per attività di analisi estese e complesse. La novità principale è l'apertura agli sviluppatori, che per la prima volta possono integrare direttamente nelle loro applicazioni le capacità di ricerca più avanzate di Google attraverso la nuova Interactions API. Contestualmente, è stato rilasciato anche DeepSearchQA, un benchmark open source pensato per misurare in modo rigoroso la qualità degli agenti di ricerca web su compiti articolati e multi-fase.
Il nuovo Gemini Deep Research è un agente ottimizzato per attività di raccolta del contesto e sintesi su larga scala. Il suo nucleo di ragionamento si basa su Gemini 3 Pro, descritto come il modello più accurato dal punto di vista fattuale sviluppato finora da Google, addestrato in modo specifico per ridurre le allucinazioni e migliorare la qualità dei report durante task complessi. L'architettura sfrutta il "reinforcement learning multi-step" applicato alla ricerca, consentendo all'agente di muoversi autonomamente all'interno di ecosistemi informativi articolati con un elevato livello di accuratezza.
Gemini Deep Research pianifica in modo iterativo le sue indagini: formula le query, legge i risultati, individua lacune di conoscenza e avvia nuove ricerche. Questa versione introduce miglioramenti sostanziali nella ricerca web, con la capacità di navigare in profondità all'interno dei siti per individuare dati specifici. L'agente è inoltre ottimizzato per generare report approfonditi a costi inferiori rispetto alle versioni precedenti. È previsto, nei prossimi aggiornamenti, l'arrivo di Gemini Deep Research anche in Ricerca, NotebookLM, Finanza e un potenziamento all'interno della Gemini App.
PRESTAZIONI E BENCHMARK
Sul piano delle prestazioni, Gemini Deep Research ha raggiunto risultati di stato dell'arte su diversi benchmark di riferimento. Nei test pubblici, l'agente ha ottenuto il 46,4% sull'intero set di Humanity's Last Exam, il 66,1% su DeepSearchQA e il 59,2% su BrowseComp, confermandosi come la soluzione più avanzata dell'azienda per la ricerca web complessa. Il confronto tra i risultati pass@8 e pass@1 su un sottoinsieme di 200 prompt di DeepSearchQA evidenzia inoltre il valore dell'esplorazione di traiettorie parallele per la verifica delle risposte, dimostrando l'importanza di concedere all'agente più tempo di ragionamento e ricerca.
CLICCA QUI PER CONTINUARE A LEGGERE
Qual è la tua reazione?
Mi piace
0
Antipatico
0
Lo amo
0
Comico
0
Furioso
0
Triste
0
Wow
0




