Google apre agli sviluppatori il suo agente Gemini Deep Research più avanzato

Redazione

Dicembre 12, 2025 - 14:44

Google DeepMind ha annunciato il rilascio di una versione profondamente rinnovata di Gemini Deep Research, il proprio agente di ricerca autonoma per attività di analisi estese e complesse. La novità principale è l'apertura agli sviluppatori, che per la prima volta possono integrare direttamente nelle loro applicazioni le capacità di ricerca più avanzate di Google attraverso la nuova Interactions API. Contestualmente, è stato rilasciato anche DeepSearchQA, un benchmark open source pensato per misurare in modo rigoroso la qualità degli agenti di ricerca web su compiti articolati e multi-fase.

Il nuovo Gemini Deep Research è un agente ottimizzato per attività di raccolta del contesto e sintesi su larga scala. Il suo nucleo di ragionamento si basa su Gemini 3 Pro, descritto come il modello più accurato dal punto di vista fattuale sviluppato finora da Google, addestrato in modo specifico per ridurre le allucinazioni e migliorare la qualità dei report durante task complessi. L'architettura sfrutta il "reinforcement learning multi-step" applicato alla ricerca, consentendo all'agente di muoversi autonomamente all'interno di ecosistemi informativi articolati con un elevato livello di accuratezza.

Gemini Deep Research pianifica in modo iterativo le sue indagini: formula le query, legge i risultati, individua lacune di conoscenza e avvia nuove ricerche. Questa versione introduce miglioramenti sostanziali nella ricerca web, con la capacità di navigare in profondità all'interno dei siti per individuare dati specifici. L'agente è inoltre ottimizzato per generare report approfonditi a costi inferiori rispetto alle versioni precedenti. È previsto, nei prossimi aggiornamenti, l'arrivo di Gemini Deep Research anche in Ricerca, NotebookLM, Finanza e un potenziamento all'interno della Gemini App.

PRESTAZIONI E BENCHMARK

Sul piano delle prestazioni, Gemini Deep Research ha raggiunto risultati di stato dell'arte su diversi benchmark di riferimento. Nei test pubblici, l'agente ha ottenuto il 46,4% sull'intero set di Humanity's Last Exam, il 66,1% su DeepSearchQA e il 59,2% su BrowseComp, confermandosi come la soluzione più avanzata dell'azienda per la ricerca web complessa. Il confronto tra i risultati pass@8 e pass@1 su un sottoinsieme di 200 prompt di DeepSearchQA evidenzia inoltre il valore dell'esplorazione di traiettorie parallele per la verifica delle risposte, dimostrando l'importanza di concedere all'agente più tempo di ragionamento e ricerca.

Il medio gamma che accontenta tutti? Nothing Phone (3a), compralo al miglior prezzo da Boomba.it a 275 euro.