Google porta il controllo completo del PC in Gemini 3.5 Flash
Gemini 3.5 Flash di Google è sempre più potente, e ora include direttamente la funzione Computer Use, quella che permette al modello di comprendere ed elaborare richieste complesse e di interagire con interfacce grafiche su browser, applicazioni desktop e dispositivi mobili. La funzione è già disponibile in anteprima attraverso la Gemini API e la piattaforma Gemini Enterprise Agent Platform.
Il funzionamento inizia con l'analisi di uno screenshot dell'interfaccia, in seguito al quale vengono suggerite azioni come clic del mouse, scorrimento delle pagine o digitazione da tastiera, mentre l'applicazione dello sviluppatore esegue tali operazioni, acquisisce una nuova schermata e la reinvia a Gemini fino al completamento del compito. Si tratta di un funzionamento a ciclo continuo.
Secondo Google, questa tecnologia può essere impiegata nell'inserimento automatico di dati nei moduli ai test delle applicazioni, fino alle attività di ricerca distribuite su più siti web e ai flussi di lavoro aziendali più articolati. A differenza della precedente versione, il supporto non si limita più principalmente ai browser, ma si estende anche agli ambienti desktop e mobile.
CLICCA QUI PER CONTINUARE A LEGGERE
Qual è la tua reazione?
Mi piace
0
Antipatico
0
Lo amo
0
Comico
0
Wow
0
Triste
0
Furioso
0
Commenti (0)