Google lancia Gemini Omni Flash: editing video con linguaggio naturale, già disponibile per AI Pro e Ultra

Google ha annunciato ufficialmente Gemini Omni, una nuova famiglia di modelli pensata per la generazione e l'editing di video tramite linguaggio naturale. Il primo modello disponibile si chiama Gemini Omni Flash ed è già in rollout da oggi per tutti gli abbonati ai piani Google AI Pro e Ultra, oltre che gratuitamente per gli utenti di YouTube Shorts e dell'app YouTube Create. Non era un segreto: Gemini Omni era già trapelato nei giorni scorsi, ma ora è tutto ufficiale.
La promessa di fondo è ambiziosa: modificare un video come se stessi scrivendo in chat, aggiungendo istruzioni una dopo l'altra, senza perdere la coerenza della scena originale. I personaggi mantengono il loro aspetto, la fisica viene rispettata e il modello ricorda il contesto dei passaggi precedenti. Sulla carta suona bene, ma ovviamente solo una prova sul campo ci dirà se tutto questo regge davvero.
Le funzionalità principali ruotano attorno a tre concetti.
- Il primo è l'editing conversazionale: partendo da un video già girato, possiamo chiedere a Omni di cambiare l'azione, aggiungere personaggi o oggetti, modificare l'ambiente, l'inquadratura o lo stile visivo, tutto in più passaggi successivi.
- Il secondo è la generazione da input misti: il modello accetta immagini, testo, video e riferimenti audio (per ora solo voce) per produrre una clip coerente, utile ad esempio se vogliamo che un personaggio specifico appaia nel video finale.
- Il terzo è la creazione di video esplicativi a partire da brevi prompt, sfruttando la conoscenza di Gemini su storia, scienza e contesto culturale.
C'è anche una funzione avatar digitale: il modello può creare una versione digitale di se stessi, permettendo di generare video con il proprio aspetto e la propria voce. Google precisa che l'editing diretto di audio e parlato è ancora in fase di test, perché vogliono capire come renderlo disponibile in modo responsabile. Tutti i video generati includono la filigrana digitale SynthID e le credenziali C2PA, verificabili tramite l'app Gemini, Gemini su Chrome e la Ricerca Google.
Nelle prossime settimane Omni Flash arriverà anche agli sviluppatori e ai clienti aziendali via API, mentre nei prossimi mesi Google prevede di aggiungere il supporto per altri formati di output come immagini e audio. Tutto questo si inserisce in un ecosistema Gemini che continua ad espandersi rapidamente: la vera domanda è se la qualità dei video generati sarà all'altezza delle demo, o se ci ritroveremo con l'ennesimo strumento AI che funziona bene solo negli esempi scelti da Google.
L'articolo Google lancia Gemini Omni Flash: editing video con linguaggio naturale, già disponibile per AI Pro e Ultra sembra essere il primo su Smartworld.
Qual è la tua reazione?
Mi piace
0
Antipatico
0
Lo amo
0
Comico
0
Wow
0
Triste
0
Furioso
0
Commenti (0)