Google lancia Gemini Omni Flash: editing video con linguaggio naturale, già disponibile per AI Pro e Ultra

Maggio 19, 2026 - 22:19
0
Google lancia Gemini Omni Flash: editing video con linguaggio naturale, già disponibile per AI Pro e Ultra

Google ha annunciato ufficialmente Gemini Omni, una nuova famiglia di modelli pensata per la generazione e l'editing di video tramite linguaggio naturale. Il primo modello disponibile si chiama Gemini Omni Flash ed è già in rollout da oggi per tutti gli abbonati ai piani Google AI Pro e Ultra, oltre che gratuitamente per gli utenti di YouTube Shorts e dell'app YouTube Create. Non era un segreto: Gemini Omni era già trapelato nei giorni scorsi, ma ora è tutto ufficiale.

La promessa di fondo è ambiziosa: modificare un video come se stessi scrivendo in chat, aggiungendo istruzioni una dopo l'altra, senza perdere la coerenza della scena originale. I personaggi mantengono il loro aspetto, la fisica viene rispettata e il modello ricorda il contesto dei passaggi precedenti. Sulla carta suona bene, ma ovviamente solo una prova sul campo ci dirà se tutto questo regge davvero.

Le funzionalità principali ruotano attorno a tre concetti.

  1. Il primo è l'editing conversazionale: partendo da un video già girato, possiamo chiedere a Omni di cambiare l'azione, aggiungere personaggi o oggetti, modificare l'ambiente, l'inquadratura o lo stile visivo, tutto in più passaggi successivi.
  2. Il secondo è la generazione da input misti: il modello accetta immagini, testo, video e riferimenti audio (per ora solo voce) per produrre una clip coerente, utile ad esempio se vogliamo che un personaggio specifico appaia nel video finale.
  3. Il terzo è la creazione di video esplicativi a partire da brevi prompt, sfruttando la conoscenza di Gemini su storia, scienza e contesto culturale.

C'è anche una funzione avatar digitale: il modello può creare una versione digitale di se stessi, permettendo di generare video con il proprio aspetto e la propria voce. Google precisa che l'editing diretto di audio e parlato è ancora in fase di test, perché vogliono capire come renderlo disponibile in modo responsabile. Tutti i video generati includono la filigrana digitale SynthID e le credenziali C2PA, verificabili tramite l'app Gemini, Gemini su Chrome e la Ricerca Google.

Nelle prossime settimane Omni Flash arriverà anche agli sviluppatori e ai clienti aziendali via API, mentre nei prossimi mesi Google prevede di aggiungere il supporto per altri formati di output come immagini e audio. Tutto questo si inserisce in un ecosistema Gemini che continua ad espandersi rapidamente: la vera domanda è se la qualità dei video generati sarà all'altezza delle demo, o se ci ritroveremo con l'ennesimo strumento AI che funziona bene solo negli esempi scelti da Google.

L'articolo Google lancia Gemini Omni Flash: editing video con linguaggio naturale, già disponibile per AI Pro e Ultra sembra essere il primo su Smartworld.

Qual è la tua reazione?

Mi piace Mi piace 0
Antipatico Antipatico 0
Lo amo Lo amo 0
Comico Comico 0
Wow Wow 0
Triste Triste 0
Furioso Furioso 0
Redazione Eventi e News

Redazione Eventi e News in Italia

Commenti (0)

User