Gemini Omni cambia la IA de Google

REVOLUCIÓN EN LA IA Google presentó en su I/O 2026 a Gemini Omni, un modelo que redefine la interacción con la inteligencia artificial, prometiendo generar contenido rico y preciso a partir de texto, imágenes, audio y video.

Este modelo es genuinamente diferente a los anteriores, ya que puede recibir múltiples tipos de entrada simultáneamente para producir resultados innovadores.

Lo que hace a Gemini Omni distinto

Gemini Omni es un modelo ‘nativamente multimodal’, lo que significa que puede procesar texto, imágenes, audio y video al mismo tiempo para generar contenido más avanzado.

El modelo llega integrado con el conocimiento y razonamiento de Gemini, lo que le permite entender el contexto, razonar sobre él y producir contenido relevante.

Crear, editar y clonarte: las superpotencias de Gemini Omni

Gemini Omni se destaca en tres áreas: generación de video multimodal, edición avanzada de videos existentes y la función Avatar, que permite generar videos usando la voz y apariencia del usuario.

La generación de video multimodal permite combinar instrucciones escritas, fotografías de referencia, música y clips previos para construir escenas realistas.

La edición avanzada de videos existentes puede modificar grabaciones en profundidad, desde cambiar el ángulo de cámara hasta generar personajes nuevos.

La función Avatar permite generar videos usando la voz, apariencia y estilo del usuario sin necesidad de grabarse frente a una cámara.

Disponibilidad de Google Gemini Omni

El acceso inicial a Gemini Omni Flash está disponible en la aplicación de Gemini, Google Flow y YouTube Shorts para usuarios con planes Google AI Plus, Pro y Ultra.

Google planea llevar algunas funciones de Omni a YouTube de forma gratuita en los próximos meses y abrirá APIs para desarrolladores y empresas.

Referencia de contenido: consultar fuente original aquí

Tags: google, inteligencia artificial