Google lanza Gemini 2: su nuevo modelo de IA multimodal

La próxima generación de IA que combina texto, imágenes y más.

Publicado por Jennifer Sofía Lugo Vega el 18 de mayo de 2025

Google ha presentado Gemini 2, su modelo de inteligencia artificial más avanzado hasta la fecha, diseñado para la era de los agentes autónomos. Este modelo multimodal es capaz de procesar y generar texto, imágenes, audio y video, ofreciendo una comprensión más profunda y una interacción más natural con los usuarios.

Multimodalidad y capacidades mejoradas

Gemini 2 puede recibir entradas en forma de texto, imágenes, audio y video, y generar respuestas en múltiples formatos, incluyendo texto, imágenes y audio. Esta capacidad permite una interacción más rica y flexible con la IA, facilitando tareas complejas y mejorando la experiencia del usuario. Además, el modelo ha sido optimizado para ofrecer respuestas más rápidas y precisas.

"Gemini 2 representa un gran paso adelante en la inteligencia artificial multimodal. Su capacidad para entender y generar diferentes tipos de contenido abre nuevas posibilidades en la forma en que interactuamos con la tecnología." — María Pérez, experta en IA y tecnología.

Integración y seguridad en el ecosistema Google

El nuevo modelo se integrará progresivamente en productos como Google Search, Android y YouTube, mejorando las funcionalidades existentes con capacidades avanzadas de IA. Google también ha implementado estrictas medidas de seguridad para garantizar el uso ético y seguro de Gemini 2, incluyendo herramientas para detectar y mitigar posibles abusos.

Introduciendo Gemini 2 Gemini 2 marca un nuevo horizonte en la inteligencia artificial multimodal, donde texto, imagen y sonido se entienden como uno solo.

Fuente(s): El País · Los 40