#17 - Análisis de innovaciones clave en Inteligencia Artificial
Un análisis de avances recientes en IA: la búsqueda semántica de Google, el futuro de las gafas de Meta, y la generación de música y vídeo con licencia comercial por ElevenLabs y Gemini.

- Asier Rohde
- 3 min read

Google optimiza la búsqueda web con IA
Google está probando en Search Labs la función “Web View”, que utiliza IA para organizar resultados de búsqueda en categorías temáticas. En lugar de una lista tradicional, la IA agrupa los enlaces para ofrecer una visión estructurada. Esta iniciativa busca mejorar la experiencia del usuario, permitiendo una comprensión rápida de temas complejos y representa un paso clave en la integración de la IA generativa en el núcleo de su buscador. La medida explora cómo la inteligencia artificial puede transformar fundamentalmente el acceso a la información, haciendo la navegación más intuitiva y eficiente.
La visión de futuro de Meta: Gafas de IA como estándar
Mark Zuckerberg, CEO de Meta, proyecta un futuro en el que las gafas con IA serán una tecnología indispensable, argumentando que no adoptarlas generará una desventaja significativa. Según su visión, estos dispositivos serán la interfaz principal para fusionar los mundos físico y digital. Esta fuerte apuesta de Meta no solo busca definir la próxima plataforma de hardware post-smartphone, sino que también subraya la importancia de la computación ambiental, donde la interacción con la inteligencia artificial se integra de forma continua y natural en la vida cotidiana.
ElevenLabs lanza generador de música IA con licencia comercial
La empresa especializada en audio IA, ElevenLabs, ha lanzado una herramienta para generar música mediante prompts de texto, destacando que su producción está completamente autorizada para uso comercial. Esta característica aborda directamente uno de los mayores desafíos legales de la IA generativa: la gestión de los derechos de autor. Al ofrecer una solución legalmente segura, ElevenLabs facilita a creadores de contenido, desarrolladores y anunciantes el acceso a una biblioteca musical personalizada y libre de riesgos, lo que podría acelerar la adopción de la IA en producciones profesionales.
Genie 3 de DeepMind: Un avance clave hacia la AGI
Google DeepMind presentó Genie 3, un “modelo de mundo” fundacional diseñado para ser un pilar en el camino hacia la Inteligencia Artificial General (AGI). A diferencia de los modelos que procesan texto, Genie 3 aprende y simula las dinámicas de un entorno a partir de datos de video, construyendo una comprensión interna de la causa y efecto. Esta capacidad para modelar un “mundo” es crucial para desarrollar sistemas de IA que puedan razonar, planificar y actuar con mayor autonomía, acercándose a las capacidades de una inteligencia similar a la humana.
Gemini de Google transforma imágenes estáticas en vídeo con IA
Google ha integrado en Gemini la capacidad de convertir fotografías en videoclips dinámicos mediante prompts de texto. Disponible para suscriptores Pro y Ultra, esta función multimodal permite animar elementos en una imagen y añadir instrucciones de audio. Google subraya su compromiso con la seguridad, implementando marcas de agua visibles (SynthID) en todo el contenido generado para garantizar la transparencia y prevenir el uso indebido. Esta innovación representa un paso significativo en la generación de contenido multimodal, expandiendo las herramientas creativas disponibles.