#37 - Avances en IA: Generación de Imágenes, Asistentes Conversacionales y Wearables

Resumen de innovaciones en IA: FLUX.1 redefine la generación de imágenes, Claude de Anthropic estrena memoria bajo demanda, Bing integra GPT-4o, Google lanza Guided Learning en Gemini y HTC presenta sus gafas inteligentes Vive Eagle.

Asier Rohde
September 29, 2025
3 min read

Avances en IA: Generación de Imágenes, Asistentes Conversacionales y Wearables

BFL y Krea AI Lanzan FLUX.1: Un Modelo Abierto para Imágenes Fotorrealistas

Black Forest Labs, en colaboración con Krea AI, ha lanzado FLUX.1 Krea [dev], un innovador modelo de generación de texto a imagen con pesos abiertos. Este modelo está diseñado para superar la estética sobresaturada comúnmente asociada a la IA, logrando un fotorrealismo y una diversidad visual excepcionales. A pesar de ser un modelo abierto, compite en rendimiento con soluciones cerradas. Su arquitectura flexible permite una personalización avanzada para diversas aplicaciones, demostrando el potencial de la colaboración entre laboratorios de modelos fundacionales y especialistas en IA aplicada para avanzar en el campo de la generación de imágenes de código abierto.

Claude de Anthropic Introduce Memoria de Conversación Bajo Demanda

Anthropic ha implementado una función de memoria para su chatbot Claude, disponible para usuarios de los planes Max, Team y Enterprise. Esta característica permite a los usuarios solicitar a la IA que busque y resuma conversaciones anteriores para dar continuidad a proyectos. A diferencia de la memoria persistente de competidores como ChatGPT, la de Claude funciona bajo demanda y no construye un perfil de usuario, marcando un enfoque distinto en la personalización y la privacidad. Este lanzamiento es un movimiento estratégico clave en la carrera competitiva contra OpenAI, buscando mejorar la retención de usuarios sin comprometer su control sobre los datos.

Bing Image Creator Integra GPT-4o Gratuitamente Junto a DALL-E 3

Microsoft ha anunciado una importante actualización para Bing Image Creator: la integración del avanzado modelo de generación de imágenes GPT-4o, disponible de forma gratuita para todos los usuarios. Esta novedad se suma al ya conocido modelo DALL-E 3, ampliando significativamente las opciones creativas y el control disponibles. La medida busca ofrecer mayor flexibilidad e inteligencia en la creación de contenido visual directamente desde el ecosistema de Bing y Copilot. Esta integración refuerza la estrategia de Microsoft de democratizar el acceso a herramientas de IA generativa de última generación, intensificando la competencia en el sector.

Google Lanza “Guided Learning” en Gemini para Fomentar el Aprendizaje Activo

Google ha introducido “Guided Learning” en su plataforma Gemini, una innovadora función diseñada para transformar la IA en un socio pedagógico. En lugar de ofrecer respuestas directas, la herramienta utiliza un enfoque socrático, planteando preguntas y proporcionando contenido multimodal —como diagramas y cuestionarios— para fomentar el pensamiento crítico y una comprensión profunda. Desarrollada sobre los modelos LearnLM de Google, que integran principios de las ciencias del aprendizaje, esta funcionalidad busca crear un espacio seguro y conversacional para que los estudiantes exploren temas a su propio ritmo, promoviendo un aprendizaje activo en lugar de uno pasivo.

HTC Entra a la Competencia de Gafas Inteligentes con las Vive Eagle

HTC ha ingresado al creciente mercado de las gafas inteligentes con el lanzamiento de las Vive Eagle, disponibles inicialmente en Taiwán. Este dispositivo compite directamente con las Ray-Ban de Meta y cuenta con un asistente de voz IA, una cámara ultra gran angular de 12MP y altavoces integrados. Su característica más destacada es la traducción de imágenes en tiempo real a 13 idiomas, impulsada por inteligencia artificial. Con un peso de solo 49 gramos y un precio aproximado de 520 USD, la entrada de HTC intensifica la competencia en el sector de los wearables con IA.