Project Genie: así es el prototipo de Google para crear mundos interactivos con una descripción
Google ...
Google ha anunciado el lanzamiento de Project Genie, un prototipo que combina la tecnología Genie 3, Nano Banana y Gemini para generar mundos interactivos con inteligencia artificial.
En agosto, Google DeepMind presentó el modelo Genie 3, capaz de generar entornos dinámicos más realistas con interacción en tiempo real durante varios minutos con una resolución de 720p, superando a su versión anterior, limitada a imágenes estáticas en 3D.
Tras estar restringido a los desarrolladores, Google ha optado por ofrecer a los usuarios la oportunidad de probar Genie 3 a través de Project Genie, un prototipo de generador de mundos que combina esta tecnología con la generación de imágenes de Nano Banana y el asistente de Gemini.
De esta forma, los usuarios pueden “vivir de primera mano las experiencias inmersivas de estos generadores de mundos”, ha explicado Google en su web. El director de Investigación de DeepMind, Shlomi Frutcher, explicó en una entrevista a TechCrunch que es “emocionante estar en un lugar donde más personas puedan acceder y dar su opinión”.
Project Genie funciona con tres características: un boceto del mundo, exploración y combinación de mundos. En primer lugar, Nano Banana Pro permite previsualizar el mundo en un boceto antes de generarlo a través de las indicaciones del usuario (creación del entorno, personajes, y el método para explorarlo, entre otros).
Una vez creado el mundo, el jugador puede explorarlo libremente gracias a la generación de entornos en tiempo real según las acciones del usuario. Por último, el jugador también puede reeditar y combinar mundos generados anteriormente para personalizarlos de nuevo.
Por el momento, Google ha limitado el uso de Project Genie a los suscriptores de Google AI Ultra en Estados Unidos, con una duración máxima de 60 segundos de generación y navegación. “La razón por la que lo limitamos a 60 segundos es porque queríamos que llegara a más usuarios”, ha matizado Fruchter. “Cuando lo usas, hay un chip en algún lugar que es solo tuyo y está dedicado a tu sesión”.
Además, Google ha avisado de que, al ser un prototipo, es posible que los mundos generados no parezcan “totalmente reales ni se adhieran siempre a las indicaciones”, el control de los personajes puede presentar fallos y puede haber una mayor latencia durante la experiencia.