En la Google I/O 2024, el gigante tecnológico presentó un nuevo asistente virtual llamado Project Astra, basado en el modelo de lenguaje Gemini. Este asistente puede analizar vídeo, voz y texto para responder a una amplia gama de preguntas.

El fin de Google Assistant parece estar cerca. Durante su conferencia Google I/O dedicada a sus innovaciones de software, Google anunció un nuevo asistente llamado, por ahora, Project Astra. Este asistente se basa, como era de esperar, en el modelo de lenguaje de la compañía estadounidense, Gemini. Gemini utiliza la potencia de computación de Google para analizar texto, voz e imágenes con el fin de proporcionar respuestas contextuales a cada pregunta que se le formule.

Un asistente siempre atento que ve lo que tú ves

Project Astra no se presentó en el escenario, sino a través de un vídeo grabado de una sola toma y sin editar, según los equipos de Google. Esta tecnología no es todavía un producto final, sino un proyecto en curso de Google DeepMind, el equipo responsable de la investigación en inteligencia artificial.

En este vídeo, podemos ver a una usuaria que activa el asistente de voz y luego abre la cámara de su smartphone. De este modo, Project Astra puede ver lo que ve la demostradora y proporcionarle respuestas a todas sus preguntas.

En los ejemplos mostrados, Project Astra era capaz de entender un fragmento de código grabado por la cámara y dar indicaciones para mejorarlo. También puede reconocer objetos o dar sugerencias en función de los elementos que tiene delante y de las preguntas que hace el usuario.

La cámara se utiliza para ayudarte y entender el contexto
La cámara se utiliza para ayudarte y entender el contexto

Un proyecto de investigación que prefigura las ambiciones de Google para los próximos años

Lo que es aún más impresionante es que Project Astra analiza una gran cantidad de datos mientras el teléfono se mueve de un lugar a otro, y en tiempo real. En el mismo vídeo, la usuaria pregunta dónde están sus gafas, y la inteligencia artificial es capaz de recordarle el lugar exacto donde las dejó.

Project Astra es solo una prueba de concepto y no se integrará en Android hasta dentro de varios meses, o incluso años. De hecho, se parece mucho a GPT-4o, el último modelo de lenguaje de OpenAI presentado el lunes 13 de mayo, y que tiene las mismas funcionalidades, con una voz que se podría calificar de más natural.

Sin embargo, antes de que eso ocurra, los usuarios podrán disfrutar de los avances de Google en el campo de la inteligencia artificial con la integración de Gemini en todos los servicios de Google, incluyendo el motor de búsqueda, Gmail y las aplicaciones de oficina de Google Workspace.

En resumen, Project Astra es una tecnología innovadora que tiene el potencial de revolucionar la forma en que interactuamos con nuestros dispositivos y con el mundo que nos rodea. Queda por ver cuándo estará disponible para el público, pero sin duda es una tecnología que merece la pena seguir de cerca.

Fuente: Conferencia Google I/O

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.