Proyecto Astra de Google: Guía para principiantes

Proyecto Astra de Google: Guía para principiantes

Google anunció ayer una serie de actualizaciones, incluido el modelo Gemini 2.0 Flash, Deep Research y más. Además, el gigante de las búsquedas presentó una vista previa de sus próximos agentes de inteligencia artificial, como Project Mariner, Project Astra y Jules. Google dijo que está mejorando el Proyecto Astra y que sus funciones se integrarán en la aplicación Gemini.

Además de eso, Google lanzó silenciosamente «Stream Realtime» en Google AI Studio, que funciona de manera muy similar al Proyecto Astra. La función está destinada a que los desarrolladores prueben la API, pero los usuarios generales también pueden utilizarla fácilmente y de forma gratuita. Puedes usar tu cámara para mostrar tu entorno y hablar con Gemini 2.0 en tiempo real. La mejor parte es que puedes compartir la pantalla de tu computadora portátil e interactuar usando voz en tiempo real.

La latencia se ha reducido significativamente y realmente parece que estás conversando con Gemini 2.0 en tiempo real. Puedes usar la cámara de tu teléfono inteligente o la cámara web de tu computadora portátil para mostrarle a Gemini lo que estás mirando. También puedes compartir tu pantalla en tu computadora portátil. A continuación te explicamos cómo puedes probar una vista previa de algo como el Proyecto Astra usando Google AI Studio.

  • Adelante y lanza aistudio.google.com/live en el navegador de tu móvil o portátil/escritorio.
  • Ahora, inicia sesión con tu cuenta de Google. Google AI Studio es gratuito para todos.
  • Después de eso, toque o haga clic en «Mostrar Gemini» y permita el permiso para usar su cámara y micrófono en vivo.
  • Ahora puedes mostrar tu entorno y hablar con Gemini 2.0 en tiempo real. Lo probé con mi teléfono inteligente e identificó correctamente mis placas Raspberry Pi en tiempo real.
  • Luego, en mi computadora portátil, compartí mi pantalla con Gemini 2.0 y funcionó bastante bien. Analizó mi pantalla y me dio algunas sugerencias mientras buscaba una computadora portátil. Eso es realmente genial.

Para obtener asistencia de codificación en tiempo real, la función de compartir pantalla puede resultar útil. ChatGPT ya puede ver tu pantalla en macOS, pero está limitado a unas pocas aplicaciones de codificación seleccionadas. OpenAI anunció previamente que Live Camera llegará a ChatGPT, pero hasta ahora no ha habido ninguna actualización oficial. Quizás, en medio de los anuncios en curso de “12 días de OpenAI”, la compañía podría lanzar Live Camera en ChatGPT.

Por cierto, Microsoft también está probando Copilot Vision, que puede ver su pantalla mientras navega por la web, pero nuevamente está limitado a unos pocos sitios web aprobados y está disponible solo para usuarios de acceso temprano.

En relación :  Dispositivo de transcripción AI elegante con plantillas de resumen

Con Stream Realtime, Google muestra algo muy parecido al Proyecto Astra. Por supuesto, el Proyecto Astra mejorado puede aprovechar datos de Google Maps, Google Lens y Búsqueda de Google en tiempo real para una experiencia aún más fluida, pero aún no está disponible. Yo diría que incluso sin acceso web en vivo, Stream Realtime es una excelente demostración de Project Astra. Quién sabe, Stream Realtime puede ser el Proyecto Astra detrás de escena.