Google lanza Gemini 2.5 Computer Use: IA capaz de navegar por páginas web como si fueses tú mismo

La nueva IA Gemini 2.5 Computer Use de Google puede navegar por sitios web y realizar tareas en pantalla igual que un usuario humano

Con esta versión, Google busca que Gemini pueda desenvolverse en entornos reales, ejecutando comandos básicos como hacer "clic". Crédito: Lilgrapher | Shutterstock

09 Oct 2025, 12:49 PM EDT

Google ha presentado Gemini 2.5 Computer Use, un nuevo modelo de inteligencia artificial (IA) diseñado para navegar e interactuar con páginas web y aplicaciones tal como lo haría un humano.

Esta herramienta marca una evolución dentro del ecosistema de Gemini, al permitir que los agentes realicen tareas complejas directamente sobre interfaces visuales, haciendo clic, escribiendo o desplazándose en pantalla.

Hasta ahora, la mayoría de los modelos de IA limitaban su interacción a sistemas predefinidos. Con esta versión, Google busca que la IA pueda desenvolverse en entornos reales, donde es necesario interpretar y manipular gráficos, formularios o botones, igual que un usuario.

Cómo funciona Gemini 2.5 Computer Use

El modelo se basa en las capacidades de razonamiento visual de Gemini 2.5 Pro, lo que le permite entender el contexto visual de una interfaz y actuar en consecuencia. Puede visitar páginas web, desplazarse por ellas, rellenar formularios, hacer clic en enlaces, arrastrar y soltar elementos o incluso seleccionar opciones en menús desplegables.

Para realizar estas acciones, la IA utiliza la nueva herramienta ‘computer_use’ disponible en la API de Gemini. Este sistema recibe tres entradas principales:

La solicitud o instrucción del usuario
Una captura de pantalla del entorno visual
El historial de acciones recientes

Con esta información, el modelo determina qué acción ejecutar: hacer clic, escribir, desplazarse o solicitar confirmación antes de proceder, especialmente en tareas sensibles como compras o accesos privados.

Además, todas las acciones pasan por un sistema externo de evaluación de seguridad para prevenir usos indebidos.

Gemini 2.5 Computer Use está optimizado para navegadores web, aunque también puede controlar interfaz de usuario móvil. Sin embargo, Google aclara que aún no está preparado para manejar sistemas operativos de escritorio.

Nano Banana, el modelo de Gemini, es capaz de reconstruir fotos antiguas, arreglando detalles y reestructurando la estética.

Relacionado

Cómo editar fotos con Gemini: tips para cambiar fondos, ropa y expresiones

En esta nota

Google Inteligencia artificial

Astrología

Google lanza Gemini 2.5 Computer Use: IA capaz de navegar por páginas web como si fueses tú mismo

La nueva IA Gemini 2.5 Computer Use de Google puede navegar por sitios web y realizar tareas en pantalla igual que un usuario humano

Cómo funciona Gemini 2.5 Computer Use

Relacionado

Cómo editar fotos con Gemini: tips para cambiar fondos, ropa y expresiones

El Niño Prodigio: Horóscopo de hoy 14 marzo de 2026

“Podía ser su abuelo”: madre de inmigrante desmembrada habla tras arresto de esposo anciano en Queens, Nueva York

Powerball Double Play en vivo: resultados y ganadores del sábado 14 de marzo de 2026

Agencia Mundial Antidopaje analiza vetar a Donald Trump de los Juegos Olímpicos 2028

Familia de Renee Good, fallecida en un operativo migratorio en Minneapolis: “Va a ser un dolor constante”

El Niño Prodigio: Horóscopo de hoy 14 marzo de 2026

“Podía ser su abuelo”: madre de inmigrante desmembrada habla tras arresto de esposo anciano en Queens, Nueva York

Powerball Double Play en vivo: resultados y ganadores del sábado 14 de marzo de 2026

Agencia Mundial Antidopaje analiza vetar a Donald Trump de los Juegos Olímpicos 2028

Familia de Renee Good, fallecida en un operativo migratorio en Minneapolis: “Va a ser un dolor constante”