The Prompt API: IA local en Chrome sin cloud

The Prompt API Chrome es la interfaz de programación que Google integró en Chrome para que las extensiones del navegador puedan enviar solicitudes en lenguaje natural a Gemini Nano directamente en el dispositivo del usuario, sin mandar datos a servidores externos. Según la documentación oficial de Chrome, está disponible en Chrome 138 estable para extensiones, con soporte inicial en inglés.

En 30 segundos

  • The Prompt API Chrome corre Gemini Nano localmente: los datos del usuario nunca salen del dispositivo.
  • Disponible en Chrome 138 estable para extensiones; Chrome 140 suma soporte en español y japonés.
  • Solo funciona en desktop (Windows 10/11, macOS 13+, Linux, ChromeOS 16389+). No hay versión mobile.
  • Requiere mínimo 22 GB de almacenamiento libre para descargar el modelo.
  • Desde Chrome 138 en Early Preview Program, acepta audio e imágenes como entrada, no solo texto.

¿Qué es The Prompt API?

The Prompt API es una API experimental de Chrome que permite a las extensiones del navegador interactuar con Gemini Nano, el modelo de lenguaje de Google que corre directamente en el dispositivo del usuario. La idea central es que podés agregar capacidades de IA a una extensión sin que ningún dato viaje a un servidor externo.

Esto es diferente de usar la API de Gemini en la nube. Ahí, cada prompt que mandás sale de tu máquina, pasa por un servidor de Google, se procesa y vuelve. Acá, el modelo vive en el hardware del usuario. El procesamiento ocurre en el cliente (por eso se llama “client-side inference”) y la respuesta llega sin pasar por ningún backend.

Lo que no hace The Prompt API, al menos por ahora: no está disponible para sitios web comunes. Está limitada a Chrome Extensions. Si querés probarla en una página web directa, todavía no podés (salvo que uses el playground oficial en chrome.dev).

Cómo funciona The Prompt API Chrome

El flujo es bastante directo. Tenés una extensión de Chrome, el usuario interactúa con ella, la extensión llama a la API con un prompt en lenguaje natural, Gemini Nano procesa ese texto localmente y devuelve una respuesta. Todo eso pasa en el mismo dispositivo, sin conexión a ningún servicio externo.

¿Y qué tan rápido es comparado con una API cloud? Acá viene lo bueno: la latencia es prácticamente cero en términos de red, porque no hay red involucrada. El tiempo de respuesta depende del hardware del usuario, pero al no tener el viaje de ida y vuelta a un servidor, en dispositivos decentes la experiencia es notablemente más fluida.

Gemini Nano es el modelo base. No es el modelo más potente de la familia Gemini (eso sería Gemini Ultra o Pro), pero está optimizado para correr en hardware de consumo. La elección tiene sentido: si querés meter un modelo en el navegador de millones de personas con GPUs de gama media, necesitás algo eficiente.

Requisitos del sistema

Antes de ponerte a buildear algo con esto, fijate que los requisitos no son triviales.

  • Sistema operativo: Windows 10 u 11, macOS 13 (Ventura) o superior, Linux, o ChromeOS desde la plataforma 16389.0.0
  • Chrome: versión 138 estable para extensiones con soporte en inglés
  • Almacenamiento: mínimo 22 GB libres (el modelo ocupa bastante)
  • Dispositivo: exclusivo para desktop. No funciona en mobile.

El requisito de 22 GB de almacenamiento libre es el que más va a filtrar usuarios reales. No todo el mundo tiene ese espacio disponible, y en laptops de gama baja con SSDs pequeños eso puede ser un bloqueante.

Chrome descarga y administra el modelo de forma automática cuando la extensión lo solicita por primera vez. El usuario no tiene que instalar nada manualmente, pero sí tiene que tener el espacio disponible.

Capacidades multimodales: texto, imágenes y audio

Desde Chrome 138 en el Early Preview Program, The Prompt API acepta imágenes y audio como entrada, con texto como salida. Esto expande bastante lo que podés hacer con ella.

Ponele que querés construir una extensión que extrae información de contacto a partir de una captura de pantalla de un sitio web. Con la versión solo texto, tendrías que parsear el DOM y armar el texto vos mismo. Con soporte de imágenes, podés pasarle directamente la imagen y pedirle que encuentre el nombre, teléfono y email.

Lo mismo aplica para audio: análisis de transcripciones, detección de idioma, resumen de contenido hablado. Son casos de uso que antes requerían sí o sí una API externa.

Eso sí: esta capacidad multimodal está en Early Preview Program, no en estable. La diferencia importa. Las APIs del programa de vista previa pueden cambiar o desaparecer sin previo aviso. Si estás buildiendo algo para producción, usá solo lo que está en stable.

Casos de uso prácticos

La documentación oficial lista varios escenarios donde The Prompt API Chrome encaja bien, y son bastante concretos:

  • Responder preguntas sobre el contenido de una página: la extensión extrae el texto visible y lo pasa como contexto al modelo para que el usuario pueda hacer preguntas sobre lo que está leyendo.
  • Feeds de noticias personalizados: clasificar artículos con categorías definidas por el usuario, sin enviar los títulos a ningún servidor.
  • Filtros de contenido: analizar artículos y ocultar contenido según temas que el usuario configure.
  • Extracción de contactos: detectar nombre, email y teléfono en páginas de empresas y agregarlos directamente a una lista.
  • Creación de eventos en calendario: extraer fecha, hora y lugar de una página de evento y preparar la entrada para el calendario del usuario.

Un ejemplo real: CyberAgent usó la API para construir herramientas de asistencia para blogueros, permitiendo que los usuarios obtengan sugerencias de escritura y edición directamente en el navegador sin exponer el contenido de sus borradores a ningún servicio externo.

Si querés experimentar sin construir una extensión, existe el playground oficial de Chrome Dev donde podés probar la API directamente.

Disponibilidad y soporte de idiomas

El estado actual, resumido:

Versión ChromeEstadoIdiomas soportadosMultimodal
Chrome 138 (estable)Disponible para extensionesInglésNo (solo texto)
Chrome 138 (Early Preview)PreviewInglésSí (imágenes + audio)
Chrome 140+PlanificadoInglés, español, japonésPor confirmar
the prompt api chrome diagrama explicativo

El soporte en español llega con Chrome 140. Para quienes desarrollan extensiones orientadas a usuarios hispanohablantes (que es casi todo Latinoamérica), ese es el número que hay que tener en mente. Antes de Chrome 140, las respuestas en español pueden no ser confiables.

¿Alguien verificó cómo se comporta Gemini Nano en español antes de Chrome 140? Los reportes en comunidades de desarrollo sugieren que entiende español pero responde mejor en inglés. Tomalo con pinzas hasta que llegue el soporte oficial.

Privacidad y procesamiento local: la diferencia que importa

Comparemos las dos opciones en términos concretos:

AspectoAPI Cloud (ej. Gemini API)The Prompt API (local)
Datos del usuarioSe envían al servidorPermanecen en el dispositivo
Latencia de redSí (ida y vuelta)No hay
Costo por requestSí (tokens facturados)Gratuito
Disponibilidad offlineNoSí (una vez descargado el modelo)
Calidad del modeloAlta (modelos grandes)Media (Gemini Nano, modelo chico)
Setup requeridoAPI key + request HTTPChrome 138+ + 22 GB libres

Para extensiones que manejan datos sensibles, el procesamiento local es una ventaja que no se puede ignorar. Un gestor de contraseñas que analiza qué campos llenar, una herramienta de escritura que accede a borradores privados, un asistente médico que lee historial clínico: todos son casos donde enviar datos a un servidor externo genera fricción legal y de confianza.

El modelo local no es tan potente como Gemini Pro o Ultra, y eso hay que tenerlo en cuenta. Para tareas de razonamiento complejo o generación larga, la API cloud sigue siendo la opción. Pero para clasificación, extracción, resumen corto y análisis básico, Gemini Nano zafa bien.

Lo que está confirmado y lo que no

Confirmado

  • Chrome 138 estable incluye The Prompt API para extensiones, con soporte en inglés.
  • Requiere 22 GB de almacenamiento libre y desktop (Windows 10/11, macOS 13+, Linux, ChromeOS 16389+).
  • Chrome 138 en Early Preview Program soporta imágenes y audio como entrada.
  • Chrome 140 suma soporte oficial en español y japonés.
  • CyberAgent ya implementó la API en producción para herramientas de blogueros.

No confirmado / pendiente

  • Fecha exacta de Chrome 140 (se espera para mediados de 2026, pero no hay anuncio oficial de fecha).
  • Si el soporte multimodal llegará a stable o quedará en preview.
  • Compatibilidad con sitios web directos (actualmente solo extensiones).
  • Rendimiento específico en español comparado con inglés antes del soporte oficial en Chrome 140.

Errores comunes al usar The Prompt API

Asumir que funciona en cualquier dispositivo

The Prompt API no funciona en mobile, punto. Si tu extensión tiene usuarios en Android o iOS, necesitás un fallback. Lo peor que podés hacer es no detectar si la API está disponible antes de llamarla. La documentación recomienda siempre verificar disponibilidad antes de intentar usar el modelo.

Usar APIs de Early Preview en producción

Las APIs marcadas como “Early Preview Program” pueden cambiar de interfaz o desaparecer sin aviso. El soporte multimodal (imágenes y audio) está en ese estado hoy. Si buildaste algo que depende de eso y mañana Chrome cambia la firma de la función, tu extensión se rompe y no hay preaviso.

Esperar calidad de modelo cloud en un modelo local

Gemini Nano es un modelo optimizado para eficiencia, no para máxima precisión. Pedirle que genere un análisis de 2000 palabras o que resuelva razonamiento en varios pasos no es su punto fuerte. Para extracción de datos simples, clasificación y resúmenes cortos funciona bien. Para tareas que requieren razonamiento complejo, la API cloud sigue siendo necesaria. Definí bien qué tarea va cada uno antes de arrancar a desarrollar.

Ignorar el modelo de descarga del modelo

La primera vez que una extensión solicita el modelo, Chrome lo descarga en background. Eso lleva tiempo. Si tu extensión espera que el modelo esté disponible inmediatamente en la primera instalación, el usuario va a ver errores o tiempos de carga raros. Hay que manejar el estado de descarga del modelo explícitamente en la lógica de la extensión.

Preguntas Frecuentes

¿Qué es The Prompt API?

The Prompt API es una interfaz de Chrome que permite a las extensiones del navegador enviar prompts en lenguaje natural a Gemini Nano, el modelo de IA de Google que corre localmente en el dispositivo del usuario. No requiere conexión a servidores externos y está disponible en Chrome 138 para escritorio.

¿Dónde está disponible The Prompt API?

Está disponible en Chrome 138 estable para extensiones del navegador, solo en dispositivos desktop con Windows 10/11, macOS 13 o superior, Linux o ChromeOS desde la plataforma 16389. No funciona en navegadores móviles ni en Firefox o Safari, y tampoco está disponible para páginas web comunes (solo extensiones).

¿Cómo funciona Gemini Nano en Chrome?

Chrome descarga Gemini Nano en el dispositivo del usuario cuando una extensión lo solicita por primera vez. A partir de ahí, el modelo procesa los prompts localmente sin enviar datos a ningún servidor. El usuario necesita al menos 22 GB de almacenamiento libre para que la descarga del modelo pueda completarse.

¿Qué requisitos del sistema tiene The Prompt API?

Requiere Chrome 138 o superior, un dispositivo desktop (no funciona en mobile), sistema operativo Windows 10/11, macOS 13+, Linux o ChromeOS 16389+, y mínimo 22 GB de almacenamiento libre. Chrome gestiona la descarga del modelo automáticamente, pero sin ese espacio disponible la API no puede inicializarse.

¿Cuál es la diferencia entre The Prompt API y servicios cloud?

Con una API cloud, cada prompt que enviás viaja a un servidor externo, se procesa allá y vuelve (con latencia, costo por token y datos fuera del dispositivo). The Prompt API procesa todo en el hardware del usuario: sin datos enviados, sin costo por request y con funcionamiento offline. La contrapartida es que Gemini Nano es menos potente que los modelos cloud para tareas complejas.

Conclusión

The Prompt API Chrome resuelve un problema real: cómo agregarle IA a una extensión del navegador sin que eso implique mandar datos de los usuarios a un servidor externo. Para extensiones que tocan contenido sensible (documentos, borradores, datos de contacto), esa diferencia es concreta y valiosa.

El modelo base (Gemini Nano) tiene límites claros, y el requisito de 22 GB va a quedar fuera del alcance de una parte de los usuarios. Pero para el segmento correcto de casos de uso, esta API es la opción más limpia disponible hoy en un navegador de escritorio.

Si estás desarrollando extensiones de Chrome en 2026 y necesitás IA sin dependencias externas, Chrome 138 ya tiene lo que necesitás en inglés. Si tu audiencia es hispanohablante, el soporte oficial en español llega con Chrome 140, que es cuando tiene sentido apostar fuerte en esta dirección. Si además necesitás infraestructura web confiable para el backend de tus proyectos, donweb.com es una opción local para alojar lo que sí requiere servidor.

Fuentes

Desplazarse hacia arriba