Hermes Agent proxy conecta tu suscripción de Claude Pro (USD 20/mes) directamente con herramientas de código como Aider o Cline, sin que necesites una API key de Anthropic. La versión 0.60, publicada el 30 de marzo de 2026, sumó modo multi-agente con tres perfiles que corren en simultáneo y un servidor MCP que expone todo tu historial de conversaciones a clientes como VS Code o Cursor.
Hermes Agent es un proxy local que traduce sesiones OAuth de Claude Pro, ChatGPT Pro y SuperGrok en un endpoint compatible con la API de OpenAI, para que cualquier herramienta que acepte ese formato —Aider, Cline, Codex CLI, Continue, plugins de editor— pueda usar esos modelos sin necesidad de claves de API adicionales. Básicamente, tomás la suscripción que ya pagás, la exponés como si fuera un servicio API y chau límites artificiales. El proyecto es open source, se instala con un solo curl y no pide sudo.
En 30 segundos
- Hermes Agent v0.60 salió el 30 de marzo de 2026 con modo multi-agente, perfiles predefinidos y servidor MCP integrado.
- El proxy expone un endpoint local compatible con la API de OpenAI usando tu sesión OAuth de Claude Pro, ChatGPT Pro o SuperGrok, sin API keys.
- Funciona con Aider, Cline, Codex CLI, Continue y cualquier herramienta que acepte endpoints OpenAI-compatibles.
- Se instala con un solo comando curl en Linux, macOS o WSL2, sin dependencias previas ni sudo.
- Los perfiles multi-agente corren en simultáneo: Research monitorea tendencias, Writer redacta artículos, QA/SEO revisa y publica.
Claude es un modelo de lenguaje grande desarrollado por Anthropic, diseñado para mantener conversaciones, responder preguntas y asistir en tareas diversas. Se basa en técnicas de inteligencia artificial conversacional.
¿Qué herramientas soporta Hermes Agent proxy?
La lista de herramientas compatibles con Hermes Agent proxy creció bastante desde su lanzamiento hasta junio de 2026. El proxy expone un endpoint local —típicamente http://localhost:puerto— que utiliza el mismo formato que la API de OpenAI. Cualquier herramienta que acepte configurar un OPENAI_API_BASE personalizado se puede enganchar. No hay magia: es traducción de protocolos, bien hecho y sin rodeos.
Las herramientas confirmadas según el blog oficial de Hermes Agents son:
- Aider: el asistente de código en terminal que muchos usan para programar con IA. Configurás
OPENAI_API_BASEapuntando al proxy y listo. - Cline: extensión de VS Code para desarrollo asistido, también compatible vía endpoint OpenAI.
- Codex CLI: la herramienta de línea de comandos de OpenAI; irónico, pero funciona con Claude atrás del proxy.
- Continue: plugin de editor que se integra con varios modelos.
- Plugins de editor en general: cualquiera que permita setear un base URL alternativo para la API.
Ahora bien, el proxy no solo traduce requests. Lo interesante es que maneja la autenticación OAuth de los providers —Claude Pro, ChatGPT Pro, SuperGrok— y mantiene viva la sesión. Vos iniciás sesión una vez con hermes model y el proxy se encarga del resto. Si alguna vez tuviste que rotar API keys, revocar tokens vencidos o rezar para que el rate limit no te tire abajo una sesión de debugging de tres horas, sabés el valor de esto.
Eso sí: no todos los modelos están disponibles en todos los providers. Claude Pro te da acceso a Claude 4 y Claude 4 Opus; ChatGPT Pro a GPT-5 y o1; SuperGrok a Grok-3. El proxy no hace milagros con lo que no tenés contratado (y si esperabas que sí, tenemos que hablar de tus expectativas con el software libre). En nuestra guía completa de Claude profundizamos sobre esto.
¿Cómo instalar Hermes Agent en Linux o macOS?
Instalar Hermes Agent es un solo comando. No necesitás Python preinstalado, no necesitás clonar repositorios manualmente, no necesitás sudo. El script se encarga de todo: baja Python 3.11 si hace falta, clona el repo, configura el entorno y deja el binario hermes listo para usar. En Linux, macOS y WSL2 (Windows experimental, ojo con esto) funciona sin drama.
El comando de instalación, según la documentación oficial, es un curl directo al script de setup. Copiás, pegás, esperás unos minutos y ya tenés todo andando. La versión mínima para usar el proxy es la v0.14.0, pero a esta altura —junio de 2026— vas a estar instalando la v0.60 o superior directamente. Si arrastrabas una instalación vieja, hermes --version te saca de dudas en un segundo.
Un detalle que me gusta: el instalador no te llena el sistema de porquerías. Todo queda en el directorio de Hermes, sin paquetes globales, sin conflictos de dependencias con lo que ya tengas corriendo. Si alguna vez configuraste entornos de Python para machine learning y terminaste con seis versiones de PyTorch peleándose entre sí, esto te va a parecer un lujo.
¿Cómo configurar Hermes proxy para usar Claude Pro?
Pongámoslo en pasos concretos, que es como se entiende:
- Verificá la versión con
hermes --version. Necesitás v0.14.0 o superior. Si estás más abajo, actualizá. - Vinculá tu suscripción OAuth con
hermes model. El comando te va a pedir que elijas provider: Claude Pro, ChatGPT Pro o SuperGrok. Iniciás sesión en el browser, autorizás, y Hermes guarda la sesión OAuth. Nada de API keys. Nada de copiar tokens a mano. - Lanzá el proxy con
hermes proxy. Te devuelve un endpoint local, algo comohttp://localhost:8080. Ese URL es tu nueva API base. - Configurá la herramienta. En Aider, por ejemplo, seteás
OPENAI_API_BASE=http://localhost:8080. En Cline, mismo approach desde los settings del plugin. La variable de entornoOPENAI_API_KEYpuede ir con cualquier valor —el proxy no la valida, usa la sesión OAuth— pero muchas herramientas la piden igual; poné “hermes” y seguí.
El momento en que hacés el primer request y ves que Claude te responde desde Aider sin haber puesto una API key de Anthropic es raro. Es de esas cosas que técnicamente sabés que deberían funcionar pero igual te generan una satisfacción desproporcionada. La pregunta es: ¿por qué Anthropic no ofrece esto nativamente? Misterios del modelo de negocio.
¿Qué novedades trajo Hermes Agent v0.60?
El 30 de marzo de 2026, el equipo de Hermes Agent publicó la versión 0.60 y la verdad es que pegaron un salto grande. Venía siguiendo el proyecto desde la 0.14 y esta actualización cambió el perfil de la herramienta: pasó de ser “el proxy piola para usar Claude en Aider” a “plataforma multi-agente con servidor MCP integrado”. No es marketing, hay features concretas atrás del cambio.
Lo que metieron en esta versión:
- Modo multi-agente con perfiles: podés correr tres agentes en simultáneo —Research, Writer, QA/SEO— cada uno con su propia tarea y sin pisarse. No es un scheduler secuencial, corren en paralelo.
- MCP Server Mode: con
hermes mcp serveexponés toda la data de tus sesiones como servidor MCP, accesible desde Claude Desktop, Cursor, VS Code y cualquier cliente compatible. - Exportación de habilidades entre máquinas: configurás un agente en tu desktop, exportás la configuración, la importás en otro equipo. Útil si trabajás con múltiples entornos.
- Integración con Google Search Console vía MCP: los agentes pueden leer datos de Search Console directamente, sin pasos intermedios ni scripts custom.
Con esto, Hermes cerró bastante la brecha con OpenClaw, que venía más adelantado en orquestación multi-agente. La diferencia ahora es más de enfoque que de capacidades: Hermes sigue siendo más liviano, sin dependencias pesadas, y con una instalación que no te hace renegar.
El perfil Research monitorea Reddit y Hacker News, exporta trending topics cada 5 minutos. Writer lee ese JSON y redacta artículos de 800 a 1200 palabras con un estilo que podés configurar y que persiste entre sesiones —incluso commitea a Git. QA/SEO revisa keywords, meta descriptions, enlaces internos y publica directo a WordPress vía REST API. Todo eso corriendo al mismo tiempo, sin conflictos (y sin que tengas que armar un orquestador vos). Más contexto en comparativa detallada entre Sonnet y Opus.
¿Qué es el modo MCP server de Hermes Agent?
MCP —Model Context Protocol— es el estándar que Anthropic impulsó para que asistentes de IA accedan a datos externos. Hermes Agent ahora puede exponerse como servidor MCP, y esto cambia la dinámica de trabajo.
Con hermes mcp serve, tu instancia de Hermes se vuelve accesible desde Claude Desktop, Cursor o VS Code como una fuente de datos. Lo que exponés no es un modelo, es todo tu historial de conversaciones, sesiones y archivos adjuntos. Un cliente MCP puede navegar ese historial, buscar sesiones por palabra clave, recuperar fragmentos de conversaciones viejas y adjuntar archivos que hayas compartido antes. Es la capa de datos que faltaba entre el proxy y el ecosistema de herramientas MCP. No requiere código adicional, es un flag en el comando.
Ponele que hace tres semanas tuviste una conversación larguísima con Claude sobre la arquitectura de microservicios de un proyecto. Hoy necesitás recuperar un detalle de esa charla. En vez de scrollear por la interfaz web de Claude hasta el infinito, le pedís a Cursor —vía MCP— que busque en tus sesiones de Hermes por “microservicios” y te traiga el fragmento. Funciona. Lo probé, y safó mucho mejor de lo que esperaba (la búsqueda semántica no es perfecta, pero para búsquedas por keyword va bien).
¿Cómo funcionan los perfiles multi-agente?
Los tres perfiles que trae Hermes v0.60 de ejemplo no son un tutorial para mirar y olvidar. Son funcionales, corren en paralelo y cubren un pipeline de contenido completo. La arquitectura es simple: cada perfil es un agente independiente con su propio prompt system, sus propias herramientas y su propio schedule. Se comunican entre sí pasándose archivos JSON.
- Research: monitorea Reddit, Hacker News y otras fuentes. Cada 5 minutos exporta un JSON con trending topics, scores, fuentes y categorías. No es un scraper básico —filtra por relevancia, agrupa temas similares y descarta ruido.
- Writer: lee el JSON que dejó Research y redacta artículos de 800 a 1200 palabras. El estilo es configurable y se mantiene consistente entre sesiones. Los borradores se persisten en Git, así que tenés versionado de cada revisión.
- QA/SEO: toma el borrador de Writer, revisa keywords, meta descriptions, enlaces internos y optimización on-page. Si el artículo pasa el control, lo publica directo a WordPress vía REST API.
Tres agentes corriendo al mismo tiempo, cada uno con su suscripción de Claude Pro atrás del proxy, sin conflictos de rate limit porque Hermes gestiona las sesiones OAuth por separado. Si tenés una suscripción sola, los tres agentes la comparten; si tenés más de una, podés asignar suscripciones distintas a cada perfil. El overhead es mínimo, no necesitás GPU ni hardware especial (corre en CPU, y con 4 GB de RAM va sobrado). Tema relacionado: las capacidades y precios de Opus.
Tabla comparativa: suscripciones OAuth soportadas
| Suscripción | Precio mensual | Modelos disponibles | Tasa de requests | Ideal para |
|---|---|---|---|---|
| Claude Pro | USD 20 | Claude 4, Claude 4 Opus | Alta (sin límite rígido, sujeto a fair use) | Desarrollo, código, análisis técnico |
| ChatGPT Pro | USD 200 | GPT-5, o1, o1-mini | Muy alta, acceso prioritario | Investigación, tareas intensivas |
| SuperGrok | USD 30 | Grok-3 | Alta, sin rate limits declarados | Búsqueda en tiempo real, X/Twitter |

Los precios son los oficiales a junio de 2026. ChatGPT Pro es el más caro pero incluye acceso ilimitado a o1 y GPT-5 sin resto de rate limit serio. Claude Pro, por USD 20, tiene la mejor relación costo-beneficio si tu stack ya usa herramientas como Aider o Cline. SuperGrok está en un punto medio interesante si necesitás datos frescos de la web (Grok-3 tiene acceso a X/Twitter en tiempo real, que ni Claude ni ChatGPT ofrecen nativamente).
¿Cuáles son los requisitos para usar Hermes Agent?
Los requisitos son pocos pero hay que cumplirlos:
- Sistema operativo: Linux, macOS o WSL2. Windows nativo es experimental y no lo recomendaría para producción —las rarezas con networking en WSL2 ya conocemos todos cómo terminan.
- Suscripción activa: Claude Pro (USD 20/mes), ChatGPT Pro (USD 200/mes) o SuperGrok (USD 30/mes). Sin suscripción, Hermes no tiene sesión OAuth que traducir. También podés usar un endpoint propio si tenés uno, pero no es el caso de uso principal.
- Conexión a internet: para la autenticación OAuth inicial y, obvio, para que el proxy haga requests a los servidores de Anthropic, OpenAI o xAI.
- Hardware: no necesita GPU, no necesita RAM especial. Con 4 GB de RAM y un CPU moderno estás sobrado. El proxy en sí consume menos de 200 MB en idle.
No necesitás API keys de ningún provider. Ese es el punto central. La sesión OAuth es tu llave y Hermes la gestiona. Si tenés miedo de que te baneen la cuenta por usar un proxy, la postura oficial del proyecto —y la experiencia de usuarios hasta ahora— es que no hay problema mientras respetes los términos de uso del provider correspondiente (léase: no hagas cosas que no harías desde la interfaz web).
¿Hermes Agent es gratuito?
Sí, Hermes Agent es open source y gratuito. No tiene versión paga, no tiene tier enterprise escondido, no te cobra por feature. Lo que sí necesitás es una suscripción activa a uno de los providers OAuth soportados —Claude Pro, ChatGPT Pro o SuperGrok— porque Hermes no incluye acceso a los modelos, solo traduce la sesión que ya pagás. El costo real, entonces, es el de tu suscripción mensual más el tiempo que le dediques a configurarlo (spoiler: poco).
Si querés contribuir al proyecto, aceptan donaciones y contributions en GitHub, pero no hay paywall. Es uno de esos proyectos donde el modelo de negocio del creador no depende de venderte licencias —y se nota en lo limpio que está todo.
Errores comunes al usar Hermes Agent proxy
Después de ayudar a un par de colegas a debuggear sus setups, veo que los tropiezos se repiten. Acá van los tres más frecuentes: Ya lo cubrimos antes en cómo escalar Claude Code en proyectos grandes.
- No vincular la sesión OAuth antes de lanzar el proxy: hacés
hermes proxy, configurás Aider, todo parece andar, y el primer request falla con un error de autenticación pelado. El proxy levantó, sí, pero no tiene sesión que traducir. Primerohermes model, iniciás sesión, y recién despuéshermes proxy. El orden importa. - Dejar el puerto por defecto cuando ya está ocupado: si tenés otro servicio en el puerto que Hermes elige por defecto, el proxy falla sin mucha ceremonia. Fijate el output del comando, buscá el puerto asignado, y si necesitás cambiarlo, se puede configurar con un flag. No asumas que siempre es el mismo.
- Pensar que el proxy te da acceso ilimitado sin rate limits: Hermes traduce la sesión OAuth, no inventa requests mágicos. Si Anthropic, OpenAI o xAI te ratean desde la interfaz web, te van a ratear desde el proxy. La sesión OAuth hereda los mismos límites de fair use que tendrías usando el producto normalmente.
Un bonus: hay gente que intenta usar el proxy con una cuenta gratuita esperando que de repente se active la API. No, no funciona. Necesitás suscripción paga, sin excepciones. Hermes no crackea nada, solo expone lo que ya tenés.
Preguntas Frecuentes
¿Qué es Hermes Agent proxy y para qué sirve?
Hermes Agent proxy es un servidor local open source que convierte tu sesión OAuth de Claude Pro, ChatGPT Pro o SuperGrok en un endpoint compatible con la API de OpenAI. Sirve para usar esas suscripciones con herramientas de desarrollo como Aider, Cline o Codex CLI sin necesidad de pagar API keys adicionales. Instalás con un curl, vinculás tu cuenta, y el proxy expone un http://localhost:puerto que cualquier herramienta OpenAI-compatible entiende.
¿Cómo usar Claude Pro con Aider usando Hermes Agent?
Instalá Hermes Agent, vinculá tu suscripción de Claude Pro con hermes model, lanzá el proxy con hermes proxy y configurá Aider con la variable OPENAI_API_BASE apuntando al endpoint local del proxy. La API key podés setearla con cualquier valor porque el proxy no la valida —usa tu sesión OAuth. Listo, Aider empieza a usar Claude 4 u Opus según tu plan.
¿Cómo instalar Hermes Agent en Ubuntu?
Ejecutá el comando curl del script de instalación oficial en tu terminal de Ubuntu. No necesitás sudo, no necesitás instalar Python manualmente: el script se encarga de Python 3.11, clona el repositorio y configura todo. En dos o tres minutos tenés el binario hermes listo. Funciona en Ubuntu 22.04 y 24.04 sin problemas reportados.
¿Cómo configurar perfiles multi-agente en Hermes v0.60?
Los perfiles vienen predefinidos en la v0.60: Research monitorea Reddit y Hacker News exportando trending topics cada 5 minutos, Writer toma ese JSON y redacta artículos de 800 a 1200 palabras persistiendo en Git, QA/SEO revisa keywords y publica a WordPress vía REST API. Se activan desde el modo multi-agente de Hermes y corren en paralelo. Podés configurar el estilo de escritura, las fuentes de Research y los criterios de QA.
¿Hermes Agent necesita API key de Anthropic?
No. Hermes Agent usa sesiones OAuth, no API keys. Vinculás tu cuenta de Claude Pro (o ChatGPT Pro o SuperGrok) mediante autenticación en el navegador y el proxy traduce esa sesión a un endpoint compatible con la API de OpenAI. No generás, copiás ni rotás ninguna clave de API. Tu única credencial es la sesión activa del provider.
Conclusión
Hermes Agent pasó de ser “el proxy que zafa para usar Claude en Aider” a una plataforma multi-agente que resuelve pipelines completos. La v0.60 de marzo 2026 metió features que antes requerían tres herramientas separadas y un montón de glue code: orquestación multi-agente, servidor MCP, integración con Search Console. Todo con una instalación que sigue siendo un solo curl.
Para equipos de desarrollo en Latinoamérica, donde los USD 200 de ChatGPT Pro pueden ser un número importante pero los USD 20 de Claude Pro son accesibles, Hermes baja la barrera de entrada a tooling de IA serio sin sacrificar capacidades. No necesitás infraestructura cloud adicional, no necesitás GPU, no necesitás API keys: con una suscripción que probablemente ya estás pagando, armás un stack que hace unos meses era impensable sin presupuesto enterprise.
Lo que falta: Windows nativo sin WSL2 (sigue experimental), una GUI de configuración para los que no quieren tocar terminal (hay issues abiertos en GitHub sobre esto, pero no hay fecha), y benchmarks independientes del modo MCP contra soluciones pagas. Lo último es importante porque el ecosistema MCP está en pañales y los números de performance “en condiciones reales” todavía son escasos. Dicho esto, lo que hay funciona, y funciona bien.
