Saltar al contenido
← Blog
Inteligencia Artificial9 de junio de 20268 min de lectura

Claude Fable 5: Mythos al alcance de todos

Anthropic lanzó Claude Fable 5, la versión pública de su modelo más avanzado. No es una actualización incremental — es un salto que cambia lo que puedes delegarle a una IA.

MM

softw.engineer

Software Engineer · softw.engineer

Claude Fable 5: Mythos al alcance de todos

Claude Fable 5: Mythos al alcance de todos

El 9 de junio de 2026, Anthropic hizo algo que llevaba meses prometiendo: poner su modelo más potente en manos de cualquier desarrollador. Claude Fable 5 es la versión pública de Claude Mythos 5, el modelo que hasta ahora solo estaba disponible para organizaciones de ciberseguridad a través de Project Glasswing. Y los números sugieren que no es marketing — es un salto real.

Qué es exactamente Fable 5

Fable 5 y Mythos 5 comparten la misma arquitectura base. La diferencia no está en la capacidad sino en los safeguards. Fable 5 tiene un sistema de clasificadores que detecta consultas en áreas sensibles — ciberseguridad, biología, química, destilación de modelos — y redirige esas peticiones a Claude Opus 4.8 en lugar de responderlas con el modelo completo. El usuario recibe una notificación cuando esto pasa.

Según Anthropic, menos del 5% de las sesiones activan el fallback. Es decir, en la práctica, la mayoría de desarrolladores reciben la experiencia completa de Mythos 5. Cuando el fallback ocurre, te facturan a tarifa de Opus 4.8, no de Fable.

Hay un detalle que me parece relevante: Anthropic está requiriendo retención de datos por 30 días para todo el tráfico de modelos clase Mythos, tanto en superficies propias como de terceros. Dicen que no usan esos datos para entrenar nuevos modelos, pero es una condición que puede incomodar a empresas reguladas. Es algo a tener en cuenta antes de integrarlo en workflows sensibles.

Los números que importan

Aquí está lo que realmente cambia respecto a la competencia:

SWE-bench Pro (tareas difíciles de ingeniería de software): Fable 5 alcanza 80.3%. Opus 4.8 queda en 69.2%. GPT-5.5 se queda en 58.6%. Esa diferencia de casi 22 puntos sobre GPT-5.5 no es marginal.

FrontierCode Diamond (Cognition, la gente detrás de Devin): Fable 5 obtiene 29.3%. Opus 4.8 tiene 13.4%. GPT-5.5 llega a 5.7%. Esto es un abismo.

Humanity's Last Exam (con herramientas): 64.5% para Fable, 57.9% para Opus, 52.2% para GPT-5.5.

Terminal-Bench 2.1: 88.0% vs 83.4% (GPT-5.5) y 70.7% (Gemini 3.1 Pro).

Lo que más me llama la atención es FrontierCode. No es solo que gane — es que gane por un factor de 5x sobre GPT-5.5 en un benchmark diseñado específicamente para medir coding autónomo de alta calidad. Scott Wu, CEO de Cognition, lo confirma: "Claude Fable 5 es el modelo con mayor puntuación en FrontierBench".

Andrej Karpathy lo describió como "state-of-the-art en todos los benchmarks relevantes por un margen" y "un salto comparable al que Opus 4.5 fue en noviembre". Cuando Karpathy dice algo así, vale la pena prestar atención.

Lo que está pasando en la vida real

Los benchmarks son una cosa. Lo que la gente hace con el modelo es otra.

Stripe lo probó en un codebase de 50 millones de líneas en Ruby. Hizo una migración completa en un día. El equipo estimó que manualmente les habría tomado más de dos meses. "Fable 5 comprimió meses de ingeniería en días", dijeron.

Simon Willison (creador de Datasette) lo usó durante 5.5 horas el día del lanzamiento. Construyó cpython-wasm — una librería que ejecuta Python completo en WebAssembly — partiendo de su proyecto micropython-wasm. También generó casi toda la versión 0.32a3 de su librería LLM. Su descripción: "Estoy realmente impresionado con la calidad de diseño de API, tests, código y documentación que Fable produjo. Pasé varias horas en esto, pero se siente como varios días de trabajo." Gastó $110.42 en tokens, dentro de su suscripción Max de $100/mes.

Willison también dice algo que me hace pensar: "La mejor forma de describir Fable es que se siente grande. No solo en velocidad y costo, sino en cuánto sabe." Especula que podría ser el modelo más grande lanzado por cualquier vendor hasta la fecha, basándose en la velocidad (61 tokens/segundo), el precio y la profundidad del conocimiento.

Replit reportó que Fable 5 es el modelo con mejor rendimiento en ViBench, su benchmark de "vibe-coding" extremo, y que construye apps en menos tiempo con menos tokens. Fabian Hedin, CTO de Replit: "Apps que hace un año requerían cien prompts, ahora las resuelve en uno."

Figma lo describió como "un salto claro en coding agéntico y prototipado." Rakuten destacó que "al máximo esfuerzo, Fable 5 reflexiona sobre y valida su propio trabajo."

Lo que Fable 5 hace diferente

Hay tres cosas que separan a Fable 5 de lo que vinimos viendo:

Memoria persistente basada en archivos. Fable 5 puede escribir notas en un archivo durante una tarea y consultarlas después. No es solo contexto largo — es memoria activa. En Slay the Spire, con esta configuración, su rendimiento mejoró 3 veces más que el de Opus 4.8 con el mismo setup. Llegó al acto final 3 veces más seguido. Para agentes que operan durante días o semanas — ops de ventas, migraciones de código, modelos financieros — esto cambia bastante.

1 millón de tokens de contexto, 128K de output. Y no cobra más por usar todo el contexto. Es el doble de lo que ofrece la mayoría de la competencia, y te permite pasar codebases enteros sin trocearlos.

Visión que funciona sin scaffolding. El caso de Pokémon FireRed es el ejemplo más llamativo: completó el juego entero usando solo capturas de pantalla, sin mapas ni herramientas de navegación. Modelos anteriores de Claude necesitaban un harness completo de herramientas para siquiera intentarlo. El punto no es jugar videojuegos — es que puede leer interfaces visuales complejas, recordar progreso y tomar decisiones a largo plazo. Eso aplica directamente a dashboards, PDFs, forms, apps legacy sin API.

El contexto que nadie menciona

Esto llega 12 días después de Opus 4.8 y 41 días después de Opus 4.7. La cadencia es agresiva. TechCrunch reportó que la recepción tibia de Opus 4.7 aceleró los planes de Anthropic, en un mercado donde OpenAI lanzó Codex y Google actualizó Gemini Flash casi simultáneamente.

Hay otro dato que VentureBeat contextualizó bien: Anthropic se filed para IPO el 1 de junio. Ocho días antes de este lanzamiento. No es casualidad — están mostrando músculo frente a inversores.

Pero lo que realmente importa es el modelo de acceso. Anthropic está probando algo que podría convertirse en estándar: un modelo, múltiples niveles de acceso, y restricciones específicas según el nivel de confianza del usuario. No todo para todos, pero tampoco negativas secas — redirección inteligente a un modelo menos potente cuando se detecta riesgo. Es una postura que a algunos les parecerá responsable y a otros les parecerá marketing de la preocupación. Los críticos ya cuestionan si el enfoque de Anthropic sobre los peligros de Mythos funciona también como posicionamiento comercial — la empresa que crea la capability y decide quién la usa.

Precios y disponibilidad

  • $10 por millón de tokens de entrada
  • $50 por millón de tokens de salida
  • Cache read: $1/1M tokens, cache write: $12.50/1M

Eso es exactamente el doble de Opus 4.8 ($5/$25) y menos de la mitad de Mythos Preview. Es el modelo más caro entre los principales vendors: el costo combinado de $60/1M tokens supera a GPT-5.5 ($35), Gemini 3.1 Pro ($14-$22) y Grok 4.3 ($3.75-$7.50).

Disponible desde hoy en claude.ai, Claude Code, la API (claude-fable-5) y todas las superficies de Anthropic. En planes de suscripción (Pro, Max, Team, Enterprise), Fable 5 está incluido sin costo adicional hasta el 22 de junio. Después, pasará a facturación por uso hasta que Anthropic tenga suficiente capacidad para restaurarlo como parte estándar de los planes.

Esa fecha límite del 22 de junio es inusual y sugiere que Anthropic no tiene la infraestructura para sostener la demanda. Es algo a vigilar.

Mi lectura

Para desarrolladores que ya están en el ecosistema Claude: pruébenlo antes del 22 de junio, que es gratis. Si hacen tareas de largo horizonte — migraciones, arquitectura, agentes autónomos — van a notar la diferencia. Willison no exagera cuando dice que Fable siente como días de trabajo comprimidos en horas.

Para los que evalúan herramientas de IA para coding: Fable 5 es, según los datos disponibles, el modelo frontier más capaz hoy para software engineering complejo. Los 22 puntos de ventaja sobre GPT-5.5 en SWE-bench Pro no son decoración.

Para tareas cortas y rutinarias, Opus 4.8 sigue siendo una opción excelente a la mitad del precio. Fable 5 es más lento (61 tok/s vs velocidades más altas en modelos más pequeños) y más caro. La elección depende del tipo de trabajo que delegues.

Lo que me queda dando vueltas es el modelo de acceso. Anthropic está construyendo un mundo donde la capacidad más peligrosa de la IA está disponible, pero solo para quien ellos decidan. Eso puede ser responsable. También puede ser un monopolio de la inteligencia. Probablemente sea ambas cosas.


Fuentes:

#Claude#Anthropic#IA#Coding#Agentes AI#Desarrollo#Fable 5

Compartir

¿Qué opinas?

Déjanos tu comentario o pregunta sobre este artículo.