Headroom: cómo Netflix redujo un 92% el coste de sus agentes IA

2026-06-01 • Headroom • Netflix • compresión de contexto • tokens LLM • agentes IA • reducción de costes • MCP • open source • Alex Vicente

Tejas Chopra (Netflix) quemaba 200 dólares al día en tokens con sus agentes IA. No era un problema de modelo — era puro volumen de contexto. Cada llamada a herramienta, cada log, cada resultado de búsqueda se acumulaba hasta hacer inmanejable la ventana. Su solución: Headroom, una capa de compresión open source entre tu agente y el LLM.

Headroom comprime el contexto usando seis métodos según el tipo: AST para código (tree-sitter), SmartCrusher para JSON, y un modelo HuggingFace para prosa. Resultados reales: 17.765 → 1.408 tokens en búsqueda de código (92%). Coste: de 200 a 30 dólares diarios. Sin degradación en benchmarks de precisión.

Instala y activa con: npm install -g headroom-ai && headroom wrap claude