<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>LLM优化 on AI</title>
        <link>https://ai.programnotes.cn/tags/llm%E4%BC%98%E5%8C%96/</link>
        <description>Recent content in LLM优化 on AI</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-CN</language>
        <lastBuildDate>Fri, 05 Jun 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://ai.programnotes.cn/tags/llm%E4%BC%98%E5%8C%96/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>GitHub Trending #1：chopratejas/headroom —— AI Agent 上下文压缩层，Token 用量直降 60-95%</title>
        <link>https://ai.programnotes.cn/p/github-trending-%231chopratejas/headroom-ai-agent-%E4%B8%8A%E4%B8%8B%E6%96%87%E5%8E%8B%E7%BC%A9%E5%B1%82token-%E7%94%A8%E9%87%8F%E7%9B%B4%E9%99%8D-60-95/</link>
        <pubDate>Fri, 05 Jun 2026 00:00:00 +0000</pubDate>
        
        <guid>https://ai.programnotes.cn/p/github-trending-%231chopratejas/headroom-ai-agent-%E4%B8%8A%E4%B8%8B%E6%96%87%E5%8E%8B%E7%BC%A9%E5%B1%82token-%E7%94%A8%E9%87%8F%E7%9B%B4%E9%99%8D-60-95/</guid>
        <description>&lt;h2 id=&#34;项目概览&#34;&gt;项目概览
&lt;/h2&gt;&lt;p&gt;&lt;strong&gt;仓库&lt;/strong&gt;：&lt;a class=&#34;link&#34; href=&#34;https://github.com/chopratejas/headroom&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;chopratejas/headroom&lt;/a&gt;&lt;br&gt;
&lt;strong&gt;语言&lt;/strong&gt;：Python 76.9% · Rust 18.3% · TypeScript 2.7%&lt;br&gt;
&lt;strong&gt;Stars&lt;/strong&gt;：13,522（今日新增 +3,142）&lt;br&gt;
&lt;strong&gt;Forks&lt;/strong&gt;：858&lt;br&gt;
&lt;strong&gt;许可证&lt;/strong&gt;：Apache 2.0&lt;br&gt;
&lt;strong&gt;最新版本&lt;/strong&gt;：v0.23.0（2026-06-04）&lt;/p&gt;
&lt;p&gt;在 AI Agent 遍地开花的今天，一个绕不开的痛点是 &lt;strong&gt;Token 成本&lt;/strong&gt;。Agent 每执行一次工具调用，返回的原始输出动辄数万 token —— JSON 响应、日志堆栈、代码搜索结果、RAG 文本块，这些数据在进入 LLM 上下文窗口之前几乎不做任何筛选。headroom 正是为了解决这个问题而生：它是一个运行在本地、对 LLM 完全透明的&lt;strong&gt;上下文压缩层&lt;/strong&gt;，在内容进入模型之前自动瘦身，实测可节省 &lt;strong&gt;47-92%&lt;/strong&gt; 的 token 用量，且关键基准测试的准确率没有降低。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;核心架构&#34;&gt;核心架构
&lt;/h2&gt;&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt; 1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 4
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 5
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 6
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 7
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 8
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 9
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;10
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;11
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;12
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;13
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;14
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;15
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;16
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;17
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-gdscript3&#34; data-lang=&#34;gdscript3&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;err&#34;&gt;你的&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;Agent&lt;/span&gt; &lt;span class=&#34;o&#34;&gt;/&lt;/span&gt; &lt;span class=&#34;err&#34;&gt;应用&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;  &lt;span class=&#34;p&#34;&gt;(&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;Claude&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;Code&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;Cursor&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;Codex&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;LangChain&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;Agno&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;Strands&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt; &lt;span class=&#34;err&#34;&gt;你自己的代码…&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;       &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;  &lt;span class=&#34;n&#34;&gt;prompts&lt;/span&gt; &lt;span class=&#34;err&#34;&gt;·&lt;/span&gt; &lt;span class=&#34;k&#34;&gt;tool&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;outputs&lt;/span&gt; &lt;span class=&#34;err&#34;&gt;·&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;logs&lt;/span&gt; &lt;span class=&#34;err&#34;&gt;·&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;RAG&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;results&lt;/span&gt; &lt;span class=&#34;err&#34;&gt;·&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;files&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;       &lt;span class=&#34;err&#34;&gt;▼&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;   &lt;span class=&#34;err&#34;&gt;┌────────────────────────────────────────────────────┐&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;   &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;  &lt;span class=&#34;n&#34;&gt;Headroom&lt;/span&gt;   &lt;span class=&#34;p&#34;&gt;(&lt;/span&gt;&lt;span class=&#34;err&#34;&gt;本地运行&lt;/span&gt; &lt;span class=&#34;err&#34;&gt;—&lt;/span&gt; &lt;span class=&#34;err&#34;&gt;数据不出你的机器&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;)&lt;/span&gt;            &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;   &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;  &lt;span class=&#34;err&#34;&gt;────────────────────────────────────────────────&lt;/span&gt;  &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;   &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;  &lt;span class=&#34;n&#34;&gt;CacheAligner&lt;/span&gt;  &lt;span class=&#34;err&#34;&gt;→&lt;/span&gt;  &lt;span class=&#34;n&#34;&gt;ContentRouter&lt;/span&gt;  &lt;span class=&#34;err&#34;&gt;→&lt;/span&gt;  &lt;span class=&#34;n&#34;&gt;CCR&lt;/span&gt;            &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;   &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;                    &lt;span class=&#34;err&#34;&gt;├─&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;SmartCrusher&lt;/span&gt;   &lt;span class=&#34;p&#34;&gt;(&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;JSON压缩&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;)&lt;/span&gt;    &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;   &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;                    &lt;span class=&#34;err&#34;&gt;├─&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;CodeCompressor&lt;/span&gt; &lt;span class=&#34;p&#34;&gt;(&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;AST感知&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;)&lt;/span&gt;     &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;   &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;                    &lt;span class=&#34;err&#34;&gt;└─&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;Kompress&lt;/span&gt;&lt;span class=&#34;o&#34;&gt;-&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;base&lt;/span&gt;  &lt;span class=&#34;p&#34;&gt;(&lt;/span&gt;&lt;span class=&#34;err&#34;&gt;文本，&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;HF模型&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;)&lt;/span&gt; &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;   &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;                                                    &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;   &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;  &lt;span class=&#34;err&#34;&gt;跨&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;Agent记忆&lt;/span&gt;  &lt;span class=&#34;err&#34;&gt;·&lt;/span&gt;  &lt;span class=&#34;n&#34;&gt;headroom&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;learn&lt;/span&gt;  &lt;span class=&#34;err&#34;&gt;·&lt;/span&gt;  &lt;span class=&#34;n&#34;&gt;MCP&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;Server&lt;/span&gt;     &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;   &lt;span class=&#34;err&#34;&gt;└────────────────────────────────────────────────────┘&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;       &lt;span class=&#34;err&#34;&gt;│&lt;/span&gt;  &lt;span class=&#34;err&#34;&gt;压缩后的&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;prompt&lt;/span&gt; &lt;span class=&#34;o&#34;&gt;+&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;retrieval&lt;/span&gt; &lt;span class=&#34;k&#34;&gt;tool&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;       &lt;span class=&#34;err&#34;&gt;▼&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;n&#34;&gt;LLM&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;Provider&lt;/span&gt;  &lt;span class=&#34;p&#34;&gt;(&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;Anthropic&lt;/span&gt; &lt;span class=&#34;err&#34;&gt;·&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;OpenAI&lt;/span&gt; &lt;span class=&#34;err&#34;&gt;·&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;Bedrock&lt;/span&gt; &lt;span class=&#34;err&#34;&gt;·&lt;/span&gt; &lt;span class=&#34;err&#34;&gt;…&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id=&#34;关键组件&#34;&gt;关键组件
&lt;/h3&gt;&lt;table&gt;
	&lt;thead&gt;
			&lt;tr&gt;
					&lt;th&gt;组件&lt;/th&gt;
					&lt;th&gt;功能&lt;/th&gt;
			&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;strong&gt;ContentRouter&lt;/strong&gt;&lt;/td&gt;
					&lt;td&gt;自动检测内容类型（JSON/代码/文本/日志），分派最优压缩器&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;strong&gt;SmartCrusher&lt;/strong&gt;&lt;/td&gt;
					&lt;td&gt;通用 JSON 压缩：折叠数组、嵌套对象和混合类型&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;strong&gt;CodeCompressor&lt;/strong&gt;&lt;/td&gt;
					&lt;td&gt;AST 感知压缩，支持 Python / JS / Go / Rust / Java / C++&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;strong&gt;Kompress-base&lt;/strong&gt;&lt;/td&gt;
					&lt;td&gt;基于 HuggingFace 的专用压缩模型，用 Agent 轨迹训练&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;strong&gt;CacheAligner&lt;/strong&gt;&lt;/td&gt;
					&lt;td&gt;稳定前缀引擎，使 Provider KV 缓存真正命中&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;strong&gt;CCR&lt;/strong&gt;（可逆压缩）&lt;/td&gt;
					&lt;td&gt;原始内容存本地，LLM 可通过 &lt;code&gt;headroom_retrieve&lt;/code&gt; 按需取回&lt;/td&gt;
			&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
&lt;hr&gt;
&lt;h2 id=&#34;五种使用模式&#34;&gt;五种使用模式
&lt;/h2&gt;&lt;p&gt;headroom 的设计哲学是「零摩擦接入」，提供从一行代码到一条命令的多层接入方式：&lt;/p&gt;
&lt;table&gt;
	&lt;thead&gt;
			&lt;tr&gt;
					&lt;th&gt;模式&lt;/th&gt;
					&lt;th&gt;使用方式&lt;/th&gt;
					&lt;th&gt;适用场景&lt;/th&gt;
			&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;strong&gt;Library（库）&lt;/strong&gt;&lt;/td&gt;
					&lt;td&gt;&lt;code&gt;compress(messages)&lt;/code&gt; — Python / TypeScript 内联调用&lt;/td&gt;
					&lt;td&gt;已有代码集成&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;strong&gt;Proxy（代理）&lt;/strong&gt;&lt;/td&gt;
					&lt;td&gt;&lt;code&gt;headroom proxy --port 8787&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;零代码改动，任意语言&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;strong&gt;Agent wrap&lt;/strong&gt;&lt;/td&gt;
					&lt;td&gt;&lt;code&gt;headroom wrap claude|codex|cursor|aider|copilot&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;开箱即用&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;strong&gt;MCP Server&lt;/strong&gt;&lt;/td&gt;
					&lt;td&gt;&lt;code&gt;headroom_compress&lt;/code&gt; / &lt;code&gt;headroom_retrieve&lt;/code&gt; / &lt;code&gt;headroom_stats&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;MCP 生态原生支持&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;strong&gt;SDK 中间件&lt;/strong&gt;&lt;/td&gt;
					&lt;td&gt;&lt;code&gt;withHeadroom(new Anthropic())&lt;/code&gt; / &lt;code&gt;wrapLanguageModel(...)&lt;/code&gt;&lt;/td&gt;
					&lt;td&gt;框架级别集成&lt;/td&gt;
			&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;支持的 Agent 矩阵：&lt;/p&gt;
&lt;table&gt;
	&lt;thead&gt;
			&lt;tr&gt;
					&lt;th&gt;Agent&lt;/th&gt;
					&lt;th&gt;支持&lt;/th&gt;
					&lt;th&gt;特性&lt;/th&gt;
			&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
			&lt;tr&gt;
					&lt;td&gt;Claude Code&lt;/td&gt;
					&lt;td&gt;●&lt;/td&gt;
					&lt;td&gt;&lt;code&gt;--memory&lt;/code&gt; · &lt;code&gt;--code-graph&lt;/code&gt;&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;OpenAI Codex&lt;/td&gt;
					&lt;td&gt;●&lt;/td&gt;
					&lt;td&gt;与 Claude 共享记忆&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;Cursor&lt;/td&gt;
					&lt;td&gt;●&lt;/td&gt;
					&lt;td&gt;打印配置 — 粘贴一次即可&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;Aider&lt;/td&gt;
					&lt;td&gt;●&lt;/td&gt;
					&lt;td&gt;启动代理 + 启动 Aider&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;GitHub Copilot CLI&lt;/td&gt;
					&lt;td&gt;●&lt;/td&gt;
					&lt;td&gt;启动代理 + 启动，订阅模式&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;OpenClaw&lt;/td&gt;
					&lt;td&gt;●&lt;/td&gt;
					&lt;td&gt;ContextEngine 插件安装&lt;/td&gt;
			&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
&lt;hr&gt;
&lt;h2 id=&#34;实测性能&#34;&gt;实测性能
&lt;/h2&gt;&lt;h3 id=&#34;真实-agent-工作负载的-token-节省&#34;&gt;真实 Agent 工作负载的 Token 节省
&lt;/h3&gt;&lt;table&gt;
	&lt;thead&gt;
			&lt;tr&gt;
					&lt;th&gt;工作负载&lt;/th&gt;
					&lt;th&gt;压缩前&lt;/th&gt;
					&lt;th&gt;压缩后&lt;/th&gt;
					&lt;th&gt;节省&lt;/th&gt;
			&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
			&lt;tr&gt;
					&lt;td&gt;代码搜索（100条结果）&lt;/td&gt;
					&lt;td&gt;17,765&lt;/td&gt;
					&lt;td&gt;1,408&lt;/td&gt;
					&lt;td&gt;&lt;strong&gt;92%&lt;/strong&gt;&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;SRE 事故调试&lt;/td&gt;
					&lt;td&gt;65,694&lt;/td&gt;
					&lt;td&gt;5,118&lt;/td&gt;
					&lt;td&gt;&lt;strong&gt;92%&lt;/strong&gt;&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;GitHub Issue 分类&lt;/td&gt;
					&lt;td&gt;54,174&lt;/td&gt;
					&lt;td&gt;14,761&lt;/td&gt;
					&lt;td&gt;&lt;strong&gt;73%&lt;/strong&gt;&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;代码库探索&lt;/td&gt;
					&lt;td&gt;78,502&lt;/td&gt;
					&lt;td&gt;41,254&lt;/td&gt;
					&lt;td&gt;&lt;strong&gt;47%&lt;/strong&gt;&lt;/td&gt;
			&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id=&#34;标准基准测试的准确率保留&#34;&gt;标准基准测试的准确率保留
&lt;/h3&gt;&lt;table&gt;
	&lt;thead&gt;
			&lt;tr&gt;
					&lt;th&gt;基准&lt;/th&gt;
					&lt;th&gt;类别&lt;/th&gt;
					&lt;th&gt;基线准确率&lt;/th&gt;
					&lt;th&gt;Headroom准确率&lt;/th&gt;
					&lt;th&gt;差值&lt;/th&gt;
			&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
			&lt;tr&gt;
					&lt;td&gt;GSM8K&lt;/td&gt;
					&lt;td&gt;数学推理&lt;/td&gt;
					&lt;td&gt;0.870&lt;/td&gt;
					&lt;td&gt;0.870&lt;/td&gt;
					&lt;td&gt;&lt;strong&gt;±0.000&lt;/strong&gt;&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;TruthfulQA&lt;/td&gt;
					&lt;td&gt;事实性&lt;/td&gt;
					&lt;td&gt;0.530&lt;/td&gt;
					&lt;td&gt;0.560&lt;/td&gt;
					&lt;td&gt;&lt;strong&gt;+0.030&lt;/strong&gt;&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;SQuAD v2&lt;/td&gt;
					&lt;td&gt;问答&lt;/td&gt;
					&lt;td&gt;—&lt;/td&gt;
					&lt;td&gt;&lt;strong&gt;97%&lt;/strong&gt;&lt;/td&gt;
					&lt;td&gt;19%压缩&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;BFCL&lt;/td&gt;
					&lt;td&gt;工具调用&lt;/td&gt;
					&lt;td&gt;—&lt;/td&gt;
					&lt;td&gt;&lt;strong&gt;97%&lt;/strong&gt;&lt;/td&gt;
					&lt;td&gt;32%压缩&lt;/td&gt;
			&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
&lt;blockquote&gt;
&lt;p&gt;数学推理零损失，事实性问答甚至略有提升——这在压缩领域极为罕见。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;hr&gt;
&lt;h2 id=&#34;竞品对比&#34;&gt;竞品对比
&lt;/h2&gt;&lt;table&gt;
	&lt;thead&gt;
			&lt;tr&gt;
					&lt;th&gt;产品&lt;/th&gt;
					&lt;th&gt;覆盖范围&lt;/th&gt;
					&lt;th&gt;部署方式&lt;/th&gt;
					&lt;th&gt;本地&lt;/th&gt;
					&lt;th&gt;可逆&lt;/th&gt;
			&lt;/tr&gt;
	&lt;/thead&gt;
	&lt;tbody&gt;
			&lt;tr&gt;
					&lt;td&gt;&lt;strong&gt;Headroom&lt;/strong&gt;&lt;/td&gt;
					&lt;td&gt;全部上下文（工具/RAG/日志/文件/历史）&lt;/td&gt;
					&lt;td&gt;代理·库·中间件·MCP&lt;/td&gt;
					&lt;td&gt;✅&lt;/td&gt;
					&lt;td&gt;✅&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;RTK&lt;/td&gt;
					&lt;td&gt;CLI 命令输出&lt;/td&gt;
					&lt;td&gt;CLI 包装器&lt;/td&gt;
					&lt;td&gt;✅&lt;/td&gt;
					&lt;td&gt;❌&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;lean-ctx&lt;/td&gt;
					&lt;td&gt;CLI 命令、MCP 工具&lt;/td&gt;
					&lt;td&gt;CLI·MCP&lt;/td&gt;
					&lt;td&gt;✅&lt;/td&gt;
					&lt;td&gt;❌&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;Compresr / Token Co.&lt;/td&gt;
					&lt;td&gt;发送到远程 API 的文本&lt;/td&gt;
					&lt;td&gt;托管 API&lt;/td&gt;
					&lt;td&gt;❌&lt;/td&gt;
					&lt;td&gt;❌&lt;/td&gt;
			&lt;/tr&gt;
			&lt;tr&gt;
					&lt;td&gt;OpenAI Compaction&lt;/td&gt;
					&lt;td&gt;对话历史&lt;/td&gt;
					&lt;td&gt;Provider 原生&lt;/td&gt;
					&lt;td&gt;❌&lt;/td&gt;
					&lt;td&gt;❌&lt;/td&gt;
			&lt;/tr&gt;
	&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;唯一同时做到&lt;strong&gt;本地运行&lt;/strong&gt; + &lt;strong&gt;全上下文覆盖&lt;/strong&gt; + &lt;strong&gt;可逆压缩&lt;/strong&gt;的产品。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;独特亮点&#34;&gt;独特亮点
&lt;/h2&gt;&lt;h3 id=&#34;1-跨-agent-记忆cross-agent-memory&#34;&gt;1. 跨 Agent 记忆（Cross-agent Memory）
&lt;/h3&gt;&lt;p&gt;Claude、Codex、Gemini 之间共享压缩记忆，自动去重，Agent 来源追踪。多 Agent 协作场景下这一步节省了大量重复上下文。&lt;/p&gt;
&lt;h3 id=&#34;2-headroom-learn&#34;&gt;2. headroom learn
&lt;/h3&gt;&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;headroom learn
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;自动挖掘失败的 Agent 会话，分析失败原因，将修正写入 &lt;code&gt;CLAUDE.md&lt;/code&gt; / &lt;code&gt;AGENTS.md&lt;/code&gt; / &lt;code&gt;GEMINI.md&lt;/code&gt;。等于 Agent 自己能「从错误中学习」。&lt;/p&gt;
&lt;h3 id=&#34;3-图像压缩&#34;&gt;3. 图像压缩
&lt;/h3&gt;&lt;p&gt;通过训练的 ML 路由器实现 40-90% 的图像压缩，这对多模态 Agent 场景尤其有价值。&lt;/p&gt;
&lt;h3 id=&#34;4-sharedcontext&#34;&gt;4. SharedContext
&lt;/h3&gt;&lt;p&gt;在多 Agent 工作流中通过压缩上下文实现高效传递，避免每个 Agent 都重新加载完整上下文。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;安装与快速上手&#34;&gt;安装与快速上手
&lt;/h2&gt;&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;5
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;6
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;7
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;8
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;9
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# 60 秒上手&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;pip install &lt;span class=&#34;s2&#34;&gt;&amp;#34;headroom-ai[all]&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# 选择你的使用模式&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;headroom wrap claude          &lt;span class=&#34;c1&#34;&gt;# 包装 Claude Code&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;headroom proxy --port &lt;span class=&#34;m&#34;&gt;8787&lt;/span&gt;    &lt;span class=&#34;c1&#34;&gt;# 零改动代理模式&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# 查看节省效果&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;headroom perf
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;也支持 &lt;code&gt;npm install headroom-ai&lt;/code&gt;（TypeScript）、Docker 部署和 &lt;code&gt;pipx&lt;/code&gt; 安装。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;总结&#34;&gt;总结
&lt;/h2&gt;&lt;p&gt;headroom 解决了一个真实且紧迫的问题：Agent 好用，但 Token 烧钱。它用一套精巧的压缩管道（ContentRouter → 多压缩器 → CCR 可逆存储），在保持准确率不变的前提下，将上下文体积压缩到原来的 &lt;strong&gt;1/5 到 1/12&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;对于每天重度使用 AI Coding Agent 的开发者来说，headroom 几乎是必装工具。它不绑定任何特定 Agent 或 LLM Provider，本地运行不泄露数据，且提供了从库调用到 MCP 协议的完整接入矩阵。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;一句话推荐：如果你每天跑 Agent 心疼 token，装上 headroom，同样的答案，省 60-95% 的钱。&lt;/strong&gt;&lt;/p&gt;
</description>
        </item>
        
    </channel>
</rss>
