OpenAI关停Sora转向Agent，谷歌TurboQuant KV缓存压缩6倍

1. OpenAI 关停 Sora，算力全押 Agent 与世界模型

OpenAI 宣布关停 AI 视频生成平台 Sora，包括面向消费者的应用、开发者 API 以及原计划集成进 ChatGPT 的视频功能全部停止。Sora 研究团队将转向"世界模型"研究，聚焦机器人技术与物理世界仿真。与此同时，Altman 卸下安全团队直接监管职责，将精力转向融资与大规模数据中心建设。新一代主力模型 Spud 预训练已完成，“数周内"上线，Altman 称其"有望真正加速经济发展”。迪士尼原定 10 亿美元投资随 Sora 关停而告吹。

为何关注： Sora 的关停标志着 OpenAI 从多线布局收缩为 All-in Agent 与底层模型，是冲刺 IPO 前的战略优先级重排信号。Sora 算力资源将重新分配给 Spud 和 Agent 方向，直接回应 Anthropic 在企业市场的竞争压力。

2. 谷歌发布 TurboQuant：KV 缓存 3bit 压缩，内存降低 6 倍、推理提速 8 倍

Google Research 于 3 月 25 日发布 TurboQuant，这是一套在线向量量化压缩算法，专为大语言模型推理时的 KV 缓存设计。核心技术由三部分组成：PolarQuant（随机旋转均匀化分布）、QJL（Johnson-Lindenstrauss 降维投影）和统一方案。可将 KV 缓存量化至 3bit 精度，在 H100 GPU 上实现 6 倍内存压缩和最高 8 倍注意力计算加速，且无需额外训练或微调，部署门槛极低。论文已发表于 ICLR 2026。

为何关注： TurboQuant 是目前在 sub-4bit 下实现"零精度损失"的少数方案之一。对于需要处理长上下文的模型（如 Gemini、Claude 的百万 token 窗口），显存开销一直是瓶颈，该技术有望大幅降低推理成本、推动大模型端侧部署。谷歌已暗示将开源相关实现。

3. 具身智能首个行业标准正式发布，6 月 1 日实施

3 月 26 日，中国信息通信研究院联合 40 余家单位共同起草的《具身智能基准测试框架与方法》正式发布，将于 2026 年 6 月 1 日起正式实施。标准涵盖具身智能系统框架构成与能力要求，规范仿真与真实环境下的基准测试方法及评价指标，覆盖基础能力、认知推理、全链路闭环能力测试。配套建成超 1 万条测试任务库，覆盖工业、家庭、零售、物流等 300 种任务类型，并提供仿真任务生成与指标自动化计算工具。

为何关注： 这是具身智能领域从"野蛮生长"走向"有标可依"的重要节点。统一评测框架的建立有助于企业和研究机构客观比较系统性能，加速技术迭代与商业落地，也将成为政府采购和行业投融资的重要参考依据。

4. Anthropic 算力吃紧，本周限制 Claude 高峰时段用量

由于算力资源持续紧张，Anthropic 宣布本周将限制 Claude 用户在高峰时段的使用量。这一消息迅速在社区引发广泛讨论。Anthropic 在官方公告中表示，此举是为应对近期需求激增，正在积极扩充算力基础设施。

为何关注： Claude Code 的爆发式增长（已在 AI 编程工具中占据主导地位）叠加 Claude 百万 token 上下文窗口的正式 GA，使 Anthropic 的算力缺口急剧放大。高峰限流折射出顶级 AI 服务商在算力供给侧面临的结构性压力，也可能为竞争对手创造短期机会。

5. SakanaAI 开源 AI-Scientist-v2：自主科研 AI 系统第二版

SakanaAI 在 GitHub 上发布了 AI-Scientist-v2，这是其自主 AI 科研系统的第二个版本。该系统能够自动提出研究假设、设计实验、运行代码、分析结果并撰写学术论文，旨在让 AI 成为独立的科研主体而非辅助工具。与第一版相比，v2 在实验设计能力、多轮迭代稳定性和论文生成质量上均有显著提升。

为何关注： AI 自主科研代表了下一阶段 AI Agent 的重要应用场景，直接挑战"AI 只是工具"的认知边界。如果 AI 能够自主产出经同行评审的研究成果，将对科研生产力和知识创造方式产生深远影响，也是 AGI 路径上的关键能力节点。