1. OpenAI 关停 Sora,算力全押 Agent 与世界模型
OpenAI 宣布关停 AI 视频生成平台 Sora,包括面向消费者的应用、开发者 API 以及原计划集成进 ChatGPT 的视频功能全部停止。Sora 研究团队将转向"世界模型"研究,聚焦机器人技术与物理世界仿真。与此同时,Altman 卸下安全团队直接监管职责,将精力转向融资与大规模数据中心建设。新一代主力模型 Spud 预训练已完成,“数周内"上线,Altman 称其"有望真正加速经济发展”。迪士尼原定 10 亿美元投资随 Sora 关停而告吹。
为何关注: Sora 的关停标志着 OpenAI 从多线布局收缩为 All-in Agent 与底层模型,是冲刺 IPO 前的战略优先级重排信号。Sora 算力资源将重新分配给 Spud 和 Agent 方向,直接回应 Anthropic 在企业市场的竞争压力。
2. 谷歌发布 TurboQuant:KV 缓存 3bit 压缩,内存降低 6 倍、推理提速 8 倍
Google Research 于 3 月 25 日发布 TurboQuant,这是一套在线向量量化压缩算法,专为大语言模型推理时的 KV 缓存设计。核心技术由三部分组成:PolarQuant(随机旋转均匀化分布)、QJL(Johnson-Lindenstrauss 降维投影)和统一方案。可将 KV 缓存量化至 3bit 精度,在 H100 GPU 上实现 6 倍内存压缩和最高 8 倍注意力计算加速,且无需额外训练或微调,部署门槛极低。论文已发表于 ICLR 2026。
为何关注: TurboQuant 是目前在 sub-4bit 下实现"零精度损失"的少数方案之一。对于需要处理长上下文的模型(如 Gemini、Claude 的百万 token 窗口),显存开销一直是瓶颈,该技术有望大幅降低推理成本、推动大模型端侧部署。谷歌已暗示将开源相关实现。
3. 具身智能首个行业标准正式发布,6 月 1 日实施
3 月 26 日,中国信息通信研究院联合 40 余家单位共同起草的《具身智能基准测试框架与方法》正式发布,将于 2026 年 6 月 1 日起正式实施。标准涵盖具身智能系统框架构成与能力要求,规范仿真与真实环境下的基准测试方法及评价指标,覆盖基础能力、认知推理、全链路闭环能力测试。配套建成超 1 万条测试任务库,覆盖工业、家庭、零售、物流等 300 种任务类型,并提供仿真任务生成与指标自动化计算工具。
为何关注: 这是具身智能领域从"野蛮生长"走向"有标可依"的重要节点。统一评测框架的建立有助于企业和研究机构客观比较系统性能,加速技术迭代与商业落地,也将成为政府采购和行业投融资的重要参考依据。
4. Anthropic 算力吃紧,本周限制 Claude 高峰时段用量
由于算力资源持续紧张,Anthropic 宣布本周将限制 Claude 用户在高峰时段的使用量。这一消息迅速在社区引发广泛讨论。Anthropic 在官方公告中表示,此举是为应对近期需求激增,正在积极扩充算力基础设施。
为何关注: Claude Code 的爆发式增长(已在 AI 编程工具中占据主导地位)叠加 Claude 百万 token 上下文窗口的正式 GA,使 Anthropic 的算力缺口急剧放大。高峰限流折射出顶级 AI 服务商在算力供给侧面临的结构性压力,也可能为竞争对手创造短期机会。
5. SakanaAI 开源 AI-Scientist-v2:自主科研 AI 系统第二版
SakanaAI 在 GitHub 上发布了 AI-Scientist-v2,这是其自主 AI 科研系统的第二个版本。该系统能够自动提出研究假设、设计实验、运行代码、分析结果并撰写学术论文,旨在让 AI 成为独立的科研主体而非辅助工具。与第一版相比,v2 在实验设计能力、多轮迭代稳定性和论文生成质量上均有显著提升。
为何关注: AI 自主科研代表了下一阶段 AI Agent 的重要应用场景,直接挑战"AI 只是工具"的认知边界。如果 AI 能够自主产出经同行评审的研究成果,将对科研生产力和知识创造方式产生深远影响,也是 AGI 路径上的关键能力节点。