24小时AI开源突破
过去24小时内(2025年12月18–19日),AI领域的主要焦点集中在开源模型发布、工具更新以及学术评估上。没有重大闭源前沿模型(如GPT或Gemini系列)的新发布公告,但开源和工具层面有显著亮点。以下优先列出模型发布、新论文和开源项目:
1. NVIDIA发布Nemotron 3开源推理模型系列
- NVIDIA推出了 Nemotron 3 系列开源模型,专为“agentic AI”优化,支持多代理和长上下文操作。
- 包括 Nano(30B)、Super(100B) 和 Ultra(500B) 三种规模,并附带强化学习工具和开源数据集。
- 这标志着 NVIDIA 进一步推进开源 AI 生态,对开发者构建代理系统具有重要意义。
来源:Crescendo.ai | Motley Fool
2. WAN 2.6开源视频模型发布
- 最无限制的 AI 视频模型 WAN 2.6 开源,支持生成完整视听体验,无内容过滤或创意限制。
- 强调 “uncensored, unfiltered, unrestricted”,适用于需要高度自由度的视频生成场景。
来源:X 帖子讨论及相关报道
3. 新论文:评估LLM在科学发现中的能力
- 哈佛与 MIT 联合发表论文《Evaluating Large Language Models in Scientific Discovery》,指出当前 LLM 在完整科学发现循环(假设→实验→观察→修正)中表现脆弱。
- 模型易过拟合表面模式、难以放弃错误假设、混淆相关与因果;高基准分并不代表真实科学能力。
- 结论:科学智能 ≠ 语言智能,强调反馈机制与失败修正的重要性。
来源:arXiv(近期 cs.AI 列表)及 X 分享
4. 其他值得关注的工具与更新
-
Luma AI Ray3 Modify:新视频编辑工具,支持基于角色参考编辑镜头、保留动作/情感、添加过渡等,显著减少影视重拍需求。
来源:TechCrunch
-
Letta平台:状态化 AI 代理平台,支持持久自动化(如入职流程、工单处理),GitHub 星标数快速上升。
来源:DEV Community 每日 AI 新闻
-
Paper2Video (PaperTalker):开源工具,可自动将科学论文转为完整演示视频(含幻灯片、旁白、字幕、虚拟头像),在理解测试中优于人工制作视频。
5. 环境与宏观影响
- 报告指出,2025年 AI 繁荣所产生的 CO₂ 排放量相当于纽约市全年排放总量,引发对 AI 可持续性的广泛讨论。
来源:The Guardian
过去24小时整体相对平静,未出现类似 Gemini 3 或 Claude Opus 等旗舰闭源模型的重大发布。开源社区活跃度更高,焦点正转向 AI 代理系统、视频生成自由度 以及 科学应用能力的严谨评估。更多细节可参考上述来源链接。