24小时AI开源突破

过去24小时内,AI领域聚焦于开源模型发布、工具更新与学术评估。NVIDIA推出Nemotron 3系列,WAN 2.6视频模型开源,哈佛与MIT联合发布科学发现能力评估论文。

24小时AI开源突破

过去24小时内(2025年12月18–19日),AI领域的主要焦点集中在开源模型发布、工具更新以及学术评估上。没有重大闭源前沿模型(如GPT或Gemini系列)的新发布公告,但开源和工具层面有显著亮点。以下优先列出模型发布、新论文和开源项目:

1. NVIDIA发布Nemotron 3开源推理模型系列

  • NVIDIA推出了 Nemotron 3 系列开源模型,专为“agentic AI”优化,支持多代理和长上下文操作。
  • 包括 Nano(30B)Super(100B)Ultra(500B) 三种规模,并附带强化学习工具和开源数据集。
  • 这标志着 NVIDIA 进一步推进开源 AI 生态,对开发者构建代理系统具有重要意义。

来源:Crescendo.ai | Motley Fool

2. WAN 2.6开源视频模型发布

  • 最无限制的 AI 视频模型 WAN 2.6 开源,支持生成完整视听体验,无内容过滤或创意限制
  • 强调 “uncensored, unfiltered, unrestricted”,适用于需要高度自由度的视频生成场景。

来源:X 帖子讨论及相关报道

3. 新论文:评估LLM在科学发现中的能力

  • 哈佛与 MIT 联合发表论文《Evaluating Large Language Models in Scientific Discovery》,指出当前 LLM 在完整科学发现循环(假设→实验→观察→修正)中表现脆弱。
  • 模型易过拟合表面模式、难以放弃错误假设、混淆相关与因果;高基准分并不代表真实科学能力。
  • 结论:科学智能 ≠ 语言智能,强调反馈机制与失败修正的重要性。

来源:arXiv(近期 cs.AI 列表)及 X 分享

4. 其他值得关注的工具与更新

  • Luma AI Ray3 Modify:新视频编辑工具,支持基于角色参考编辑镜头、保留动作/情感、添加过渡等,显著减少影视重拍需求。

    来源:TechCrunch

  • Letta平台:状态化 AI 代理平台,支持持久自动化(如入职流程、工单处理),GitHub 星标数快速上升。

    来源:DEV Community 每日 AI 新闻

  • Paper2Video (PaperTalker):开源工具,可自动将科学论文转为完整演示视频(含幻灯片、旁白、字幕、虚拟头像),在理解测试中优于人工制作视频。

    来源:GitHub - showlab/Paper2Video

5. 环境与宏观影响

  • 报告指出,2025年 AI 繁荣所产生的 CO₂ 排放量相当于纽约市全年排放总量,引发对 AI 可持续性的广泛讨论。

来源:The Guardian


过去24小时整体相对平静,未出现类似 Gemini 3 或 Claude Opus 等旗舰闭源模型的重大发布。开源社区活跃度更高,焦点正转向 AI 代理系统、视频生成自由度 以及 科学应用能力的严谨评估。更多细节可参考上述来源链接。