中国具身智能迈入"真人级"应用阶段
北京银河通用机器人实现人形机器人无脚本网球对打,击球成功率超90%。自研算法"LATENT"赋予机器人运动小脑,0.1秒锁定高速来球,连续对拉20局。“具身天工Ultra"以2小时40分42秒完成半程马拉松,2026年目标将完赛时间压缩至1小时左右,逼近专业运动员水平。
北京人形机器人创新中心建设了涵盖家居、商超、办公等30余个真实场景的实训基地,120余台机器人同步训练。机器人已能完成精准抓取牛油果、分拣果蔬、模拟给婴儿换尿布等高精度任务。创新中心向北京大学、蔚来、中船集团等高校与企业交付15台最新机器人,并开放"慧思开物"平台全栈技术。国内首个具身智能数据采集行业标准制定完成,数据合格率超95%,开源数据集Robomind下载量超200万次。
值得关注的原因:中国具身智能在运动控制、开放环境任务执行、多场景操作等方面已实现从"机械执行"到"自主思考"的关键跨越,在硬件与运动算法上达到国际领先水平。下一步重点是通过大规模真实数据训练和算法优化,提升机器人在未知环境的泛化能力,推动从"实验室演示"迈向"真人级"实际应用。
Cursor发布Composer 2模型,Claude Code推出Channels
Cursor发布Composer 2模型,显著提升多文件协同编辑能力。Claude Code推出Channels功能,支持手机远程操控,开发者可通过移动端监控和控制编程进程。Google AI Studio上线全栈Vibe Coding能力,进一步丰富AI编程工具生态。
AI编程工具正在形成完整工具矩阵,包括GitHub Copilot、Cursor、Replit、Claude Code、Windsurf及Google AI Studio等,分别适用于从初学者到专业开发者、从个人项目到企业级应用的不同场景。Vibe Coding正成为AI时代的主流编程范式,通过自然语言交互大幅降低编程门槛。
值得关注的原因:AI编程工具的快速迭代表明这一领域已进入白热化竞争阶段。Vibe Coding模式正在重新定义软件开发流程,从"敲代码"转向"说需求”,将程序员从繁琐的实现细节中解放出来,转向更高层次的架构设计和产品逻辑。这不仅是工具层面的升级,更是整个软件开发范式的革命性变革。
Soul AI Lab密集开源实时交互模型
Soul AI Lab近期密集开源了多个面向实时交互场景的模型。SoulX-LiveAct实现20 FPS实时流式推理,仅需2张H100/H200,端到端延迟约0.94s,支持小时级甚至全天候稳定生成。SoulX-FlashTalk达到0.87s延迟、32fps帧率,14B参数模型支持超长视频稳定生成,曾登Hugging Face I2V趋势榜TOP5。SoulX-FlashHead为1.3B参数轻量化版本,单张RTX 4090可达96fps,登顶Hugging Face I2V趋势榜TOP4。
此外,SoulX-Podcast支持中、英、川、粤等多语种/方言多人多轮对话语音生成,可稳定输出超60分钟自然对话,曾登顶Hugging Face TTS趋势榜,Github Star超3.2K。SoulX-Singer和SoulX-Duplug分别覆盖歌声合成和全双工语音对话控制能力。
值得关注的原因:所有模型均围绕"实时"优化,追求亚秒级延迟与高帧率流畅生成,确保在社交、直播、客服等场景中实现自然互动。通过"条件传播方式"和"历史记忆管理"技术,解决长视频生成中常见的身份漂移、画面闪烁等问题。多数模型可在消费级显卡或少量专业卡上运行,大幅降低落地门槛。Soul通过开源推动"实时交互"成为AI时代的基础设施,构建围绕AI社交的开放技术生态。
小红书rednote-hilab发布dots.mocr,3B参数支持图像转SVG
小红书rednote-hilab发布了参数量为3B的多模态OCR模型dots.mocr及其针对图像转SVG的优化版本。该模型在同级参数量下性能领先,支持高精度图像转换,延续了dots.ocr系列的技术路线,专注于文档解析与视觉理解。
dots.mocr支持将图像转换为可缩放矢量图形(SVG),这种格式在网页设计、图标制作、印刷品等领域具有广泛应用价值。3B的参数量在保持高性能的同时,确保了模型在消费级硬件上的可部署性。
值得关注的原因:从1.7B的dots.ocr到3B的dots.mocr,小红书在多模态视觉理解领域持续发力,形成完整的技术栈。图像转SVG能力为设计师和开发者提供了新的自动化工具,提升工作效率。这一系列开源项目展示了中国AI公司在细分垂直领域的创新能力,通过持续迭代构建技术壁垒。
AI Show 2026北京博览会成果
3月18日至20日,AI Show 2026北京国际人工智能应用与机器人创新博览会在中国国际展览中心朝阳馆举办。来自中国、加拿大、瑞典等国家和地区的约200家品牌携最新技术成果亮相,全面呈现行业最新科研成果与前沿技术应用。
本届博览会以"智赋百业 技启新程"为主题,聚焦大模型、具身智能、人形机器人等前沿科技,覆盖人工智能基础层、技术层到应用层的完整产业链。展会不仅展示了最新的技术和产品,还通过论坛、研讨等形式促进产业交流与合作,推动人工智能与实体经济深度融合。
值得关注的原因:AI Show 2026是观察中国AI产业发展风向的重要窗口。约200家参展商的规模表明AI技术已进入大规模应用落地阶段。具身智能和人形机器人成为展会焦点,反映这一赛道正从概念走向产业化。展会聚集全球顶尖企业和研究机构,展现中国在AI领域的开放合作态度和产业生态建设能力。