DeepSeek R1史诗加强,推理追平o3,编码仅次于Claude4

DeepSeek R1迎来重大升级,0528版本在深度思考和编程能力上显著提升。其推理能力已追平GPT-3,前端编码水平仅次于Claude 4,与Gemini 2.5 Pro持平。UI设计优秀,中文写作能力有所进化,但仍存在幻觉问题。DeepSeek R1的此次升级使其重返推理大模型第一梯队,并使DeepSeek成为开源领域的领军力量。

视频信息

描述: DeepSeek R1迎来首次重大升级0528版本 亮点1、深度思考史诗加强 单次思考能持续十几分钟,推理机制已追上了o3 亮点2、编程能力爆表 体感R1的前端编码水平仅次于Claude 4,与Gemini 2.5 Pro持平 亮点3、UI美学无敌 亮点4、中文写作再进化 R1在数学编码上的幻觉得到了有效控制,但是在写作上的幻觉依然严重 R1重返推理大模型第一梯队,DeepSeek已取代Meta成为开源界的领军力量

置顶评论: 打平o3这一点还是尽量少宣传吧。o3很多时候分析图像这一点虽然是高射炮打蚊子,但人家起码多模态能力有了。关键是o3不需要你点开联网不联网搜索,它会根据你的问题判断是否要执行联网搜索,而且可以全程看到执行了哪些联网搜索。智能的模型从来不需要你刻意去点开联网不联网那个按钮。包括Gemini的2.5Pro现在也不需要了。他会根据你的问题判断是不是执行联网搜索。还可以执行谷歌核查。

热门评论:

  1. 好消息是加强了,坏消息意味着R2难产了。 他们公司还是有一定程度洁癖的,进步不到自己预期程度不愿意糊弄。 但llm可能就这样了,差不多摸到天花板了。
  2. 新版deepseek中文的行文风格一点也不像自家的deepseek V3, 反而跟最近广受欢迎Gemini2.5pro模型的行文风格几乎一模一样。(最经典的是Gemini的“投石子”口头禅居然都被学来了)[吃瓜][吃瓜] 这是从年初的蒸馏chatgpt,改成蒸馏Gemini了? 哪家好用就蒸馏哪家是吧? [偷笑][偷笑][偷笑]