当前位置:首页 > 热点关注 > 正文内容

DeepSeek-V3.1正式发布 新版本效率大幅提升

2个月前 (08-22)热点关注76

   DeepSeek用户期待的R2模型尚未到来,但V3.1版本已经发布。8月21日,DeepSeek官方公众号宣布最新大语言模型DeepSeek-V3.1正式上线,距离上一个版本DeepSeek-V3-0324已有五个月。

  

   新版本在三个方面进行了升级:混合推理架构、更高的思考效率以及更强的Agent能力。从命名来看热点话题,DeepSeek-V3.1似乎是前一代DeepSeek-V3的小版本迭代。该模型支持两种工作模式——思考模式和非思考模式。面对简单问题时,它以非思考模式快速作答;处理复杂问题时,则切换到思考模式,提供更具深度和逻辑的答案。用户可以通过官方App或网页端的“深度思考”按钮来切换这两种模式。

  

   与之前的DeepSeek-R1-0528相比,DeepSeek-V3.1在思考模式下的效率大幅提升,能在更短时间内给出答案,并且经过思维链压缩训练后热点话题,token消耗量减少了20%至50%,同时保持了与R1-0528相当的任务表现。此外,在非思考模式下,新模型的输出长度也得到了有效控制,能够在输出长度明显减少的情况下保持相同的性能。

   通过Post-Training优化,新模型在工具使用与编程、搜索等智能体任务中的表现大幅提升。在代码修复和命令行终端任务测试中,DeepSeek-V3.1的表现显著优于以往模型。社区第三方测试数据显示,在Aider多语言编程基准测试中,V3.1取得了71.6%的高分,超越了多个知名模型,完成一次编程任务的成本仅为1.01美元,成本效益优势显著。

   随着V3.1的发布,DeepSeek调整了API接口调用价格,并取消了夜间优惠。自北京时间2025年9月6日凌晨起,输入价格方面,缓存命中时为0.5元/百万tokens,缓存未命中时则涨至4元/百万tokens;输出价格调整为12元/百万tokens。DeepSeek还在评论区提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,并对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。UE8M0 FP8是针对即将发布的下一代国产芯片设计的。DeepSeek-V3.1正式发布 新版本效率大幅提升 DeepSeek-V3.1正式发布 新版本效率大幅提升

相关文章

董某莹父亲是国企总经理?官方回应 正在核实中

   北京中日友好医院胸外科副主任医师肖某因被举报婚内出轨多人而引发广泛关注。与此同时,该院规培住院医师、协和医学院4+4博士董某莹也成为了焦点人物。网络上有消息称,董某莹的父亲是中冶建筑...

戈贝尔爆砍27分24篮板 创生涯季后赛新高

戈贝尔爆砍27分24篮板 创生涯季后赛新高

   北京时间5月1日,NBA季后赛中,森林狼以103-96战胜湖人,系列赛总比分4-1淘汰对手。比赛中,戈贝尔在禁区内表现出色,出场39分钟,投篮15次命中2球,罚球6中3,贡献了27分...

八村塁:打中锋太难了,身高体重成挑战

八村塁:打中锋太难了,身高体重成挑战

   在NBA季后赛西部首轮G5中,湖人以96-103输给森林狼,最终大比分1-4被淘汰。   ...

普京为何官宣朝鲜军人参战 履行条约义务

普京为何官宣朝鲜军人参战 履行条约义务

   自去年8月乌军攻入俄罗斯库尔斯克州以来,有关“朝鲜军人参与作战”的消息不断流传。韩国、乌克兰和北约对此进行了高调炒作并表示谴责。近日,这则消息终于得到了证实。俄罗斯已经彻底击溃了库尔...

欧联杯半决赛:毕尔巴鄂竞技0比3曼联 主场惨败创纪录

欧联杯半决赛:毕尔巴鄂竞技0比3曼联 主场惨败创纪录

   毕尔巴鄂竞技在欧联杯半决赛首回合比赛中,主场0-3惨败给曼联,这是该队在欧战主场遭遇的最大失利之一。此前,在2009年12月的欧联杯比赛中,毕尔巴鄂竞技也曾主场0-3输给云达不莱梅。...

胡荷韬发文纪念成都蓉城登顶 队史首次领跑中超

胡荷韬发文纪念成都蓉城登顶 队史首次领跑中超

   5月2日晚,中超联赛第10轮比赛中,成都蓉城以1-0战胜上海申花。罗慕洛的进球帮助球队取得了胜利,这也是成都蓉城队史上首次登上中超积分榜榜首。   ...