当前位置:首页 > 热点关注 > 正文内容

DeepSeek-V3.1正式发布 新版本效率大幅提升

3小时前热点关注5

   DeepSeek用户期待的R2模型尚未到来,但V3.1版本已经发布。8月21日,DeepSeek官方公众号宣布最新大语言模型DeepSeek-V3.1正式上线,距离上一个版本DeepSeek-V3-0324已有五个月。

  

   新版本在三个方面进行了升级:混合推理架构、更高的思考效率以及更强的Agent能力。从命名来看热点话题,DeepSeek-V3.1似乎是前一代DeepSeek-V3的小版本迭代。该模型支持两种工作模式——思考模式和非思考模式。面对简单问题时,它以非思考模式快速作答;处理复杂问题时,则切换到思考模式,提供更具深度和逻辑的答案。用户可以通过官方App或网页端的“深度思考”按钮来切换这两种模式。

  

   与之前的DeepSeek-R1-0528相比,DeepSeek-V3.1在思考模式下的效率大幅提升,能在更短时间内给出答案,并且经过思维链压缩训练后热点话题,token消耗量减少了20%至50%,同时保持了与R1-0528相当的任务表现。此外,在非思考模式下,新模型的输出长度也得到了有效控制,能够在输出长度明显减少的情况下保持相同的性能。

   通过Post-Training优化,新模型在工具使用与编程、搜索等智能体任务中的表现大幅提升。在代码修复和命令行终端任务测试中,DeepSeek-V3.1的表现显著优于以往模型。社区第三方测试数据显示,在Aider多语言编程基准测试中,V3.1取得了71.6%的高分,超越了多个知名模型,完成一次编程任务的成本仅为1.01美元,成本效益优势显著。

   随着V3.1的发布,DeepSeek调整了API接口调用价格,并取消了夜间优惠。自北京时间2025年9月6日凌晨起,输入价格方面,缓存命中时为0.5元/百万tokens,缓存未命中时则涨至4元/百万tokens;输出价格调整为12元/百万tokens。DeepSeek还在评论区提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,并对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。UE8M0 FP8是针对即将发布的下一代国产芯片设计的。DeepSeek-V3.1正式发布 新版本效率大幅提升 DeepSeek-V3.1正式发布 新版本效率大幅提升

相关文章

“美人鱼”溺水真实原因公布 设备故障致意外

“美人鱼”溺水真实原因公布 设备故障致意外

   近日,太原海洋大世界“美人鱼”表演时发生溺水事件,引起广泛关注。4月28日,太原海洋大世界在其官方账号上发布了一封公开道歉信,解释称“美人鱼”冯女士在表演过程中因护目镜和脚蹼脱落导致...

《焦点访谈》 20250430 逐梦苍穹不止步

   本期节目主要内容: 2025年4月30日,神舟十九号飞船在东风着陆场顺利返回,三名在太空值班半年的航天员蔡旭哲、宋令东和王浩泽平安归来。因为受到着陆场气象条件限制,三名航天员的返回比...

巴基斯坦陆军在多地举行军事演习 多兵种参与演练

   4月30日,巴基斯坦陆军在锡亚尔科特、纳罗瓦尔、扎法尔瓦尔和沙卡尔加尔等地举行了军事演习。此次演习中,坦克、火炮以及步兵部队均参与其中。...

最大人造太阳完成电磁心脏组件制造 里程碑式成就

   国际热核聚变实验堆(ITER)组织宣布,已完成全球最大、最强的脉冲超导电磁体系统的所有组件制造,这是聚变能源领域的一项里程碑式成就。    最后一个完成制造的组件是...

特朗普称将伊朗石油买家将被美制裁 极限施压政策升级

特朗普称将伊朗石油买家将被美制裁 极限施压政策升级

   5月1日,美国总统特朗普在社交媒体上表示,任何从伊朗购买石油或石化产品的国家或个人都将面临美国制裁,并被禁止与美国进行商业往来。   ...

吃蓝莓前记得给它掏耳朵 蓝莓肚脐眼里的秘密

   蓝莓肚脐眼里的霉菌话题冲上热搜,引发网友热议。有人感叹原来蓝莓这个地方这么脏,甚至开玩笑说难怪蓝莓通便,原来是吃坏肚子了。还有人分享了用棉签清洗蓝莓的方法,建议大家在食用前给蓝莓“掏...