当前位置:首页 > 热点关注 > 正文内容

DeepSeek宣布涨价 智能体竞争加剧

3小时前热点关注6

   8月21日,深度求索正式发布了DeepSeek-V3.1大语言模型。这款新模型最大的技术亮点是“混合推理架构”,能够在单一架构内同时支持思考模式与非思考模式热点话题。用户可以通过“深度思考”按钮实现无缝切换,在复杂任务中启用链式推理,在简单任务中快速响应。

  

   根据官方数据,DeepSeek-V3.1-Think在多项专业评测中表现突出,如AIME 2025、GPQA和LiveCodeBench等基准测试中与前代模型R1-0528性能持平,但输出token数减少20%~50%,显著降低了推理成本。在非思考模式下,模型也能以更短的输出长度保持同等性能。

  

   此次升级被视为DeepSeek在AGI竞争中的关键一步,标志着国产大模型间的竞争进入“智能体驱动”阶段。DeepSeek同步开源了V3.1的Base模型和后训练模型,参数规模达840B tokens,并在Hugging Face和魔搭社区开放下载。API方面,deepseek-chat(非思考模式)和deepseek-reasoner(思考模式)的上下文统一扩展至128K。

  

   值得注意的是,DeepSeek宣布自9月6日起调整API定价并取消夜间优惠。输入价格上,缓存命中时为0.5元/百万tokens,缓存未命中的价格则为4元/百万tokens;输出价格为12元/百万tokens。这一举措被业内解读为,深度求索将从年初的关注价格转向价值竞争的信号。此外,V3.1使用的UE8M0FP8精度是针对下一代国产芯片设计的,这可能意味着DeepSeek在硬件适配方面投入了更多资源。DeepSeek宣布涨价 智能体竞争加剧 DeepSeek宣布涨价 智能体竞争加剧

相关文章

欧盟将投资9.1亿欧元加强欧洲防务 提升关键防务能力

   当地时间4月30日,欧盟委员会宣布将根据2024版欧洲防务基金向国防工业投资9.1亿欧元。此次投资旨在通过欧洲科研界与工业界的协同合作,弥补部队机动性和无人机防御等关键能力方面的不足...

北京市五一假期部分时段有阵雨 气温舒适利出行

   “五一”假期期间,北京气温预计变化不大,整体能见度较好。据北京市气象台首席预报员张琳娜介绍,节日期间白天最高气温将在22至26摄氏度之间,夜间最低气温则在13至18摄氏度之间。具体来...

武汉至北上广深一票难求 五一出行火爆

武汉至北上广深一票难求 五一出行火爆

   4月30日,中国铁路武汉局集团公司预计发送旅客95万人次,超过日常的两倍。其中,武汉、汉口、武昌三大站共将发送旅客44.8万人次。从当天中午起,五一假期的第一波客流高峰将提前到达。...

景区怕游客不会赶海撒蛤蜊助力 创意提升旅游体验

   5月1日,山东日照的景区上演了温馨一幕。为了帮助游客更好地体验赶海乐趣,景区工作人员在海滩上抛洒了大量蛤蜊,这一举动让游客们的旅程充满了惊喜和欢乐。    赶海对于...

张晚意音乐节哭了 真情流露打动人心

张晚意音乐节哭了 真情流露打动人心

   近日,演员张晚意在音乐节现场被拍到情绪崩溃、泪洒舞台的画面,引发网友热议。他以“虐心戏”著称,再次用最真实的情绪打动了所有人。   ...

国产雷达不惧干扰潮瞬间揪出战机

   来源:央视网 更新时间:2025年05月02日 16:34 视频简介 中国工程院院士毛二可一直以来深耕雷达领域,他带着团队研发的动目标显示系统,可以瞬间使原本淹没在杂波里的微弱目标信...