当前位置:首页 > 实时热点 > 正文内容

DeepSeek-V3.1正式发布 新版本效率大幅提升

3小时前实时热点2

  DeepSeek用户期待的R2模型尚未到来,但V3.1版本已经发布。8月21日,DeepSeek官方公众号宣布最新大语言模型DeepSeek-V3.1正式上线,距离上一个版本DeepSeek-V3-0324已有五个月。

  

  新版本在三个方面进行了升级:混合推理架构、更高的思考效率以及更强的Agent能力。从命名来看,DeepSeek-V3.1似乎是前一代DeepSeek-V3的小版本迭代。该模型支持两种工作模式——思考模式和非思考模式。面对简单问题时,它以非思考模式快速作答;处理复杂问题时,则切换到思考模式,提供更具深度和逻辑的答案。用户可以通过官方App或网页端的“深度思考”按钮来切换这两种模式。

  

  与之前的DeepSeek-R1-0528相比,DeepSeek-V3.1在思考模式下的效率大幅提升,能在更短时间内给出答案,并且经过思维链压缩训练后实时热点,token消耗量减少了20%至50%,同时保持了与R1-0528相当的任务表现。此外,在非思考模式下,新模型的输出长度也得到了有效控制,能够在输出长度明显减少的情况下保持相同的性能。

  通过Post-Training优化,新模型在工具使用与编程、搜索等智能体任务中的表现大幅提升。在代码修复和命令行终端任务测试中,DeepSeek-V3.1的表现显著优于以往模型。社区第三方测试数据显示,在Aider多语言编程基准测试中,V3.1取得了71.6%的高分,超越了多个知名模型,完成一次编程任务的成本仅为1.01美元,成本效益优势显著。

  随着V3.1的发布,DeepSeek调整了API接口调用价格,并取消了夜间优惠。自北京时间2025年9月6日凌晨起,输入价格方面,缓存命中时为0.5元/百万tokens,缓存未命中时则涨至4元/百万tokens;输出价格调整为12元/百万tokens。DeepSeek还在评论区提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,并对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。UE8M0 FP8是针对即将发布的下一代国产芯片设计的。DeepSeek-V3.1正式发布 新版本效率大幅提升

相关文章

中国男篮时隔10年亚洲杯小组赛全胜 完美收官锁定八强

中国男篮时隔10年亚洲杯小组赛全胜 完美收官锁定八强

  北京时间8月9日19:00,中国男篮在亚洲杯小组赛中迎战约旦男篮。这是小组赛中实力最强的对手,但中国男篮开局表现出色,最终以90:68大胜对手。这场胜利使中国男篮在小组赛中三战全胜,以...

19岁黄多多上课被偶遇 素颜脸小满满大学生气息 背着帆布袋超美!

19岁黄多多上课被偶遇 素颜脸小满满大学生气息 背着帆布袋超美!

   19岁黄多多上课被偶遇   【19岁黄多多上课被偶遇】近日,有网友在社交平台分享偶遇19岁黄多多上课的照片,引...

1家5口遇车祸致1死4伤 亲属讲述现场 幸福家庭瞬间破碎

1家5口遇车祸致1死4伤 亲属讲述现场 幸福家庭瞬间破碎

  近日,山东威海荣成市一封闭小区内部道路发生一起车辆撞人事故,造成1人死亡、1人重伤正在抢救实时热点、3人轻伤情况稳定。据现场目击者王先生描述,肇事车辆从小区大门拐进来后失控,以极高速度...

早田希娜3比2张本美和 上演王者归来

早田希娜3比2张本美和 上演王者归来

  中国乒乓球队正在参加日本横滨冠军赛,派出了孙颖莎等主力队员。孙颖莎已顺利进入八强,粉丝们希望她能杀入决赛争夺冠军。然而,在日本夺冠难度较大,因为日本队也派出了早田希娜等主力。...

中国连续9月增持黄金释放何信号 多国央行购金热持续

中国连续9月增持黄金释放何信号 多国央行购金热持续

  中国人民银行网站8月7日发布数据显示,中国7月末黄金储备达到7396万盎司,环比增加6万盎司,这是连续第9个月增持黄金。今年,多国央行对黄金的购买热情依旧高涨,这反映出全球经济不确定性...

王燊超第300次在中超首发 队史第二人达成里程碑

王燊超第300次在中超首发 队史第二人达成里程碑

  在中超第20轮的上海德比中,上海海港客场对阵上海申花。王燊超作为海港队长首发出战,达成了他在中超的第300次首发里程碑,成为队史第二位达到这一成就的球员。   ...