免责声明:78财经所有资讯仅代表作者个人观点,不构成任何投资理财建议。
主页 > 全部资讯 > 财经新闻 > DeepSeek发布新模型V3.1 性能大幅提升

DeepSeek发布新模型V3.1 性能大幅提升

时间:2025-08-22 来源: 作者:财经大神

8月21日,DeepSeek发布了新模型V3.1。这款模型采用了UE8M0 FP8 Scale的参数精度,并对分词器和聊天模板做了较大调整。官方表示,UE8M0 FP8是为即将推出的下一代国产芯片设计的。尽管业界期待已久的R2模型未现身,但V3.1带来了显著升级,包括更强的智能体能力、混合思考模式和更高的思考效率。通过后训练优化,V3.1在工具使用与智能体任务中的表现大幅提升。

DeepSeek发布新模型V3.1 性能大幅提升

DeepSeek-V3.1采用混合推理架构,支持思考模式和非思考模式自由切换。用户可在官方App和网页端体验这一功能,通过“深度思考”按钮实现模式转换。DeepSeek API也同步升级,上下文扩展至128K。有网友评价这种混合推理非常棒,能在深度思考和快速响应间灵活切换。此外,V3.1-Think在减少输出token数量的同时,保持了与前代模型相当的任务表现。然而,V3.1的价格有所上涨,API调用价格从9月6日起取消夜间优惠,输入和输出价格均上调。基础模型增加了840B tokens的外扩训练,并已在Huggingface与魔搭开源。DeepSeek还宣布支持Anthropic API格式,方便用户将V3.1的能力接入Claude Code框架。

相关阅读
DeepSeek发布新模型V3.1 性能大幅提升 刚刚发布

DeepSeek推出新模型V3.1,采用UE8M0 FP8参数精度,增强智能体能力与混合思考模式,API调用价格上调。

港股恒指与科技指数双双下跌 刚刚发布

8月21日,港股收盘,恒生指数跌0.24%,恒生科技指数跌0.77%。

雅江水电站概念股暴涨散户赚钱难 刚刚发布

尽管雅江水电站概念股暴涨,但多数散户并未从中获利,反映出牛市中散户赚钱难的问题。

智元机器人预计明年出货量达数万台 1分钟前发布

智元机器人预计明年出货量达数万台,启动“智元A计划”构建千亿级产业生态。

A股震荡调整 AI与数字货币板块亮眼 3分钟前发布

8月21日,A股市场震荡调整,沪指微涨0.13%。AI和数字货币相关板块表现强劲,中兴通讯、寒武纪等个股涨幅显著。

DeepSeek发布V3.1 API调价取消夜间优惠 4分钟前发布

8月21日,DeepSeek推出V3.1版,性能提升并调整API价格,取消夜间优惠。

外资加速流入中国市场看好科技股 5分钟前发布

外资机构加速布局中国市场,尤其青睐小米、腾讯等科技蓝筹股,中国再次成为全球资金净买入最多的市场。

天津银行A股上市辅导进入关键阶段 5分钟前发布

天津银行启动A股上市辅导近十年,现处于第二十八期辅导阶段,一季度实现营收和净利润双增长。

沪指创十年新高 数字货币股领涨 6分钟前发布

今日A股三大指数表现不一,沪指上涨0.13%创十年新高,数字货币概念股表现亮眼,行业板块涨少跌多。

神州细胞涉医保诈骗风波 7分钟前发布

神州细胞因旗下产品安佳因涉嫌医保诈骗被调查,多名血友病患者卷入案件。

亚特兰大联储主席预计今年仅再降息一次 9分钟前发布

亚特兰大联储主席博斯蒂克表示,预计美联储今年可能仅再降息一次,但经济环境变化使这一预测充满不确定性。

美联储官员暗示9月可能不会降息 10分钟前发布

美联储官员在杰克逊霍尔会议上表达对立即降息的谨慎态度,认为当前经济状况不支持降息,市场预期有所调整。

稀土价格持续上涨 需求强劲支撑 11分钟前发布

8月以来,主要稀土品种价格上涨超10万元/吨,需求激增和政策推动下,稀土涨价趋势超出预期。

高盛看好中国股市上涨空间 12分钟前发布

高盛最新研报指出,中国股市尤其是中小盘股仍有显著上涨空间,大量“存量资金”尚未入市,市场动能强劲。

沪指创近十年新高后回落 14分钟前发布

周四,沪指盘中创下近十年新高后回落,收出十字星。分析认为未来走势有两种可能,大盘短线有回调压力但有望冲击3800点。

Copyright © 2021-2022 78Game. All rights reserved. 闽ICP备2024058879号-7