免责声明：78财经所有资讯仅代表作者个人观点，不构成任何投资理财建议。

主页 > 全部资讯 > 财经新闻 > DeepSeek发布新模型V3.1 性能大幅提升

DeepSeek发布新模型V3.1 性能大幅提升

时间：2025-08-22 来源：作者：财经大神

8月21日，DeepSeek发布了新模型V3.1。这款模型采用了UE8M0 FP8 Scale的参数精度，并对分词器和聊天模板做了较大调整。官方表示，UE8M0 FP8是为即将推出的下一代国产芯片设计的。尽管业界期待已久的R2模型未现身，但V3.1带来了显著升级，包括更强的智能体能力、混合思考模式和更高的思考效率。通过后训练优化，V3.1在工具使用与智能体任务中的表现大幅提升。

DeepSeek发布新模型V3.1 性能大幅提升

DeepSeek-V3.1采用混合推理架构，支持思考模式和非思考模式自由切换。用户可在官方App和网页端体验这一功能，通过“深度思考”按钮实现模式转换。DeepSeek API也同步升级，上下文扩展至128K。有网友评价这种混合推理非常棒，能在深度思考和快速响应间灵活切换。此外，V3.1-Think在减少输出token数量的同时，保持了与前代模型相当的任务表现。然而，V3.1的价格有所上涨，API调用价格从9月6日起取消夜间优惠，输入和输出价格均上调。基础模型增加了840B tokens的外扩训练，并已在Huggingface与魔搭开源。DeepSeek还宣布支持Anthropic API格式，方便用户将V3.1的能力接入Claude Code框架。

相关阅读

DeepSeek发布新模型V3.1 性能大幅提升刚刚发布

DeepSeek推出新模型V3.1，采用UE8M0 FP8参数精度，增强智能体能力与混合思考模式，API调用价格上调。

港股恒指与科技指数双双下跌刚刚发布

8月21日，港股收盘，恒生指数跌0.24%，恒生科技指数跌0.77%。

雅江水电站概念股暴涨散户赚钱难刚刚发布

尽管雅江水电站概念股暴涨，但多数散户并未从中获利，反映出牛市中散户赚钱难的问题。

智元机器人预计明年出货量达数万台 1分钟前发布

智元机器人预计明年出货量达数万台，启动“智元A计划”构建千亿级产业生态。

A股震荡调整 AI与数字货币板块亮眼 3分钟前发布

8月21日，A股市场震荡调整，沪指微涨0.13%。AI和数字货币相关板块表现强劲，中兴通讯、寒武纪等个股涨幅显著。

DeepSeek发布V3.1 API调价取消夜间优惠 4分钟前发布

8月21日，DeepSeek推出V3.1版，性能提升并调整API价格，取消夜间优惠。

外资加速流入中国市场看好科技股 5分钟前发布

外资机构加速布局中国市场，尤其青睐小米、腾讯等科技蓝筹股，中国再次成为全球资金净买入最多的市场。

天津银行A股上市辅导进入关键阶段 5分钟前发布

天津银行启动A股上市辅导近十年，现处于第二十八期辅导阶段，一季度实现营收和净利润双增长。

沪指创十年新高数字货币股领涨 6分钟前发布

今日A股三大指数表现不一，沪指上涨0.13%创十年新高，数字货币概念股表现亮眼，行业板块涨少跌多。

神州细胞涉医保诈骗风波 7分钟前发布

神州细胞因旗下产品安佳因涉嫌医保诈骗被调查，多名血友病患者卷入案件。

亚特兰大联储主席预计今年仅再降息一次 9分钟前发布

亚特兰大联储主席博斯蒂克表示，预计美联储今年可能仅再降息一次，但经济环境变化使这一预测充满不确定性。

美联储官员暗示9月可能不会降息 10分钟前发布

美联储官员在杰克逊霍尔会议上表达对立即降息的谨慎态度，认为当前经济状况不支持降息，市场预期有所调整。

稀土价格持续上涨需求强劲支撑 11分钟前发布

8月以来，主要稀土品种价格上涨超10万元/吨，需求激增和政策推动下，稀土涨价趋势超出预期。

高盛看好中国股市上涨空间 12分钟前发布

高盛最新研报指出，中国股市尤其是中小盘股仍有显著上涨空间，大量“存量资金”尚未入市，市场动能强劲。

沪指创近十年新高后回落 14分钟前发布

周四，沪指盘中创下近十年新高后回落，收出十字星。分析认为未来走势有两种可能，大盘短线有回调压力但有望冲击3800点。

Copyright © 2021-2022 78Game. All rights reserved. 闽ICP备2024058879号-7