免责声明:78财经所有资讯仅代表作者个人观点,不构成任何投资理财建议。
主页 > 全部资讯 > 财经新闻 > DeepSeek发布新版模型 性能显著提升

DeepSeek发布新版模型 性能显著提升

时间:2025-03-25 来源: 作者:78小编

3月24日晚,DeepSeek发布了更新版的DeepSeek-V3模型,版本号为DeepSeek-V3-0324,参数增至6850亿,比初代V3的6710亿略有提升。新模型尚未公开系统卡。

DeepSeek发布新版模型 性能显著提升

DeepSeek坚持开源理念,新版模型采用与DeepSeek-R1相同的MIT协议,允许更多商用和模型蒸馏,给予开发者更大自由度。性能方面,编程能力显著优化,尤其在前端代码生成上表现突出。网友测试显示,新版DeepSeek-V3在网站开发和UI设计方面表现出色,只需简单提示就能快速生成高质量页面,审美水平接近全球顶尖闭源模型Claude 3.7 Sonnet。此前,《科创板日报》报道过初代DeepSeek-V3因性价比高而备受关注,在多项基准测试中超越Qwen2.5-72 B和Llama-3.1-405 B等开源模型,与GPT-4o和Claude-3.5-Sonnet并驾齐驱。

幻方量化在论文中指出,通过算法、框架和硬件优化,DeepSeek-V3训练成本极低,假设H800GPU租用价为每块2美元/小时,总训练成本仅557.6万美元。API服务定价调整为每百万输入tokens 0.5元(缓存命中)/2元(未命中),每百万输出tokens 8元,总计10元人民币。相比之下,OpenAI的GPT 4o定价高昂,输入5美元/百万Token,输出15美元/百万Token,总计约140元人民币。

相关阅读
DeepSeek发布新版模型 性能显著提升 刚刚发布

DeepSeek发布更新版DeepSeek-V3-0324模型,参数增至6850亿,编程能力尤其在前端代码生成上表现突出。

DeepSeek发布V3小版本升级 3小时前发布

DeepSeek发布V3-0324小版本升级,参数量达6850亿,已上线Hugging Face。用户可在官网等平台试用新版V3。

提振消费专项行动方案启动 经济复苏有望加速 3小时前发布

《提振消费专项行动方案》实施,政府加大消费支持力度,推动经济复苏与转型,关注智能驾驶、精神消费等新兴领域。

小米配售8亿股筹资425亿港元 3小时前发布

小米宣布在港交所配售8亿股,每股定价53.25港元,预计筹集约425亿港元用于业务扩展和研发。

美股集体上涨 特斯拉领涨科技股 3小时前发布

美股三大指数全线上涨,特斯拉涨幅近12%,创去年11月以来最大单日涨幅,其他大型科技股也多数走高。

央行调整MLF操作方式 降低银行负债成本 3小时前发布

央行采用多重价位中标调整MLF操作,旨在降低银行负债成本,增强金融支持实体经济的可持续性。

亚洲首批个股杠杆及反向产品在港上市 3小时前发布

24日,亚洲首批个股杠杆及反向产品在港交所上市,涵盖特斯拉等五只热门美股,为投资者提供新的交易工具。

红利资产表现亮眼 多板块领涨市场 3天前发布

市场主要指数震荡调整,红利资产和深海科技等板块表现亮眼。多家公司年报净利润大幅增长,24家公司股息率超3%。

国内首家人形机器人创新中心发布“格物”平台 3天前发布

国家地方共建人形机器人创新中心联合多所高校发布“格物”平台,推动人形机器人技术产业化,集成多项突破性技术。

特斯拉人形机器人Optimus今年试产 3天前发布

特斯拉宣布人形机器人Optimus将在今年进入试生产阶段,计划年内生产5000台。

司马南因偷税被罚926.94万元 3天前发布

税务部门查明司马南及其公司通过隐匿收入等手段偷税,追缴税费并加收滞纳金和罚款共计926.94万元。

高分红绩优股成基金经理新宠 3天前发布

上市公司2024年报显示,养殖和能源化工等高分红行业的绩优股获多位基金经理加仓。

美联储放缓缩表步伐引发担忧 3天前发布

美联储大幅放缓缩表步伐,前财长萨默斯警告这反映出市场对长期联邦债务需求的担忧。

华为Pura X折叠屏手机发布 起售价7499元 4天前发布

华为首款竖式折叠屏手机Pura X发布,起售价7499元,搭载鸿蒙操作系统5,性能提升显著。

A股震荡调整 深海科技与军工板块亮眼 4天前发布

3月20日,A股市场震荡调整,创业板指领跌,深海科技和军工板块表现突出,市场成交额减少。

Copyright © 2021-2022 78Game. All rights reserved. 闽ICP备2024058879号-7