主页 > 全部资讯 > 财经新闻 > 字节跳动豆包大模型更新，视觉理解能力补全“全家桶”，算力需求或迎新高峰

字节跳动豆包大模型更新，视觉理解能力补全“全家桶”，算力需求或迎新高峰

时间：2024-12-18 来源：未知作者：Gushan

在生成式AI领域持续发力的字节跳动迎来了新的里程碑。旗下大模型豆包不仅在日均tokens使用量上取得了显著的增长，而且在今日的火山引擎Force原动力大会上宣布了一系列重要更新，特别是推出了具备强大视觉理解能力的新模型。这些进展标志着字节跳动在构建全面的多模态AI生态系统的道路上迈出了坚实的一步。

截至目前，豆包大模型的日均tokens使用量已超过4万亿，自发布以来短短7个月内增长了33倍以上，显示出强劲的发展势头。这一成就背后是字节跳动对技术研发和用户体验优化的不懈追求。随着用户基础不断扩大和技术迭代加速，豆包已经成为市场上不可或缺的一部分。

今日发布的视觉理解模型进一步增强了豆包的能力，使其能够更好地处理图像识别、内容理解和推理等任务。该模型的价格被设定为0.003元/千Tokens，比行业平均水平低85%，这无疑将吸引更多开发者和企业采用这项技术。更重要的是，它填补了之前豆包在视觉交互方面存在的空白，使得智能硬件产品如智能耳机、玩偶和台灯等可以实现更丰富的多媒体交互体验，而不仅仅是限于语音层面。西部证券的一份报告指出，视觉SoC将成为未来AI硬件终端的标准配置，并新增对NAND存储芯片的需求，这对于相关产业链公司来说是一个重要的市场机遇。

此外，字节跳动还计划于明年1月推出新一代视频生成大模型，以及展示了来自抖音旗下的即梦AI的新一代图片生成模型和动态海报功能。这些新产品和服务将进一步丰富豆包家族的产品线，同时也表明公司在视频内容创作领域的决心和技术实力。国盛证券认为，字节跳动已经拥有了开放式耳机音频技术和丰富的软件应用生态，未来有望成为AI眼镜市场的核心参与者之一。

值得注意的是，随着文字、视觉理解和视频生成等多个维度的大模型相继推出，“豆包+”生态系统逐渐成型，这可能导致字节跳动的算力需求急剧上升。据分析师估算，仅以当前的文字大模型为例，如果参考ChatGPT的MAU(月活跃用户)规模，那么推理和训练所需的A100显卡数量分别约为35万和12万个。而对于视频生成模型而言，其对算力的要求更高;例如，当即梦AI的Magic Video v2达到1亿MAU并每天生成10分钟视频时，预计需要约28万个英伟达H100 GPU，若MAU翻番，则需求将达到55万个。

服务器代工厂英业达近期透露的信息也反映了这一点——本季度客户对AI服务器的需求超出预期，今年AI服务器营收有望同比增长2.5至3倍，而明年的出货量预计将继续攀升。民生证券分析称，随着豆包用户基数迅速扩大，算力中心扩建将成为必然趋势，从而带动AI服务器及相关基础设施如热管理解决方案的需求增加。特别是液冷技术，在满足高效散热的同时还能节省能源成本，有望开辟出广阔的市场空间。

相关阅读

信用债市场滞后反应与未来走势分析：政策宽松预期下的机会与挑战 5分钟前发布

近期，中国债券市场呈现出利率债与信用债分化的态势。随着上周政治局会议和中央经济工作会议释放出货币政策“适度宽松”的信号，长端利率债迅速对降息逻辑做出反应，收益率出现显著下行。相比之下，信用债特别是中低等级长期限城投债的利差则普遍走阔了5BP以上，显示出一定的滞后性。这种分化主要是由于利率债对政策变化更为敏感，而非银机构等投资者在降息预期下抢先布局利率债所致。

字节跳动豆包大模型更新，视觉理解能力补全“全家桶”，算力需求或迎新高峰 7分钟前发布

赛富时大举招聘销售人员，全力推进AI应用工具的市场扩展 10分钟前发布

美国知名软件巨头赛富时(Salesforce)的首席执行官马尔克·贝尼奥夫在本周二宣布了一项雄心勃勃的人力扩充计划，公司准备新增2000名销售人员，专门负责推广最近发布的先进AI应用工具。这一举动是在上个月承诺招募1000人专门从事人工智能软件销售的基础上进一步加码，反映了赛富时对AI市场的乐观态度和快速发展的信心。

宁德时代启动巧克力换电生态，曾毓群亲自宣布新规划引领行业变革 12分钟前发布

在新能源汽车迅速发展的背景下，作为全球领先的电池供应商，宁德时代(300750.SZ)于近日举办了备受瞩目的巧克力换电生态大会，正式宣布了其在换电领域的最新布局和发展规划。值得注意的是，宁德时代的创始人、董事长兼CEO曾毓群罕见地亲自出席并发表讲话，这不仅彰显了公司对此次发布会的重视程度，也暗示了换电业务在未来战略中的关键地位。

科大讯飞子公司讯飞医疗科技寻求通过香港IPO筹资5.83亿港元 1小时前发布

讯飞医疗科技（Xunfei Healthcare）申请通过香港IPO发行704万股股票。发行价定为每股82.80港元。预计股票将从12月30日开始交易。该公司是一家由人工智能支持的医疗保健解决方案提供商，提供支持一系列医疗保健服务的产品和解决方案。华泰国际、广发证券（香港）和建银国际为联席保荐人。据彭博计算，该公司寻求通过IPO筹资约5.83亿港元（约合7,500万美元），另可行使超额配售权。

能抵抗病毒感染的全新细菌免疫系统发现 2小时前发布

记者17日从中国药科大学获悉，该校多靶标天然药物全国重点实验室教授肖易倍团队及国内相关科研机构发现了一种全新的细菌免疫系统CRISPR-CAAD。该系统通过“耗光”细菌内部的能量分子ATP来阻止病毒扩散。这项研究揭示了细菌免疫系统与能量代谢之间的独特联系，并为细菌抵抗病毒感染的防治提供了新思路。相关成果近日发表在国际学术期刊《科学》上。（科技日报）

逻辑量子比特纠缠数量再创纪录 2小时前发布

据英国《新科学家》杂志网站近日报道，英国初创量子计算机公司Quantinuum宣布，他们成功实现50个逻辑量子比特的纠缠，创下逻辑量子比特创建和纠缠数量新纪录，为研发实用量子计算机奠定了基础。（科技日报）

再创新纪录，中证A500基金规模突破3000亿元 3小时前发布

指数发布不到三个月时间，跟踪基金规模已经突破3000亿元，中证A500指数再创新纪录。数据显示，围绕该指数布局的基金产品超过110只，目前成立的仅有45只，当前还有多只基金正在发行，更多基金已经上报，后续规模还将进一步增长。（上证报）

多家险企股权觅新主，挂牌多成交难 3小时前发布

根据北京产权交易所12月16日信息，中银三星人寿保险有限公司24%股权拟挂牌转让。这是今年以来险企股权变动的一个缩影。记者根据公开信息梳理发现，不包括按比例增资扩股导致的股权变动，年内已有28家险企股权发生变更，同时，15家险企股权仍在寻找新的买家，后续股权可能会发生变化。尽管正在寻觅新买家的险企股权较多，但整体来看，险企股权转让成交难度较大，周期较长，部分股权转让公告发布了多次也未能成交。（证券日报）

券商追逐大模型赋能投研，分析师用AI写研报再进一步 4小时前发布

券商正在尝试用AI来解读重要会议内容。近日，中金公司大类资产研究团队推出了AI策略系列报告，第一篇报告聚焦中央经济工作会议，从AI视角去解读年度政策思路。最近两年，投研领域涌现不少AI应用成果。除去年引发市场较高关注的分析师用AI撰写医美研报、发布AI数字分身外，还有多家券商推出“大模型智能投研”成果。“长期看，大模型将推动投研工作范式的变革，替代人工完成更多创造性工作。”恒生电子首席科学家、恒生研究院院长白硕表示。（证券时报）

两市融资余额减少58.81亿元 4小时前发布

截至12月17日，上交所融资余额报9549.81亿元，较前一交易日减少18.88亿元；深交所融资余额报9094.78亿元，较前一交易日减少39.93亿元；两市合计18644.59亿元，较前一交易日减少58.81亿元。

突破“卡脖子”技术，世界最大压缩空气储能电站开工建设 5小时前发布

今天（12月18日），世界最大压缩空气储能电站——华能金坛盐穴压缩空气储能发电二期项目在江苏常州正式开工建设。华能金坛盐穴压缩空气储能发电二期项目，规划建设两套350兆瓦非补燃式压缩空气储能机组，总容积达120万立方米，是目前世界上单机功率最大、总容量最大、综合效率最高的压缩空气储能电站。该工程作为江苏省重大项目，突破了“卡脖子”技术壁垒，研发制造出世界最先进的空气透平和压缩机组，并实现核心设备的100%国产化，服务国家能源安全战略。（央视新闻）

“通义”应用团队从阿里云分拆，并入阿里智能信息事业群 5小时前发布

阿里旗下的AI应用“通义”近期正式从阿里云分拆，并入阿里智能信息事业群。有知情人士称，此次调整包括通义To C方向的产品经理，以及相关的工程团队，一并调整至阿里智能信息事业群。调整后，通义PC及App团队与智能搜索产品“夸克”平级，原有的通义实验室，仍然留在阿里云体系内。这一举措，可以看作是阿里梳理内部AI To C应用的一步。（36氪）

豆包发布全新视觉理解模型，价格进入“厘时代” 6小时前发布

12月18日，在火山引擎force原动力大会上，火山引擎总裁谭待发布了全新的豆包视觉理解大模型，用户可以同时输入文本和图像相关信息，模型可以给出回答，它具备更强内容识别能力、更强理解和推理能力和更细腻的视觉描述能力。谭待表示，5月，豆包大模型行业价格降低了99%，让企业可以放心应用，如今多模态也一样，视觉理解大模型同样是基于tokens定价，价格为0.003元/千tokens，比行业价格低85%，视觉理解模型进入“厘时代”。（全天候科技）

豆包发布全新图片生成模型，一句话可生成海报 6小时前发布

12月18日，在火山引擎force原动力大会上，即梦AI产品经理李超发布了全新的图片生成模型，他现场示范了海报生成功能，只需要一句话，就可以生成海报，不仅提高了效率，还能让创作出设计师水准的海报，更全面的描述，更精美的画面与排版，同时，还可以让海报动起来，实现动态效果。