免责声明：78财经所有资讯仅代表作者个人观点，不构成任何投资理财建议。

主页 > 全部资讯 > 财经新闻 > 华为发布AI黑科技UCM 提升推理效率

华为发布AI黑科技UCM 提升推理效率

时间：2025-08-13 来源：作者：78小编

8月12日下午，华为发布了一款名为UCM（推理记忆数据管理器）的AI“黑科技”，旨在提升AI推理效率和用户体验。AI产业正从追求模型能力极限转向优化推理体验，而推理体验直接关系到用户满意度和商业可行性。华为计划9月在魔擎社区开源UCM，并逐步贡献给主流推理引擎社区及存储厂商。

华为发布AI黑科技UCM 提升推理效率

UCM以KV Cache为中心，融合多种缓存加速算法工具，通过分级管理推理过程中的KV Cache数据，扩大推理上下文窗口，从而实现高吞吐、低时延的推理体验，降低每个Token的推理成本。随着AI产业进入代理式人工智能时代，模型规模扩张和长序列需求增加，导致KV Cache容量超出显存承载能力。国外领先芯片厂商通过硬件迭代、软件优化和生态绑定构建了难以替代的“铁三角”。相比之下，中国企业在单点硬件技术上有所突破，但在软件及生态适配方面仍有差距。

为加速国产化改造，各行业开始重视构建国产推理生态。UCM的核心价值在于提供更快的响应速度和更长的推理序列。例如，通过动态KV逐层卸载和位置编码扩展等技术，UCM能将超长序列的Cache分层卸载至外置专业存储，实现10倍级推理上下文窗口扩展。此外，UCM还能根据记忆热度在不同存储介质中流动，结合稀疏注意力算法，使长序列场景下的TPS提升2至22倍，进一步降低每个Token的推理成本。

华为与中国银联合作，在智慧金融领域试点应用UCM，涵盖客户之声、营销策划和办公助手三大业务场景。以办公助手为例，使用华为AI推理加速方案后，可支持超过17万Tokens的超长序列推理，有效解决超长序列模型推不动的问题。

相关阅读

华为发布AI黑科技UCM 提升推理效率刚刚发布

华为发布AI数据管理器UCM，通过优化KV Cache提高推理效率和用户体验，计划9月开源。

特斯拉Model 3长续航版上市续航达830公里 1分钟前发布

特斯拉Model 3长续航后轮驱动版正式上线，续航达830公里，售价26.95万元起。

361度上半年收益创新高 1分钟前发布

361度上半年集团收益达57.05亿元，同比增长11%，电商业务增长显著，儿童业务表现亮眼。

国盾量子上半年收入增长74.54% 3分钟前发布

国盾量子发布2025年半年度报告，上半年收入达1.2亿元，同比增长74.54%，三大业务板块均实现增长。

多家上市公司入股众擎机器人 4分钟前发布

众擎机器人完成新一轮融资，京东、宁德时代等多家上市公司成为间接股东。

衢州发展拟购先导电科股权推进转型 4分钟前发布

衢州发展计划收购先导电科大部分股权，扩展至新材料领域，加速向硬科技实体转型。

广州将推出电力期货支持新能源 10分钟前发布

广州市政府宣布支持研究并适时推出电力期货，以丰富能源衍生品种类，助力绿色能源交易。

A股股权融资额激增超8300亿 11分钟前发布

今年A股市场股权融资总额突破8300亿元，同比增长超300%，IPO与定增活动显著增强。

黄金行业业绩亮眼多家公司净利润大增 12分钟前发布

受金价高企影响，多家黄金矿产开采公司上半年净利润大幅增长，业绩表现亮眼。

液冷技术市场需求激增数据中心散热迎来新机遇 12分钟前发布

液冷技术因解决高密散热问题而需求激增，预计2024年中国液冷服务器市场规模将达23.7亿美元，相关产业链投资机会显著。

上证指数早盘上涨0.51% 燃气航运领涨 19小时前发布

8月12日，上证指数早盘上涨0.51%，报3666.33点。燃气与航运港口板块涨幅居前，分别上涨2.11%和1.93%。

玉禾田股价涨停携手智元创新研发环卫机器人 19小时前发布

玉禾田股价连续两日涨停至29.5元，与智元创新合作开发环卫机器人，推动智慧化转型。

美股散户韧性十足市场波动中持续买入 19小时前发布

面对市场波动，美股散户展现出强大韧性，持续买入推动股市反弹，成为市场稳定的重要力量。

全球机构加速分散美元资产配置 1天前发布

面对美国政策不确定性，全球机构正加速分散美元资产，增加对欧洲股市及新兴市场的投资。

东方甄选股价大涨转型成功带动市值飙升 1天前发布

东方甄选股价一年内涨超200%，市值突破300亿港元，得益于从“主播驱动”转向“产品驱动”的成功转型。

Copyright © 2021-2022 78Game. All rights reserved. 闽ICP备2024058879号-7