免责声明:78财经所有资讯仅代表作者个人观点,不构成任何投资理财建议。
主页 > 全部资讯 > 财经新闻 > 高质量数据集推动AI发展

高质量数据集推动AI发展

时间:2025-11-18 来源: 作者:财经大神

当你在政务App上咨询“医保报销要多久到账”,或在医疗智能体里描述症状时,后台的人工智能(简称AI)之所以能理解并给出自然回答,是因为它学习了大量真实数据。这些数据来自政策文件、医疗记录、热线对话、网络评论等,共同构成了高质量数据集。高质量数据集是智能时代最重要的数据基础设施之一,对于AI的发展至关重要。

高质量数据集推动AI发展

AI模型的聪明程度取决于其学习的数据质量。高质量数据集是AI训练、推理和验证的关键基础,如果数据错误或不完整,AI的成长就会走弯路。然而,中文开源数据集数量仅占全部开源数据集的8%左右,我国大部分AI模型依赖外国开放数据,这不仅带来语义偏倚与文化误读风险,也限制了本地化场景下的泛化能力。此外,中文互联网上的低质量语料可能使AI模型退化,就像用模糊不清的复印件反复复印,最终结果只会越来越差。

鉴于高质量数据集的重要性,我国已将其纳入政策顶层设计。但当前仍面临数据分散、标准不一、统筹不力等问题。政府、高校、科研机构和企业之间的数据壁垒严重,缺乏统一的数据平台与协调机制。公共数据开放成为破解数据供给瓶颈的关键路径。公共数据体量大、价值高、类型广,应优先向社会开放用于AI及相关产业发展。利用公共数据建设高质量数据集,有望提升政府决策智能化水平,促进市场创新,打破数据垄断,弥合数字鸿沟。

目前,国际上已有大量基于公共数据开发的高质量数据集向开发者开放,我国上海、杭州等城市也尝试上线了一些用于AI训练的数据集。但大部分地方尚未启动这项工作,面临不懂、不愿、不能、不敢的困境。许多领导干部和公务员对数据重要性认识不足,高质量数据集建设投入大且繁琐,技术门槛高,数据安全和隐私保护也是主要顾虑。

为解决这些问题,需要从四个方面入手:首先,提高各级部门对数据开放的认识;其次,建立利益分配和激励机制;第三,提供技术支持,消除数据流动的技术障碍;最后,加强数据安全,确保合规使用。只有打破数据供给瓶颈,才能推动AI走向质的跃迁,让公共数据助力AI发展,实现公共价值。

相关阅读
高质量数据集推动AI发展 刚刚发布

高质量数据集是AI发展的关键,我国需加强公共数据开放和利用,提升AI模型的本地化能力和智能化水平。

低空经济面临成本效用分歧挑战 1分钟前发布

低空经济因产品价格高、技术路线不明和应用链条长等问题,导致市场难以形成有效价格,需通过降本增效解决。

美股全线跳水 科技股估值担忧升温 1分钟前发布

美股三大指数全线跳水,纳指一度大跌近1.5%,市场对科技股估值过高的担忧加剧。

美股三大指数全线下跌 2分钟前发布

11月17日,美股三大指数集体下跌,大型科技股多数走低,热门中概股多数下跌。

全国证券交易印花税同比增长88.1% 5分钟前发布

财政部数据显示,前10个月全国证券交易印花税达1629亿元,同比增长88.1%,显著高于一般公共预算收入增幅。

亚马逊发债150亿美元加码AI基础设施 5分钟前发布

亚马逊发行150亿美元债券,用于收购和资本支出等,以支持其人工智能基础设施建设。

华尔街投资人警告市场过热建议增加现金配置 9分钟前发布

华尔街资深投资人杰弗里·冈拉克警告资产价格高估,建议投资者将20%的投资组合配置为现金,以防范市场回调风险。

美联邦航空局终止航班削减令 20小时前发布

读客文化公告披露,公司控股股东华楠、华杉的一致行动人宁波读客通过询价转让方式减持4,108,182股股份,占总股本1.03%,转让价格为8.37元/股,交易金额约3438.55万元。本次权益变动后,控股股东及其一致行动人合计持股比例由71.91%降至70.88%,变动触及1%整数倍。此次转让不通过二级市场进行,不影响公司控制权,亦未对公司治理结构和持续经营造成重大影响。

河南拟培育20个两业融合区 享财政奖励 20小时前发布

河南省发改委、财政厅近日发布通知,启动先进制造业与现代服务业融合发展区培育工作。目标围绕“1 2 4 N”任务体系,聚焦重点区域和关键环节,推动两业链条延伸、相融相长、耦合共生。计划分年度、分批次培育约20个融合度高、创新活跃、质量效益突出的两业融合发展区,并给予省级财政奖励,助力构建健全的产业生态体系。

阿里巴巴宣布“千问”项目,美股夜盘涨5% 20小时前发布

阿里巴巴宣布启动“千问”项目,基于自研Qwen大模型推出同名个人AI助手——千问APP,正式进军AI C端市场。该APP公测版已上线,全面对标ChatGPT,旨在与全球主流AI产品展开竞争。此举引发市场积极反应,推动阿里美股夜盘一度上涨5%。公司希望通过“千问”在智能体(AI Agent)领域实现突破,抢占个人AI助手赛道先机,同时也彰显其在大模型技术上的积累与全球化布局野心。

日经225跌0.7%东证跌0.8%早盘收市 20小时前发布

截至早盘收盘,日经225指数下跌0.7%,东证指数下跌0.8%。市场整体呈现下行态势,投资者情绪偏谨慎。

阿里巴巴夸克上线千问助手,搭载Qwen大模型 20小时前发布

阿里巴巴旗下夸克于2025年11月17日宣布上线“千问助手”,该助手基于阿里通义千问(Qwen)系列最强大的大模型打造,具备出色的推理、理解和执行能力。此举标志着阿里在个人AI助手领域的加速布局,旨在通过Qwen高效、智能的混合推理能力,提升用户体验。此前,阿里已推出千问App公测版,进一步推动其AI生态建设。

碳酸锂期货涨超8%,集运指数涨超7% 21小时前发布

11月17日,国内期货市场涨跌不一,碳酸锂期货主力合约大幅上涨超8%,报94460元/吨,创阶段性新高,反映供需格局偏紧及市场需求回暖。同时,集运指数(欧线)主力合约涨超7%,表现强势。其他品种中,硅铁、铁矿石、焦炭等黑色系商品普遍上涨超1%。相比之下,贵金属及部分化工品走弱,沪银跌超3%,沪金、菜粕、烧碱等跌逾2%。整体来看,市场多空博弈加剧,新能源相关品种成为资金关注焦点。

新凯来借壳上市?科瑞技术辟谣回应 21小时前发布

近日,市场传闻新凯来将借壳科瑞技术上市,对此科瑞技术在互动易平台明确回应称传闻不属实。公司证券部工作人员表示,虽为新凯来供应半导体设备及零部件,但客户不仅限于新凯来,国内外多家大型半导体企业均有合作,目前订单充足,排产已至明年。

隔夜SHIBOR上涨14.5基点,7天利率升4.6基点 21小时前发布

2025年11月17日,上海银行间同业拆放利率(Shibor)短端品种普遍上涨。隔夜Shibor报1.5080%,大幅上升14.50个基点;7天Shibor报1.5140%,上涨4.60个基点;14天Shibor报1.5500%,上涨4.10个基点。值得注意的是,14天期Shibor利率已高于1个月期Shibor的1.5200%,出现期限利率倒挂现象。而3个月Shibor报1.5800%,与前一交易日持平。整体来看,市场短期资金利率上行压力显现,流动性边际收紧,或反映临近月中

Copyright © 2021-2022 78Game. All rights reserved. 闽ICP备2024058879号-7