数据资源“大摸底”:新增人工智能、大模型、低空经济等热点领域指标
-
发布时间:2025年05月28日
2024年,全国数据生产总量41.06泽字节(ZB),相当于拍摄1300多万部《哪吒2》这样的高复杂度3D动画电影——近日,《全国数据资源调查报告(2024年)》(以下简称《报告》)对外发布,亮出全国数据资源“家底”。
此次调查展现了当前中国数据资源怎样的发展现状?数据生产主要集中在哪些地区和行业?数据资源开发利用前景如何?
数据生产总量首次突破40ZB
对全国数据资源进行“大摸底”,这是第二次。
据介绍,2024年,国家数据局联合相关部门首次开展全国数据资源调查,对数据资源进行摸底。2025年2月,本年度全国数据资源统计调查工作启动,历时近1个月完成,并于4月29日对外发布《报告》。
相较于第一次,今年的调查有哪些不同?有什么新发现?
全国数据资源统计调查工作组有关负责人介绍,本年度调查在上年度数据规模、开发利用和应用情况等指标基础上,新增人工智能、大模型、低空经济等热点领域调查指标,并对数据资源地区、行业分布情况做了分析测算。
看数据总量,2024年全国数据生产总量首次突破40ZB,达到41.06ZB,同比增长25%,增速较去年提高2.56个百分点。人均数据生产量约为31.31太字节(TB),相当于1万多部高清电影,同比增长25.17%,数据生产总量和人均产量实现同步跃升。
看算力布局,2024年,全国算力总规模达到280EFLOPS(每秒百亿亿次浮点运算),智能算力规模达90EFLOPS,占比提升至32%,为海量数据计算提供智能底座。其中,中央企业算力规模增长近3倍,智能算力占比为40.22%;数据技术企业算力规模同比增长近1倍,智能算力占比为43.63%。
看新增指标,随着人工智能快速发展,用于开发、训练和推理的数据量同比增长40.95%。智能家居、智能网联汽车等智能设备数据增速位居前列,分别为51.43%、29.28%。无人机应用范围快速拓展,机器人产业化进程不断加快,带动低空经济和机器人数据生产量增速超过30%。
国家工业信息安全发展研究中心主任蒋艳表示,我国数据要素化进入新阶段,数据领域新技术、新模式、新业态不断涌现。从今年的调查看,一方面智能网联汽车、大模型等智能化应用,推动了全社会数据增长,这类数据量占比超四成;另一方面低空经济、机器人等新领域的数据生产量虽然不高,但增速超过30%,成为新的增长点。
区域和行业分布集中度高
全国数据资源规模优势持续扩大,各地之间存在一定差异。
根据《报告》,经济大省数据资源集聚效应明显,广东、江苏、山东、浙江、河南和四川6个省份数据生产量占全国比重达57.45%。东部地区数据资源开发利用活跃,北京、上海企业人工智能投入平均水平位居全国前二,浙江应用大模型的企业比例位居第一。
“山东是经济大省、工业大省,有着海量的数据资源和丰富的应用场景。”山东省大数据局局长王健说,近年来,山东强化工作统筹、深化数据共享、创新场景应用,全省一体化政务服务能力位列全国第一方阵,“开放数林指数”位居全国第一。
根据山东省发布的数据,山东获批全国工业品主数据标准建设试点,2024年遴选29个试点县(市、区)的特色细分行业,全面开展试点工作,试点行业数量居全国第一;形成245个产品主数据标准,约占全国总量30%;全省重点监测范围内大数据企业超900家,2024年营收突破2600亿元;建成全国首个海洋大数据交易服务平台,交易额超1500万元。王健说,山东还将着力加强数据源头供给,开展公共数据汇聚行动,将各级各部门数据汇聚至省一体化大数据平台,挖好数据要素这座“富矿”。
蒋艳表示,从全国看,数据资源向东部地区聚集,江苏、广东的企业数字化投入是全国平均水平的1.71倍,也为区域数据开发利用提供有力支撑。
区域发展有差异,行业分布也存在集中度较高的情况。
国际数据公司(IDC)今年5月发布中国金融云市场跟踪报告显示,2024年下半年,中国金融云市场规模达到52.3亿美元,同比增长11.0%。业内人士分析,金融业数据资源和应用场景极为丰富,数据生产量长期以来稳居各行业前列,相关市场规模近年也在不断增加,数据交易规模占总体比重超过30%,成为最大的细分行业数据交易市场。
全国数据资源统计调查工作组有关负责人表示,随着我国数字化、网络化、智能化进程加速,制造、金融、交通物流行业数据生产总量领先其他行业,金融、采矿、交通物流行业企业平均数据生产量位居前三。交通物流、电力行业数据资源开发利用活跃度远高于全国平均水平,分别为78.24%、75.83%。
唤醒更多“沉睡数据”
有了丰富的数据资源,如何充分开发利用是关键。在第一次全国数据资源调查中,调查组发现我国海量数据和丰富场景优势潜力亟需释放。
蒋艳表示,2023年,全国新增数据存储量为0.95 ZB,生产总量中仅有2.9%的数据被保存,由于海量数据复用价值较低,大部分过程类数据产生后即被丢弃或覆盖。数据存而未用现象较为突出,企业一年未使用的数据占比约四成,数据加工能力不足导致大量数据价值被低估、难以挖掘复用。
如今,数据资源开发利用有没有新变化?
“在本年度调查中,我们看到数据资源开发利用活跃度稳步提升。”全国数据资源统计调查工作组有关负责人说,公共数据资源供给和企业用数需求双向拉动,企业加快应用大模型,高质量数据集建设进入加速期。
一方面,公共数据资源开发利用步伐加快。根据《报告》,2024年,全国地市级以上公共数据开放平台数量增长7.5%,开放的数据量增长7.1%;超六成省(自治区、直辖市)、计划单列市启动公共数据授权运营工作。
另一方面,企业用数活力逐步提升。2024年,存储数据中活跃数据总量同比提升22.73%,活跃数据总量占存储数据总量62.04%;约66%的行业龙头企业和30%的数据技术企业购买过数据;利用大模型的数据技术企业和数据应用企业数量分别增长57.21%、37.14%;数据技术企业积极推动数据集建设,高质量数据集数量增速达27.4%。
此次《报告》预测,全国数据生产总量将保持增长态势,2025年有望突破50ZB,无人驾驶、具身智能、低空经济等战略性新兴产业和未来产业的数据资源规模将保持高速增长。数据资源流通利用将进入加速期,数据治理、数据标注、数据智能等相关企业迎来发展机遇期,信息技术服务商加速向数据运营服务商转型,数据产品和服务供给能力将大幅提升,催生一批数智应用新产品新服务新业态。企业数据价值挖掘重心从服务自身数字化转型向数据要素化、市场化拓展,数据跨主体流通、跨行业应用、跨场景赋能的乘数效应加速释放。
随着数据资源规模优势持续扩大,数据要素市场化、价值化进程进一步提速,更多“沉睡数据”有望被唤醒。专家分析,作为全球首个将数据纳入生产要素的国家,中国已初步构建起门类齐全的数据产业链。截至目前,全国数据领域相关企业超19万家,数据产业规模超2万亿元。按照20%以上的年均增长率测算,2030年中国数据产业规模将达7.5万亿元。
(来源:人民日报海外版)
浏览次数:107