立即信息

V2.0.0

国数局局长刘烈宏:多点"数据语料作价入股"新模式,解锁数据价值新路径
阅读量:38 作者:刘景祥 2025-08-16 08:49:09

        在当今数字化浪潮中,数据已成为关键生产要素。8 月 14 日,国新办举行的 “高质量完成‘十四五’规划” 系列主题新闻发布会透露诸多数据要素市场的重要动向,其中上海、天津、安徽等地试点的 “数据语料作价入股” 新模式格外引人关注。国家数据局局长刘烈宏在发布会上明确指出,“‘十四五’时期,数据要素正加速赋能千行百业发展”,同时提及 “截至今年 6 月底,我国日均 Token(数据处理单位)消耗量突破 30 万亿,1 年半时间增长 300 多倍”,直观反映我国人工智能应用规模的快速增长;他还强调上海、天津、安徽等地的 “数据语料作价入股” 试点,核心是 “引导企业将高质量数据集折算为股权投入到相关企业”,并表示下一步国家数据局将 “通过体系化布局持续推进高质量数据集建设,加快打造具身智能、低空经济、生物制造等重点领域数据高地,推动全社会强化数据要素价值认同,加快推进数据要素价值共创”。数据语料作价入股正是释放数据要素价值、推动 “人工智能 +” 落地的重要探索,为数据价值挖掘开辟了全新路径。
一、解密数据语料
        数据语料,简言之,是用于训练、测试和优化算法模型,尤其是人工智能模型的各类数据集合。这些数据涵盖文本、图像、音频、视频等多种模态,恰似建造高楼大厦的基石,支撑着模型的构建与迭代升级。从公开信息可知,截至今年 6 月底,我国日均 Token(数据处理单位)消耗量突破 30 万亿,1 年半时间增长 300 多倍,这一数据背后,正是海量高质量数据语料对人工智能应用规模快速扩张的支撑 —— 无论是农业领域的智慧施肥模型,还是工业领域的钻井决策大模型,其性能提升都离不开针对性数据语料的训练。
        从内容属性划分,数据语料可分为通用语料与行业专用语料。通用语料包含海量日常文本,像新闻资讯、社交媒体内容、文学作品等,可助力模型掌握自然语言的普遍规律与语义理解;行业专用语料则聚焦特定领域,如农业领域利用数据赋能智慧施肥、工业领域依托海量测井数据开发行业大模型、服务业领域利用公路货运数据实现车货匹配,这些场景中所用的施肥参数数据、测井数据、货运轨迹数据,均属于典型的行业专用语料,能让模型在特定领域实现效率突破,如钻井决策效率提升 15 倍、单车运行效率提升 30% 以上。
        按加工处理程度,数据语料又分为原始语料与标注语料。原始语料是未经加工、直接采集的数据,其价值在于数据的初始性与全面性;标注语料则是在原始语料基础上赋予特定标签,极大提升模型训练的可用性。据规划,下一步将通过体系化布局持续推进高质量数据集建设,而高质量数据集的核心正是经过规范处理的标注语料 —— 只有确保数据语料的准确性、完整性、一致性与时效性,才能让模型真正成为产业升级的 “加速器”,避免因数据偏差导致决策失误。
二、数据语料作价入股的操作流程
(一)确权:明晰数据语料 “身份”
        确权是数据语料作价入股的关键起点,旨在明确数据语料的权利归属。公开消息显示,今年将推出数据产权等 10 余项制度,这些制度正是为数据确权提供顶层设计支撑。实践中,确权方式丰富多样:企业自行采集的数据语料可凭原始记录主张归属,合作场景下需通过协议划分权利,而深圳数据交易所等平台的产权登记试点,正是对数据产权制度的落地探索。随着国家层面数据产权制度的出台,未来数据语料确权将更具统一性与公信力,为作价入股扫清 “权利归属模糊” 的障碍。
(二)评估:衡量数据语料价值
        准确评估数据语料价值是作价入股的核心环节。据了解,数字经济的蓬勃发展已带动新增超 100 个新型职业,其中数据评估相关职业的兴起,正是数据语料价值量化需求的体现。目前评估可采用成本法、市场法、收益法:成本法适用于新生成的罕见病病历等语料,市场法需参考数据交易市场案例,收益法则可结合数据语料带来的效率提升(如智慧施肥提升产量 5.5%)测算未来收益。值得注意的是,相关部门正推动 “加快打造具身智能、低空经济、生物制造等重点领域数据高地”,这些领域的专用语料评估,或将迎来更细分的行业标准。
(三)入股:完成价值注入
        在完成确权与评估后,数据语料便可作价入股。从试点情况来看,上海、天津、安徽等地的 “数据语料作价入股” 实践,核心是引导企业将高质量数据集折算为股权投入到相关企业。具体操作中,企业需结合战略选择目标企业 —— 如 AI 企业可将医疗语料入股医疗科技公司;双方协商入股比例时,需参考数据评估结果,同时在协议中明确使用范围与保密义务;最终通过工商变更实现数据资本化。这种模式不仅让数据持有方盘活资产,更让接收入股企业获得 “模型训练燃料”,契合 “推动全社会强化数据要素价值认同,加快推进数据要素价值共创” 的目标。
三、数据语料作价入股的意义与挑战
(一)意义
  1. 对数据持有方:数据要素要 “赋能千行百业”,而作价入股为数据持有方提供了赋能路径。对轻资产数据型初创企业而言,将珍贵语料作价入股,既能缓解资金压力,又能借助合作方资源实现数据价值最大化 —— 数据要素的价值需通过 “价值共创” 释放,入股正是共创的重要形式。
  1. 对接收入股企业:我国 2024 年数据生产量达 41.06 泽字节,但 “规模化流通是释放数据价值的关键”。作价入股让企业直接获取高质量语料,无需从零开始采集,加速模型研发进程。例如工业企业获得测井数据语料后,可快速迭代钻井决策模型,实现 15 倍效率提升,这正是 “数据流通创造价值” 的直观体现。
  1. 对整体市场:消息显示年底前将数据流通节点城市扩至 50 个左右,而数据语料作价入股将与流通节点形成协同 —— 节点城市为数据跨域流通提供基础设施,作价入股则为流通提供 “资本化出口”。二者结合将激发数据市场活力,吸引社会资本投入数据产业,为数字经济注入新动能,推动 “人工智能 +” 在更多领域落地。
(二)挑战
  1. 法律政策层面:尽管计划今年推出数据产权制度,但当前数据交易监管、安全保护等法规仍待完善。不同地区产权登记标准不一,增加企业确权成本;而 “数据语料入股后的数据使用边界” 等问题,尚无明确法律界定,易引发纠纷。
  1. 技术标准层面:实现数据规模化流通需 “建立共识,形成统一标准”,这一要求同样适用于数据语料。目前语料质量评估无统一标准,不同机构评估结果差异大;同时,如何通过技术手段确保入股语料不泄露、不被滥用,仍需突破加密与隐私保护技术瓶颈。
  1. 市场机制层面:数据流通节点城市扩容计划,需配套活跃的交易市场与专业中介。但当前数据中介服务机构不足,数据资产评估师等人才短缺,且部分企业对 “数据换股权” 模式认知不足,参与积极性有待提升。
        从行业发展方向来看,数据要素正从 “有没有” 向 “好不好”“用得好” 转变。数据语料作价入股作为数据 “用得好” 的创新实践,随着国家数据产权制度的出台、流通节点的扩容与标准体系的完善,必将逐步解决现有挑战,成为推动数据要素价值释放、助力数字经济高质量发展的重要抓手。

来源:数智联盟

免费体验的信息数字化

立即云(全称:立即信息云服务平台)专注于信息数字化服务,是一套完备的信息数字化云解决方案,依托于 IDO、PaaS、IDM、SaaS 技术,使用户能借助系统软件高效管理经营,及时察觉问题,提升效率与质……

售前咨询热线

400-827-1661

举报中心

举报热线:400-827-1661

举报邮箱:lijixinxi@163.com

网站内容如有侵权或违法,请及时联系

网上有害信息举报专区

未成年人有害信息举报专区

举报受理和处置管理办法


咨询热线:400-827-1661    邮箱:lijixinxi@163.com   网站版本:2.0.50728

Copyright © 2013-2027  立即云  All Rights Reserved   冀ICP备19024136号-3 冀公网安备13010202003690号

官方邮箱:

lijixinxi@163.com

地址:

河北省石家庄市

Copyright © 2013-2025 www.lijiy.com  All Rights Reserved   冀ICP备19024136号-3

冀公网安备13010202003690号