一、为什么是"有序"
数据要素时代的核心矛盾,是数据"既多又乱"。
数据多——医院 / 政府 / 企业每天都在产生海量数据;数据乱——这些数据各有口径、各有权属、各有合规边界、各有质量等级。数据多不等于数据被使用;数据被使用,前提是它"有序"。
让数据资源更有序,是把"乱"变成"序"的过程:让来源可追溯、让权属可分配、让合规可承担、让质量可被独立检查、让产品可被规范流通、让应用可被持续运营。
这件事可以挂在墙上当口号,也可以拆解为可被独立验收的步骤。我们选择后者。
二、四步框架
我们把"让数据资源更有序"拆解为四步:
第一步 · 看得见
让数据资源被识别。
数据要素的起点不是"治理",是"被看见"。一个区域、一家医院、一个数据集团,往往不知道自己手里有什么数据资源、规模多大、价值密度如何、可合规使用的边界在哪里。
我们做的:数据资产盘点报告 / 数据画像 / 价值评估。
对应能力:A 数据要素咨询服务。
第二步 · 说得清
让数据资源的权属、合规、质量被精确表达。
数据要素流通利用的最大障碍,不是技术,是"说不清"——谁拥有什么、谁能用什么、用到什么程度、出问题谁担责。这件事如果说不清,合作就不会发生;说清了,合作才有起点。
我们做的:权属确认 / 合规设计 / 数据治理与标准化 / 高标准首营资质交换 / 合作四原则。
对应能力:D 数据治理与标准化 / E 数据权属治理 / F 数据合规审查与制度建设。
第三步 · 走得动
让数据资源在合规边界内合规流通。
"说得清"之后,数据要素需要能够实际流通——按交付方式(API / 拷盘 / 可信数据空间)、按合约、按工艺、按登记凭证、按数据交易所规则。流通本身是检验"说得清"是否真正成立的过程。
我们做的:数据加工与标注(5000 万条/年标注产能)/ 数据产品设计 / 数据产品质量控制(4 阶段 14 工序 + 三级质控)/ 数据产品交易(5 家数交所累计挂牌 26 项)。
对应能力:G 数据产品设计 / H 数据加工与标注 / J 数据产品质量控制 / L 数据产品交易 / I 全链路数据安全。
第四步 · 用得上
让数据资源转化为可被持续使用的应用与价值。
数据要素工作的终点不是"流通到位",是"被用起来"——智能体 / 行业模型 / 场景应用 / 长期运营。"用得上"意味着数据要素从基础设施侧延伸到价值侧。
我们做的:智能应用提供 / 行业模型 / 持续运营(5 个智能体已上线 / 16 个已开发应用场景)。
对应能力:O 智能应用 / 智能体 / 行业模型 / N 数据资源 / 产品 / 平台持续运营。
三、四步框架与产业政策环境的对应
四步框架不是凭空设计——它对应 2024-2025 年间产业与政策的真实推进:
| 步骤 | 政策与产业环境 |
|---|---|
| 看得见 | 公共数据资源授权运营在多个区域试点 / 数据资产入表口径推进 |
| 说得清 | 38 项国家标准 / 行业标准 / 地方标准在数据要素方向同步推进 |
| 走得动 | 5 家数据交易所累计挂牌 26 项数据产品 / 可信数据空间作为数据基础设施被官方确认 |
| 用得上 | 国家卫健委等 5 部门《关于促进和规范"人工智能+医疗卫生"应用发展的实施意见》(2025-10-20)/ 智能体备案体系 |
每一步都不只是公司方法论——它对应行业正在发生的具体动作。
四、四步框架与具体行为轨迹
四步框架不是文档里的图——它对应具体的项目、数字、痕迹:
- 看得见 —— 公共数据授权运营 4 已签(青海 / 山西 / 江苏某地市(已通过省级公示)/ 深圳福田);公共数据 500GB 已采集;中医药古籍 8000 册已采集。
- 说得清 —— 高标准首营资质交换体系 / 合作四原则 / 38 项国标参编 / WG2-WG6 五组成员 / 主要起草单位之一参编《可信数据空间标准化研究报告(2025 版)》。
- 走得动 —— 自有 7 大类成品数据集(药品 50.5 万条 / Cochrane 1.5 万组 / 中医药古籍 4374 组 / 价值语料 7.2 万份 等)/ 5 家数交所累计挂牌 26 项;标注产能 5000 万条/年。
- 用得上 —— 5 个智能体已上线 / 16 个已开发应用场景 / 地市级医疗可信数据空间项目(地市级政府投资数据基础设施级 / 18 个月 / 6 大功能分区)。
五、为什么这件事值得做
让数据资源更有序,不是技术议题——它是一个关于"数据要素如何成为公共服务的一部分"的判断。
如果数据要素无序,哪怕政策再推进、技术再前沿,最终它也只能停留在"内部工具 / 单点工程"层面;如果数据要素有序,它可以成为公共服务的基础——更准确的诊断、更合理的医保支付、更精准的药物研发、更普惠的健康管理。
我们把这件事当作长期工作。它不会因为一笔合作的成功而被宣告完成;它也不会因为某个标准的发布而到达终点。
让数据资源更有序——这是我们的使命,也是我们的底线。
六、不写什么
为了让"让数据资源更有序"成为可被检验的工作语言,我们不写以下几件事:
- 不写"打造数据要素生态"等空主张
- 不写覆盖千行百业等无承重表述
- 不写自宣告型的最高级形容词
- 不写"颠覆性"、"革命性"等夸张词
- 不写未经验证的"大趋势"判断
- 不写需要被读者推导的信任声明
我们写的是被一段一段做出来的、可被独立验收的痕迹。
七、关联
- 关联方法论:24 环节医疗数据资源开发利用路径 / 高标准首营资质交换:我们对合作的尺子
- 关联标准解读:《可信数据空间标准化研究报告(2025 版)》:我们读了什么 / 站在 WG2-WG6 里看数据要素
- 关联信任叙事:我们的信任来自痕迹:38 项国标参编与 GSP/GMP 数据质管
- 关联案例:江苏某地市公共数据授权运营 / 地市级医疗可信数据空间项目 / 上海某 AI 模型方医疗语料供应链合作 / 重庆某区医疗导辅诊智能体
八、一句话收尾
让数据有序,让价值流动。
Ever flowing, never still.
此处,此刻,始终。