一、为什么把它叫"系统工程",而不是"挂牌"
如果一家医院只把医疗数据合作理解成"加工→挂牌→出售",问题会出现在两个地方。
第一处是院内。医疗数据的所有权、使用权、收益权三者并不天然合一,伦理审查、招采流程、数据安全、运维责任在医院内部分散于不同部门。一次"挂牌"如果绕过这些,事后会被一个部门的一个反对意见拉回原点。
第二处是院外。医疗数据涉及个人信息保护、数据出域、模型训练边界、行业合规要求,不同区域、不同登记体系、不同数据交易所对同一类数据的"放行口径"并不一致。一次"挂牌"如果只满足某一交易所的形式要求,结果可能是数据在另一处合规体系下被判定为"不可流通"。
把这件事理解为系统工程,不是把它复杂化,而是给它一个被检验的工作语言。语言不通,合作就反复返工;语言一通,每一步可以被独立验收,错与对都有迹可循。
"我们不是把医疗数据交易理解为一次挂牌动作,而是理解为一套跨院内治理、合规审查、数据产品化、流通交易、履约交付和长期运营的系统工程。" ——这是我们对外部合作方的标准表达。
二、6 个阶段,24 个环节
把整条路径拆开,按时序排列:
阶段 1 · 供需对接(7 环节)
合作的起点,是把"需要"和"能给"两端校准在一条线上。
| # | 环节 | 我们做什么 |
|---|---|---|
| 1 | 需求对齐 | 对齐需方真实需求与可合规供应数据的边界 |
| 2 | 资源洞察 | 盘点医院/区域已有数据资源的形态、结构与可用性 |
| 3 | 权属确认 | 确认数据是否涉及个人信息,给出权属授权链 |
| 4 | 样例确认 | 试加工,明确产品规格、加工成本与可行性 |
| 5 | 量价谈判 | 确定同类型数据资源的销售价格区间与流通规模 |
| 6 | 交付路径确认 | 确定交付方式(API/拷盘/可信数据空间) |
| 7 | 合约确认 | 确定授权范围、合作时间、价格、数量、产品形态、交付方式、结算周期 |
这一阶段的核心是"把不可能说清楚的事说清楚"。多数医疗数据合作走不下去,断点都在这 7 个环节里某一个。
阶段 2 · 院内决策(3 环节)
很多人忽略:医院本身是数据合作中最重要的"系统"。
| # | 环节 | 我们做什么 |
|---|---|---|
| 8 | 工作与决策会议 | 协助医院组织微观(针对单笔交易)+ 宏观(针对交易体系建立)的内部决策会议 |
| 9 | 伦理审查 | 协助医院按数据涉及人体研究 / 个人数据 / 队列研究 / 基因数据等不同情形完成伦理审查 |
| 10 | 招采流程 | 按数据交易事项分类(咨询走竞争性磋商 / 加工治理走招标 / 交易经营走单一来源 / 项目合作走院内其他流程)协助院内启动 |
我们对这一阶段的工作原则是:协助医院用医院自己的语言把事情走完。一份外来的"标准模板"没有用——必须按医院的章程、流程、当年的工作重点来调整。
阶段 3 · 前置沟通(3 环节,仅适用于公共数据路径)
公共数据路径多了一道前置沟通。
| # | 环节 | 我们做什么 |
|---|---|---|
| 11 | 分管部门沟通 | 协助医院或运营方与上级分管部门完成事项请示、汇报或备案沟通 |
| 12 | 同级运营机构协同 | 协助与同级数据运营机构签订合同或协助提供服务 |
| 13 | 同级实施机构协同 | 协助同级数据实施机构通过函件等方式互相协助 |
公共数据路径的"慢"和"稳"是一体两面——慢是因为涉及多方协同;稳是因为协同到位之后,路径具有可复制性。
阶段 4 · 登记确权(公共数据 2 环节 / 企业数据 4 环节)
按数据性质走两条不同的登记链。
公共数据路径:
| # | 环节 | 我们做什么 |
|---|---|---|
| 14P | 公共数据资源登记 | 协助在省内或全国公共数据资源登记平台完成数据资源登记 |
| 15P | 公共数据产品及服务登记 | 协助在登记平台完成数据产品及服务登记 |
企业数据路径:
| # | 环节 | 我们做什么 |
|---|---|---|
| 14E | 主体认证 | 完成市场主体在数据交易所的认证 |
| 15E | 产品登记 | 完成数据产品的挂牌登记 |
| 16E | 交易备案 | 完成数据产品交易并申领凭证 |
| 17E | 合规流程 | 完成交易所各项合规要求的流程 |
公共数据登记可在交易完成后 14 天补登记;企业数据登记可在交易完成后随时补登记——这是合规弹性,但我们不把它作为主流路径推荐。把登记前置,意味着合作链上的每一方都对应有据可查的凭证,事后回看时少一道补救成本。
阶段 5 · 交易履约(3 环节)
| # | 环节 | 我们做什么 |
|---|---|---|
| 18 | 加工与交付 | 按合约完成加工封装,按既定交付路径交付约定数量产品 |
| 19 | 验收 | 协助按合约约定完成验收 |
| 20 | 开票与结算 | 按合约约定完成开票和结算 |
履约阶段最考验"工艺确定性"。我们的数据集生产按 4 阶段 14 工序、三级质控(生产自检 100% / 交叉质检 100% / 专家审核 ≥50%)的工艺完成——把"加工与交付"这一行的承诺落到可被独立检查的工序上。
阶段 6 · 存证归档(2 环节)
| # | 环节 | 我们做什么 |
|---|---|---|
| 21 | 归档 | 完成本次交易全过程档案归档 |
| 22 | 存证 | 对本次交易完成审查审计,依约归档存证 |
合作不在交付那一刻结束。存证归档是把这次合作"沉淀进医院的资产"——下一笔合作可以从这里开始,而不是从零开始。
三、四类典型交易路径
医疗数据产品交易因发起方不同有四种典型路径。每种路径有它的适用场景与关键挑战。
路径 Ⅰ · 公共数据产品交易:医院与需求方共同发起 适用于医院已意识到自身数据价值、需求方已明确需求、分管部门支持的场景。医院与需求方共同主导供需对接,分管部门进行规则把关。挑战在院内多部门协同。
路径 Ⅱ · 公共数据产品交易:分管部门发起 适用于分管部门(卫健委 / 数据局)有政策推动需求、指派医院作为试点的场景。分管部门为主导方,医院执行,运营机构承接。挑战在医院主体性较弱。
路径 Ⅲ · 公共数据产品交易:数据部门发起 适用于数据局或数据集团有公共数据资源运营任务、反向寻找医院数据源的场景。数据部门主导供需匹配,医院作为数据源响应。挑战在医院与数据需方距离较远。
路径 Ⅳ · 企业数据产品交易:医院与需求方共同发起 适用于医院将自身数据资产视为企业数据、可直接响应国家两办与部委文件的场景。医院作为数据资产所有方与需求方直接对接,企业数据登记由交易所完成。挑战在医院须明确"自身数据由自己管理、自己开放"的边界。
不同路径有不同的快慢、不同的合规口径、不同的成本结构。我们不在文中比较哪种路径"更好"——这取决于场景;我们做的是按场景帮合作方选择路径并把它走通。
四、对应业务
24 环节并不是一份独立方法论,它对应数巨有谱的业务结构:
- 数据资源运营商(SHP DataOps):阶段 1 供需对接、阶段 2 院内决策、阶段 3 前置沟通——核心能力是 A 咨询 / D 治理 / E 权属 / F 合规 / N 运营。
- 数据产品供应商(SHP DataProducts):阶段 4 登记确权、阶段 5 交易履约、阶段 6 存证归档——核心能力是 G 设计 / H 加工 / J 质量 / L 交易。
- 智能应用提供商:阶段 5 交付环节延伸到 O 应用产品(智能体 / 行业模型 / 场景应用)的交付与运营。
24 环节可以独立看,也可以按 3 个角色串起来看。把它们串起来,就是"数据资源获取—语料加工生产—模型训练支撑—智能应用上线"的全过程。
五、反例与误区
我们看到的不少合作走偏,多数集中在五处。
误区一:把"挂牌"当作"上线"。 挂牌只是登记体系的一道凭证,不等于产品具备真正可流通的状态。验收、履约、存证未完成的"挂牌"是悬空的。
误区二:跳过院内决策。 医院章程、伦理审查、招采流程是医院作为合作方的"主体性"——跳过它们,合作做不长。
误区三:一份模板套所有医院。 每家医院的章程、流程、组织架构都有差异;模板是参考,不是结论。
误区四:把工艺确定性看成"内部事"。 工艺没有确定性,意味着合作方拿到的数据集每一次都不一样——这种"不一样"对模型训练是硬伤。
误区五:把数据交易的"善后"省略。 归档与存证不是流程末端的形式动作,它是下一笔合作的资产。
六、可执行清单
把这套方法论落到合作方可以照着做的清单上:
- 从需求开始,不从挂牌开始。 先把需方的真实需求与可合规供应数据的边界对齐。
- 把权属确认前置。 数据是否涉及个人信息、是否涉及人体研究、是否涉及基因数据——这三个判断必须在合作启动时给出。
- 从院内决策开始排时间表。 工作与决策会议、伦理审查、招采流程通常决定整个项目的节奏;按它们排合作时间表,而不是反过来。
- 公共数据 vs 企业数据:选定路径再启动。 一旦混淆,登记体系会反复要求补材料。
- 登记不是事后补救,是合作底座。 公共数据资源登记 / 公共数据产品及服务登记 / 企业数据主体认证 / 产品登记 / 交易备案 / 合规流程——每一个登记都是合作底座的一块砖。
- 工艺要可被独立检查。 4 阶段 14 工序、三级质控(自检 100% / 交叉 100% / 专家审核 ≥50%)—— 把工艺写成可验收的步骤。
- 存证归档不是收尾,是开始。 每一笔合作的归档存证是下一笔合作的"医院侧资产"。
- 不要把"快"作为路径选择的唯一标准。 不同路径有不同的稳定性;选错路径,省下的时间会以另一种形式还回去。
七、边界
这份方法论不展示的内容:
- 不展示具体客户、具体医院的交易方案与路径建议
- 不展示具体合同金额、单价、议价底线
- 不展示具体工期数字(按 PUBLICATION-RISK-CONTROL-v1 锁定)
- 不展示对各数据交易所的优劣势打分
- 不展示对具体政府部门的对接策略
这些内容存在于内部销售工具与商务洽谈中,不构成对外可表达的"方法论"。对外的方法论以可被独立检查为标准;对内的工具以"具体合作"为标准——两者不混用。
八、关联
- 关联案例:江苏某地市公共数据授权运营(已通过公示)/ 地市级医疗可信数据空间项目(地市级政府投资数据基础设施级 / 18 个月 / 6 大功能分区)/ 上海某 AI 模型方医疗语料供应链合作(多年期)/ 重庆某区医疗导辅诊智能体(已交付)
- 关联数据集:自有 7 大类成品数据集(药品 50.5 万条 / Cochrane 1.5 万组 / 中医药古籍 4374 组 / 价值语料 7.2 万份 等);自投肿瘤多模态训练数据集(49 子集 · DICOM + JSON + IMG 多模态封装)
- 关联方法论:高标准首营资质交换 / GSP-GMP 启发的数据产品质管 / 4 阶段 14 工序生产工艺
- 关联标准:参编《可信数据空间标准化研究报告(2025 版)》/ 全国数标委 WG2-WG6 五组成员
九、一句话收尾
把医疗数据合作做成"帮医院开发数据资源",而不是"采购数据"——这是我们关于路径的判断,也是关于价值的选择。
此处,此刻,始终。