数据产品供应 · SHP DataProducts
把治理好的数据资源,加工为可流通、可计量、可信任的数据产品。
数巨有谱在数据产品供应这一端,做三件具体的事。
DataProducts 的服务流程
从医疗资源到一件可被使用、可被复用的数据产品,要走过 6 步——每一步都可被检验。
需求 / 场景对齐
把要解决的真实场景说清,把可合规供给的范围画准。
产品设计
按场景把治理好的数据资源设计为可计量、可流通、可定价的产品。
生产加工
4 阶段 14 工序生产线 + 三级质控(自检 100% / 交叉 100% / 专家 ≥50%)。
权属 / 合规确认
把数据是谁的、能给谁用、用在什么场景写清楚。
登记 / 挂牌 / 流通
在数交所完成产品登记、挂牌、交易备案与履约交付。
持续运营
使用反馈、版本迭代、合规复审,让数据产品持续增值。
行业高质量数据集建设、运营与流通
面向 · 行业与区域高质量数据集建设方与运营商
数巨有谱做什么
- 与建设方共同设计高质量数据集的整体架构
- 协助完成数据采集、汇聚、加工、标注、质控
- 协助完成数据资源登记、产品挂牌、流通交易
- 提供持续运营支撑,让数据集随时间持续增值
在建项目
- · 重庆医疗行业高质量数据集(在建)
- · 肿瘤多模态训练高质量数据集(自投 49 子集 · DICOM + JSON + IMG 多模态封装)
- · 党建期刊高质量数据集(在建)
对应能力
产品设计 · 产能工具 · 中介 / 撮合 · 数据治理 · 持续运营
医疗健康领域人工智能语料供应
面向 · 医疗 / 医械 / 医药 / 学术 / 银行 / 保司 的人工智能实验室 / 大模型企业 / 智能体应用方 / MaaS 服务商
数巨有谱做什么
- 真实临床场景数据的合规获取
- 4 阶段 14 工序生产工艺
- 三级质控(生产自检 100% → 交叉质检 100% → 专家审核 ≥50%)
- 按客户场景定制语料形态:SFT / COT / 评测 / 训练
代表合作(已授权范围内)
- · 上海某 AI 模型方(医疗语料供应链合作 · 多年期 · 案例 cases/kupasi-medical-corpus)
- · 头部区块链平台(医疗数据寻源 · 生态伙伴 partners/antchain)
- · 科大讯飞(智慧城市解决方案优选生态伙伴 · 生态伙伴 partners/iflytek)
- · 其他头部 AI 模型方与算力平台(生态伙伴明示挂 logo 见 /partners)
对应能力
产品设计 · 产能工具 · 中介 / 撮合 · 数据加工 · 数据安全
医疗健康领域数据集定制
数巨有谱做什么
- 按数据集类型 × 客户类型 双轴定制
| 数据集类型 | 客户类型 |
|---|---|
| token 化数据集 | → 基模供应商 |
| 医疗核验数据集 | → 银行 / 保司 |
| 病种 / 病程 / 医疗行为临床数据集 | → 科研 / 药企 / 械企 |
| 医疗健康领域开模数据 | → 拟开发医疗健康大模型的企业 / 实验室 / 模型商 |
对应能力
产品设计 · 数据加工 · 数据治理 · 数据安全 · 数据质量 · 受托采购
以医药行业 GSP / GMP 体系为标尺
数巨有谱参照医药行业 GSP(Good Supply Practice)/ GMP(Good Manufacturing Practice)体系,建立数据产品流通质量管理体系。
六重审查链
- [01]法人资质审查
- [02]廉洁承诺
- [03]业务人员资质审查
- [04]业务角色审查
- [05]数据基础信息
- [06]数据产品资质
生产工艺
- · 4 阶段 14 工序
- · 三级质控:生产自检 100% → 交叉质检 100% → 专家审核 ≥ 50%
数据安全实践
- · k-匿名 + 差分隐私
- · SM4 / SM2 / SM9 国密算法
- · TLS 1.3 传输加密
- · 第三方检测机构脱敏有效性评估
数巨有谱的数据产品已经在哪里
- [01]26 项数据产品在 5 家数据交易所累计挂牌(上海 11 + 广州 8 + 深圳 3 + 杭州 3 + 山东 1)
- [02]6 项已登记自营医疗数据产品
- [03]数商凭证:上海、广州、深圳、杭州、内蒙古等
- [04]深圳数据交易所战略合作
已交付案例 · DataProducts
26 项数据产品在 5 家数交所累计挂牌;6 项已登记自营医疗数据产品;与 AI 厂商的语料合作已交付多个项目。客户名按业务侧要求匿名化为"某..."。
8张
数交所认证证书
上数 6(门诊住院 / 医嘱 / 手术 / 检查报告 / 成都药店 / 全国药店)+ 杭数 1(胸腹部肿瘤全模态)+ 山数 1(胸腹部肿瘤多模态)
26次
累计挂牌
上海 11 + 广州 8 + 深圳 3 + 杭州 3 + 山东 1 · 5 数交所累计
16子集
RWE 训练数据集
肿瘤多模态 49 子集中的 RWE 部分 · 真实诊疗 · 彻底去隐私化
4类
客户群双轴定位
基模厂商 · 银保 · 科研药企械企 · 医疗大模型企业 · 不同语料形态 × 不同行业