数巨有谱数据集团

数据产品供应 · SHP DataProducts

把治理好的数据资源,加工为可流通、可计量、可信任的数据产品。

[03 · 服务流程]

DataProducts 的服务流程

从医疗资源到一件可被使用、可被复用的数据产品,要走过 6 步——每一步都可被检验。

  1. 需求 / 场景对齐

    把要解决的真实场景说清,把可合规供给的范围画准。

  2. 产品设计

    按场景把治理好的数据资源设计为可计量、可流通、可定价的产品。

  3. 生产加工

    4 阶段 14 工序生产线 + 三级质控(自检 100% / 交叉 100% / 专家 ≥50%)。

  4. 权属 / 合规确认

    把数据是谁的、能给谁用、用在什么场景写清楚。

  5. 登记 / 挂牌 / 流通

    在数交所完成产品登记、挂牌、交易备案与履约交付。

  6. 持续运营

    使用反馈、版本迭代、合规复审,让数据产品持续增值。

行业高质量数据集建设、运营与流通

面向 · 行业与区域高质量数据集建设方与运营商

数巨有谱做什么

  • 与建设方共同设计高质量数据集的整体架构
  • 协助完成数据采集、汇聚、加工、标注、质控
  • 协助完成数据资源登记、产品挂牌、流通交易
  • 提供持续运营支撑,让数据集随时间持续增值

在建项目

  • · 重庆医疗行业高质量数据集(在建)
  • · 肿瘤多模态训练高质量数据集(自投 49 子集 · DICOM + JSON + IMG 多模态封装)
  • · 党建期刊高质量数据集(在建)

对应能力

产品设计 · 产能工具 · 中介 / 撮合 · 数据治理 · 持续运营

医疗健康领域人工智能语料供应

面向 · 医疗 / 医械 / 医药 / 学术 / 银行 / 保司 的人工智能实验室 / 大模型企业 / 智能体应用方 / MaaS 服务商

数巨有谱做什么

  • 真实临床场景数据的合规获取
  • 4 阶段 14 工序生产工艺
  • 三级质控(生产自检 100% → 交叉质检 100% → 专家审核 ≥50%)
  • 按客户场景定制语料形态:SFT / COT / 评测 / 训练

代表合作(已授权范围内)

  • · 上海某 AI 模型方(医疗语料供应链合作 · 多年期 · 案例 cases/kupasi-medical-corpus)
  • · 头部区块链平台(医疗数据寻源 · 生态伙伴 partners/antchain)
  • · 科大讯飞(智慧城市解决方案优选生态伙伴 · 生态伙伴 partners/iflytek)
  • · 其他头部 AI 模型方与算力平台(生态伙伴明示挂 logo 见 /partners)

对应能力

产品设计 · 产能工具 · 中介 / 撮合 · 数据加工 · 数据安全

医疗健康领域数据集定制

数巨有谱做什么

  • 按数据集类型 × 客户类型 双轴定制
数据集类型客户类型
token 化数据集 基模供应商
医疗核验数据集 银行 / 保司
病种 / 病程 / 医疗行为临床数据集 科研 / 药企 / 械企
医疗健康领域开模数据 拟开发医疗健康大模型的企业 / 实验室 / 模型商

对应能力

产品设计 · 数据加工 · 数据治理 · 数据安全 · 数据质量 · 受托采购

以医药行业 GSP / GMP 体系为标尺

数巨有谱参照医药行业 GSP(Good Supply Practice)/ GMP(Good Manufacturing Practice)体系,建立数据产品流通质量管理体系。

GSP/GMP 六重审查链流程图:申请方提交首营资料经六道审查链顺序通过后准入,参照医药行业 GSP/GMP 体系建立。
悬停查看 · 滚轮缩放 · 双击重置 · 全屏更精
交互式架构图。可使用鼠标滚轮缩放(0.5x – 4x),拖拽平移,双击重置。键盘:加号放大,减号缩小,0 重置,方向键平移。点击右上角全屏按钮可进入全屏模式,再按 ESC 退出。本图含 6 个可交互区域,使用 Tab 键切换聚焦以阅读详情。

六重审查链

  • [01]法人资质审查
  • [02]廉洁承诺
  • [03]业务人员资质审查
  • [04]业务角色审查
  • [05]数据基础信息
  • [06]数据产品资质

生产工艺

  • · 4 阶段 14 工序
  • · 三级质控:生产自检 100% → 交叉质检 100% → 专家审核 ≥ 50%
生产自检
交叉质检
专家审核

数据安全实践

  • · k-匿名 + 差分隐私
  • · SM4 / SM2 / SM9 国密算法
  • · TLS 1.3 传输加密
  • · 第三方检测机构脱敏有效性评估

数巨有谱的数据产品已经在哪里

  • [01]26 项数据产品在 5 家数据交易所累计挂牌(上海 11 + 广州 8 + 深圳 3 + 杭州 3 + 山东 1)
  • [02]6 项已登记自营医疗数据产品
  • [03]数商凭证:上海、广州、深圳、杭州、内蒙古等
  • [04]深圳数据交易所战略合作
[09 · 已交付案例]

已交付案例 · DataProducts

26 项数据产品在 5 家数交所累计挂牌;6 项已登记自营医疗数据产品;与 AI 厂商的语料合作已交付多个项目。客户名按业务侧要求匿名化为"某..."。

8

数交所认证证书

上数 6(门诊住院 / 医嘱 / 手术 / 检查报告 / 成都药店 / 全国药店)+ 杭数 1(胸腹部肿瘤全模态)+ 山数 1(胸腹部肿瘤多模态)

26

累计挂牌

上海 11 + 广州 8 + 深圳 3 + 杭州 3 + 山东 1 · 5 数交所累计

16子集

RWE 训练数据集

肿瘤多模态 49 子集中的 RWE 部分 · 真实诊疗 · 彻底去隐私化

4

客户群双轴定位

基模厂商 · 银保 · 科研药企械企 · 医疗大模型企业 · 不同语料形态 × 不同行业