欢迎访问学兔兔标准下载网,学习、交流 分享 !
返回首页 |团 体 标 准
T/ISC 0112—2026
医疗健康画像体系构建规范
Specification for construction of healthcare portrait system
(发布稿)
2026 - 05 - 11 发布 2026 - 06 - 11 实施
中 国 互 联 网 协 会 发 布
前 言
本文件按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由中国互联网协会提出并归口。
本文件起草单位:讯飞医疗科技股份有限公司、中国信息通信研究院、国家卫生健康委人口文化与基层健康中心、国家卫生健康委卫生发展研究中心、国家卫生健康委信息统计中心、国家健康医疗大数据研究院(深圳)、上海市卫生和健康发展研究中心、海南省卫生健康委员会统计信息中心、上海市静安区卫生信息中心、深圳市宝安区卫生事业发展中心、人民卫生出版社、科学技术文献出版社、《中华医学杂志》社有限责任公司、首都医科大学附属北京安定医院、清华大学北京清华长庚医院、首都医科大学附属北京安贞医院、北京大学人民医院、北京协和医院、中国科学技术大学附属第一医院、安徽医科大学第一附属医院、郑州大学第一附属医院、中南大学湘雅二医院、四川省人民医院、中国医科大学附属盛京医院、广州医科大学附属妇女儿童医疗中心、北京大学肿瘤医院、重庆医科大学附属儿童医院、苏州大学附属儿童医院、北京大学国际医院、南京医科大学附属无锡人民医院、河南科技大学第一附属医院、河南大学淮河医院、重庆大学附属沙坪坝医院、南通市第六人民医院、中移(成都)信息通信科技有限公司
本文件主要起草人:陶晓东、贺志阳、陈祖吉、刘洋、鲍溪荷、赵景鹤、黄金柱、宋江梅、乔克建、陈晨、李成文、叶沁雯、程美、尤梦祥、杨爱平、张并立、王刚、魏来、何怡华、饶慧瑛、杜雨暄、任九选、贾斐、相识、张卓然、刘泊宁、黄涂半特、王慧莹、李腾、黄二丹,赵美英,苏剑楠、朱岩、杨正、蒋璐伊、王存库、陈光焰、魏宝、陈晓萍、赵亦俊、周瑾、黄垦、孙玉立、孙桂先、陈永刚、曲春晓、贾晓巍、孔荣华、蔡蓉、戴小欢、沈锡宾、田丙磊、王立磊、丰雷、李楠茜、李月红、林明贵、谷孝艳、宋光远、董霄松、赵慧萍、李晓鹤、孟晓阳、韩永
生、陈玉俊、郑雪瑛、骆斯慧、姜东兴、张洁、杜明超、戴梦缘、李仲颖、杨扬、詹俊鲲、雷舜东、刘佑韧、邵尉、曹霞、曹晓均、曹广、李禄生、邓冬梅、杨贇滢、朱晨、李胜光、葛锐、刘苏熠、高晓乐、吴恒、李由、洪石陈、赵艳琦、吕天一
本文件及其所代替文件的历次版本发布情况为:
——
医疗健康画像体系构建规范
1 范围
本标准规定了医疗健康画像在构建过程需满足的技术要求,包括医疗健康画像构成要求、构建质量评价要求等。
本标准适用于医疗机构、医疗健康数据服务机构、医疗科技企业、公共卫生管理部门对医疗健康画像的构建、应用、质量评估及相关技术研发活动。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 35273 信息安全技术个人信息安全规范
WS/T 363-2023 卫生健康信息数据元目录
WS/T 364-2023 卫生健康信息数据元值域代码
WS/T 846-2024 医院信息平台交互标准
3 术语和定义
3.1
医疗健康画像 healthcare portrait
是指对居民、家庭和区域与医疗健康相关的多源异构原始数据,进行采集、治理与深度挖掘等,构建出的结构化、标签化且多维立体的数字健康表征。
3.2
事实医疗健康画像 factual healthcare portrait
是指对居民、家庭和区域与医疗健康相关的多源异构原始数据,进行采集、清洗、标化和加工整合后,直接记录所形成的数字健康表征。
3.3
推理医疗健康画像 reasoned healthcare portrait
是指基于事实医疗健康画像,通过融合专家规则、权威知识的医学大模型,以及多源数据的长时序推理技术,进行深度分析和智能推理,形成的包含评价、预测的数字健康表征。
3.4
个体医疗健康画像 individual healthcare portrait
是指对个体全生命周期多源异构医疗健康数据进行采集、治理,并通过深度挖掘、推理,构建的结构化、标签化且多维立体的个体数字健康表征。
3.5
家庭医疗健康画像 family healthcare portrait
是指将家庭成员个体医疗健康画像进行关联融合,并对家庭与医疗健康相关的其他数据进行治理与挖掘,构建的结构化、标签化的家庭数字健康表征。
3.6
区域医疗健康画像 regional healthcare portrait
是指结合区域内个体和家庭医疗健康画像,同时对区域内与医疗健康相关的卫生统计学、流行病学和医疗卫生资源等数据进行采集、治理与深度挖掘,构建的结构化、标签化且多维立体的区域数字健康表征。
3.7
基本信息 basic information
是医疗健康画像中用于记录人口学特征、生活行为习惯、既往健康背景的静态基础信息。
3.8
健康状态信息 health status information
是医疗健康画像中关于个体在某一特定时间节点,用于记录有关身体特征、症状体征、疾病、检查、治疗等能够反映当前健康与疾病综合表现的信息。
3.9
诊疗服务信息 medical care services information
是医疗健康画像中用于记录医疗机构及医务人员为个体所提供的诊断、治疗、康复及专业医学支持等一系列医疗服务过程信息。
4 符号和缩略语
下列符号和缩略语适用于本文件。
FN:假阴性(False Negative)
FP:假阳性(False Positive)
TN:真阴性(True Negative)
TP:真阳性(True Positive)
ICD-10:国际疾病分类第十版(International Classification of Disease, 10th Revision)
5 医疗健康画像体系构建总体要求
图 1 医疗健康画像构建示意
a 卫生服务活动(或干预措施)指针对特定的健康和疾病问题,医疗卫生机构开展一系列预防、医疗、保健、康复、健康教育等活动。
b 健康事件指医疗健康画像构建对象于特定时间段,针对特定健康问题参与的卫生服务活动。
c 个体医疗健康信息包括基本信息、健康状态信息、诊疗服务信息。
医疗健康画像按照构建对象的范围分为:个体医疗健康画像、家庭医疗健康画像和区域医疗健康画像。按照数据加工程度与方式分为:事实医疗健康画像与推理医疗健康画像。在实际的构建过程中,应根据具体的应用场景明确构建对象,参照对应场景下所依赖的医疗健康画像元素,结合元素定义与值域规范,分别构建出事实和推理医疗健康画像,进而得到符合构建对象范围且适用于目标场景下的医疗健康画像。医疗健康画像应基于健康事件的发生进行动态更新。
6 医疗健康画像体系构建规范
6.1 结构要求
医疗健康画像体系由类别、主题、维度、值域四个层级构成。为保障全面性,个体医疗健康画像宜涵盖约20余种主题和200余个维度,家庭和区域医疗健康画像还需要分别涵盖家庭医疗信息和区域医疗健康信息。在应用过程中可以基于具体的目标场景,对医疗健康画像体系架构和组成元素量级进行相应调整。
6.2 个体医疗健康画像构建
6.2.1 组成元素
6.2.1.1 基本信息
个体医疗健康画像的基本信息类元素如表1所示,表中所列为示例,包括但不限于以下内容:
表 1 基本信息元素
6.2.1.2 健康状态信息
个体医疗健康画像的健康状态信息类元素如表2所示,表中所列为示例,包括但不限于以下内容:
表 2 健康状态信息元素
6.2.1.3 诊疗服务信息
个体医疗健康画像的诊疗服务信息类元素,包括除上述健康状态信息类的所有元素外,还需包含如表3所示主题与维度,表中所列为示例,包括但不限于以下内容:
表 3 诊疗服务信息元素(补充)
6.2.2 构建流程及方法
个体医疗健康画像的构建以多源异构医疗健康数据为核心,对其进行采集与精细化治理,聚合生成客观的事实医疗健康画像,同时利用融合专家规则、权威知识的医学大模型,通过多源数据的长时序推理技术,进行深度分析和智能推理,输出推理医疗健康画像。具体流程及方法如下:
a) 数据采集:应支持采集个体全维度多源异构医疗健康数据(如HIS、EMR、LIS、PACS 等),涵盖个体基本信息、医嘱信息、检验检查结果等结构化数据,以及病历文本、检查报告、医学影像(CT/MRI)、病理切片、可穿戴设别时序数据等非结构化数据,实现多源异构数据的兼容采集;
b) 数据治理:应支持实施全链路数据清洗,修正设备监测异常值、填补人口学缺失值、利用文本归一化技术统一医学术语(对齐 ICD-10 等标准)、建立“类别-主题-维度-值域 ”四层映射模型,完成全量数据的标准化编码与归类;
c) 信息提取:应支持运用命名实体识别及关系抽取技术,对病历文本与报告描述等数据提取疾病名称、时间节点、检查项及结果等关键实体,并构建实体间的时序与因果逻辑等关系;
d) 深度推理:应支持基于医学专家规则与权威知识的医学大模型,通过多源数据的长时序推理技术,进行深度分析和智能推理,评估健康风险等级,推演潜在疾病发展趋势;
e) 画像生成:应支持聚合治理后标准化数据生成客观的“事实医疗健康画像 ”并结合算法推演结果生成“推理医疗健康画像 ”,两者加权融合,最终输出适用于具体应用场景的个体医疗健康画像。
6.3 家庭医疗健康画像构建
6.3.1 组成元素
结合家庭医疗的具体应用场景,家庭医疗健康画像除包含个体医疗健康画像中的元素外,还需包含家庭医疗健康信息类别中的元素,具体如表4所示主题与维度,表中所列为示例,包括但不限于以下内容:
表 4 家庭医疗健康信息元素
6.3.2 构建流程及方法
家庭医疗健康画像的构建基于家庭成员个体医疗健康画像,同时利用自然语言处理与规则引擎技术,对数据进行提取与转化,首先聚合生成基础事实医疗健康画像;进而深度融合家庭共性特征与潜在健康风险,最终构建出多维立体的家庭级医疗健康全景画像,具体流程及方法如下:
a) 数据采集:应支持多源健康医疗数据的入参协议转换,实现全量家庭成员数据的兼容整合,并以家庭为单位,采集与汇总所有成员的个体医疗健康画像与生活习惯数据,涵盖成员基础健康状态、诊疗记录等核心信息;
b) 数据治理:应支持实施跨成员数据对齐,明确成员间的亲缘关系与身份标识,通过实体链接技术,统一不同成员病历中对同一类遗传病或传染病的描述术语,消除多源数据间的语义歧义,完成家庭数据的标准化整合;
c) 信息提取:应支持利用文本分类与聚类算法,提取家庭成员的饮食习惯、运动偏好、居住环境等共性特征,识别并聚合成员间的“共病信息 ”及相似的生活方式标签;
d) 深度推理:应支持基于家庭共性特征(如同住环境)和血缘关系,开展跨成员联合推理。重点分析下一代遗传病传递概率、家庭内部传染病传播链条,以及共同不良生活方式导致的慢性病聚集风险;
e) 画像生成:应支持聚合标准化成员数据生成家庭“事实医疗健康画像 ”并结合联合推理结果生成涵盖疾病遗传风险、共患风险等的家庭“推理医疗健康画像 ”,两者加权融合,最终输出包含家庭健康管理建议(如膳食调整、慢病风险预测等)的家庭医疗健康画像。
6.4 区域医疗健康画像构建
6.4.1 组成元素
结合区域医疗的具体应用场景,区域医疗健康画像除包含个体与家庭医疗健康画像类别中的元素外,还需包含区域医疗健康信息类别中的元素,具体如表5所示主题与维度,表中所列为示例,包括但不限于以下内容:
表 5 区域医疗健康信息元素
6.4.2 构建流程及方法
基于个体与家庭医疗健康数据,同时整合区域卫生统计、流行病学及医疗资源信息数据,利用自然语言处理及数据挖掘等技术完成多源异构数据治理与推理。以满足公共卫生与区域管理需求为导向,构建辅助区域健康决策的区域医疗健康画像,具体流程及方法如下:
a) 数据采集:应支持建立区域健康数据池,横向整合区域内所有个体及家庭画像数据,纵向汇聚流行病学调查报告、卫生统计年鉴及区域医疗资源分布等宏观数据,实现“人-家-区 ”多维数据的全量汇总;
b) 数据治理:应支持跨机构、跨行政区划的数据治理,统一多源数据的格式标准,对海量数据进行时空标签对齐,确保流行病学数据与临床诊疗数据在时间与空间维度上的一致性,构建标准化的区域数据底座;
c) 信息提取:应支持基于批量命名实体识别技术,重点处理大规模流调报告及监测数据,精准提取疾病暴发时间、地点、传播路径等核心要素,识别聚集性发病事件及高频就医流向等时空特征;
d) 深度推理:应支持结合个体/家庭的接触史与时空轨迹数据,开展流行病学关联分析,梳理疾病传播链条,预测疫情流行趋势,综合分析区域医疗资源负荷与疾病分布的匹配度,推演资源配置瓶颈;
e) 画像生成:应支持结合个体与家庭医疗健康画像等数据,开展流行病学关联分析、梳理疾病传播链、判断流行趋势,最终生成涵盖疾病防控重点、医疗资源配置建议等内容的区域医疗健康画像。
7 医疗健康画像构建质量控制要求
7.1 完整性质控
7.1.1 质控指标
完整性反映目标画像维度填充的全面性,使用召回率进行评估,指目标画像所有应被填充的维度中,被正确填充的比例,计算公式如下:
式中:
Recall——召回率;
TP——真阳性数量,画像中所有应被填充且实际被填充的维度数;
FN——假阴性数量,画像中所有应填充但未填充的维度数。
7.1.2 质控方法及流程
医疗健康画像构建的完整性可采用分层抽样法进行评估,按照个体、家庭、区域画像类型在真实世界的占比,根据比例抽取对应的样本,保障评测数据集符合实际分布,评估流程整体如下:
a) 根据分层抽样法,按要求完成评测数据集构建;
b) 按照医疗健康画像构建规范,组织至少 3 名医生专家,对评测数据集的目标画像维度进行全面填充构建,确保一致性系数大于等于 0.95;
c) 按照不同评测对象的调用方式,对评测数据集进行预处理,通过API 或 Web 等形式获取待评测对象的回复结果;
d) 通过对比医生专家的标注结果和待评测对象的回复结果,得到医疗健康画像构建的召回率;
e) 数据域不完整时(如专科医院、社区医院且数据流通不佳场景等特殊情况)医疗健康画像元素召回率阈值要求宜通过相关领域专家意见重新确定。
7.2 准确性质控
7.2.1 质控指标
准确性反映画像维度填充的准确率,使用准确率进行评估,指目标画像实际填充的维度中,正确填充维度数所占比例,计算公式如下:
式中:
P——准确率;
Nc——画像中实际填充且准确的维度数;
N——画像实际填充的维度总数。
7.2.2 质控方法及流程
医疗健康画像构建的准确性可采用分层抽样法进行评估,按照个体、家庭、区域画像类型在真实世界的占比,根据比例抽取对应的样本,保障评测数据集符合实际分布,估流程整体如下:
a) 根据分层抽样法,按要求完成评测数据集构建;
b) 按照医疗健康画像构建规范,组织医生专家,对评测数据集的目标画像维度进行全面填充构建;
c) 按照不同评测对象的调用方式,对评测数据集进行预处理,通过API 或 Web 等形式获取待评测对象的回复结果;
d) 通过对比医生专家的标注结果和待评测对象的回复结果,得到医疗健康画像构建的准确性。
7.3 一致性质控
7.3.1 质控指标
一致性反映画像使用术语是否统一规范,避免因术语差异导致的误解,使用一致率进行评估,指画像填充中使用术语项数中,使用规范术语的项数占比,计算公式如下:
式中:
C——一致率;
Nconsistent——画像中实际填充且使用规范术语的维度数;
N——画像实际填充的维度总数。
7.3.2 质控方法及流程
医疗健康画像构建的一致性可采用包括但不限于如下方法,评估流程整体如下
a) 医生专家通过 ICD-10、资源梳理扩充等形式,总结形成术语映射表;
b) 针对评测对象输出的画像名称,在术语映射表中进行检查,确认是否属于规范术语,统计得到医疗健康画像构建的一致率;
c) 针对不一致的画像名称描述,应当由医生专家定期进行审视,评估是否需要融合至术语映射表,确保术语映射表的全面性与时效性。
7.4 合理性质控
7.4.1 质控指标
合理性反映医疗健康画像内容结果是否合理,使用合理率进行评估,指画像中涉及推理内容的结果合理的占比,计算公式如下:
式中:
Preasonable——合理率;
Nreasonable——画像中推理内容中结果合理的数量;
Nreasoned——画像中存在推理内容结果的总数。
7.4.2 质控方法及流程
医疗健康画像构建的合理性可采用分层抽样法进行评估,按照个体、家庭、区域画像类型在真实世界的占比,根据比例抽取对应的样本,最终保障评测数据集符合实际分布,估流程整体如下:
a) 根据分层抽样法,按要求完成评测数据集构建;
b) 按照不同评测对象的调用方式,对评测数据集进行预处理,通过API 或 Web 等形式获取待评测对象的回复结果;
c) 针对涉及推理内容的画像结果,提交医生专家按照具体医疗场景的需求目标进行合理性审核,得到推理医疗健康画像构建的合理率。
7.5 整体性质控
7.5.1 质控指标
整体性质控是指基于完整性、准确性、一致性、合理性的质控结果,对医疗健康画像整体质量进行分级。整体质量等级划分为A、B、C、D(A最高、D最低)四个等级,其中C为合格线。整体等级采用门槛法:等级需根据实际画像评估需求,选择正确指标组合后,全部指标应满足对应阈值要求,取最低项
作为约束,分级标准如下:
a) A(优秀):完整性 ≥ 85%、准确性 ≥ 90%、一致性 ≥ 90%、合理性 ≥ 90%
b) B(良好):完整性 ≥ 80%、准确性 ≥ 85%、一致性 ≥ 85%、合理性 ≥ 85%
c) C(合格):完整性 ≥ 80%、准确性 ≥ 80%、一致性 ≥ 80%、合理性 ≥ 80%
d) D(不合格):不满足 C 等级任一阈值(即:完整性 <80% 或 准确性 <80% 或 一致性 <80% 或 合理性 <80%)
7.5.2 方法及流程
医疗健康画像构建的整体性质控基于完整性、准确性、一致性、合理性质控结果,评估流程整体如下:
a) 按照完整性、准确性、一致性、合理性等质控方法及流程,获取对应质控结果;
b) 根据整体性质控指标定义的分级标准,对医疗健康画像质量进行整体评估;
c) 对医疗健康画像的整体性质控评估结果,提交医生专家组织专项评审,得到最终的分级结果。
7.5.3 质控阈值要求
医疗健康画像整体性质控应符合以下要求:
——整体质控评估合格阈值:应达到C 及以上;
——建议目标阈值:在具体的核心应用场景(如症状咨询、用药咨询、辅助诊疗、医嘱质控等)
宜达到 B 及以上。
8 医疗健康画像安全性要求
8.1 软件设备安全性
医疗健康画像构建过程应支持多种设施如依赖库、医疗数据库、AI框架、向量数据库、中间件、接口等具备安全防护能力,包含:
a) 漏洞管理:软件设施应按季度、年度进行漏洞扫描和修复,具备完善的漏洞响应机制;
b) 安全更新:软件设施应及时更新安全补丁,以防止新出现的安全威胁。
8.2 数据安全
医疗健康画像构建过程涉及数据采集、数据预处理、数据使用等数据相关流程应具备安全防护能力,包含:
a) 基础数据安全:数据管理系统应具备保障存储安全、隐私保护、过程安全、销毁安全的能力;
b) 医疗数据安全:数据管理系统应具备医疗健康画像分级审阅权限配置、最小必要原则核查及敏感个人信息单独同意核验的能力。