荐文基于HIS“真实世界”数据仓库探索上市后中成药安全性评价方法
Posted 天之力医药
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了荐文基于HIS“真实世界”数据仓库探索上市后中成药安全性评价方法相关的知识,希望对你有一定的参考价值。
来源:中国中药杂志, 2011年10月,第36卷第20期
[摘要] 临床使用的中成药品种繁多,不良反应时有发生,中成药上市后的安全性问题成为患者与医生所关注的问题。本研究选取10 家医院的医院信息系统( hospital informationsystem,HIS) 临床数据,通过清理、整合形成海量真实世界数据仓库。从数据仓库中提取中成药单品种数据,选取理化检查指标中的血、尿、便常规,血生化检查中的血肌酐、血尿素氮、谷丙转氨酶、谷草转氨酶检查项目作为安全性实验室评价指标。比较用药前后上述指标的异常变化,应用数据挖掘的方法,与未应用该中成药的人群进行对比分析,对上市后中成药的安全性做出评价。本研究为基于真实世界数据仓库的上市后中成药安全性再评价提供新的思路与方法,为中成药的临床安全使用提供指导。
[关键词] 上市后中成药; 安全性评价;HIS 数据仓库;真实世界;数据挖掘
1 HIS 简介
1.1 定义
美国Morris Collen 教授对HIS 的定义是利用电子计算机和通讯设备,为医院所属各部门提供患者诊疗信息和进行政府管理信息的收集、存储、处理、提取和数据交换的能力,并满足所有授权用户的功能需求[8]。在信息技术高速发展的今天,我国各级医院已经进入了网络化信息管理的时代,医院信息系统成为信息化管理的重要载体。
1.2 HIS 数据作为临床研究所具备的优势
HIS 中记载了大量临床患者信息,如个人基本信息、诊断信息、医嘱信息、理化检查信息等,将这些信息提取整合形成海量数据仓库,利用数据挖掘的方法在海量的临床用药信息中更容易找出不良反应发生的趋势及规律,可以为中成药上市后临床再评价提供宝贵的研究资料;利用HIS 数据仓库的信息可以同时评价多种中成药,较以往的前瞻性研究可以节约大量科研成本,如试验药费、试验观察费、检测费等研究费用。
1.3 HIS 数据在临床研究应用中的局限性
HIS 是针对医疗服务设立而并非是为科学研究开发的,其中的数据不能直接被利用,各家医院所使用的HIS 也不尽相同,结构不统一,这需要对HIS 数据进行良好的整合,为了使HIS 数据能够符合分析需要,要对其进行标准化与规范化,但是现阶段仍缺乏公认规范化的标准。另外,HIS 数据在真实世界中还存在许多信息的缺失的问题,诸多原因造成了对HIS 数据分析的困难,也限制了HIS 数据成为临床研究的数据来源。
1.4 HIS 数据仓库处理及利用方法
为能够更好的利用HIS 数据,本研究采取分层多次规范化的方法对来自于各家医院的数据进行了处理。按照数据仓库的建立模式,采用计算机与人工相结合的方式,对数据进行抽提、清理、整合,最终形成符合研究需要的海量HIS 真实世界数据仓库。
虽然利用HIS 数据进行科学研究存在局限性,但是只要分析目的明确,对各项研究指标选择准确,分析方法得当,去粗取精、去伪存真,HIS 数据仓库会成为中成药安全性评价的良好的数据来源。
为了能够更好利用HIS 数据仓库对相关上市后中成药安全性进行评价,本研究拟定了一个研究方案。本研究使用的HIS 数据仓库来源于10 家北京三甲综合性医院HIS 数据,其中病例数超过10 000 例的中药品种为12 种,5000 例以上的品种为38 种,超过1 000 例的品种达到120 种。充足的病例数为中成药上市后的安全性评价提供了良好的数据来源。本研究从选取理化检查指标中的血、尿、便常规,血生化检查中的血肌酐、血尿素氮、谷丙转氨酶、谷草转氨酶检查项目作为安全性实验室评价指标,比较上述指标用药前后的异常变化,利用数据挖掘的方法,回顾性分析上市后中成药在真实世界应用中的安全性问题。
2 基于HIS 数据仓库探索上市后中成药安全性评价方案
2. 1 方案流程图
图1 基于HIS 数据仓库中成药安全性评价流程
2.2 中成药安全性评价指标的选择
利用HIS 数据仓库对中成药进行安全性评价,安全性评价指标的选择成为本研究的关键问题,指标选取失误会直接导致研究结果的错误。安全性指标的选取原则是要选择公认的、有代表性的理化指标,最常用的有血常规、凝血常规、尿常规、大便常规、肝功能、肾功能等指标。这些指标为临床常规检查项目,在HIS 数据仓库中易于取得,且信息客观完整,以这些项目作为安全性评价指标能够保证充足的分析数据。如对某种中成药进行分析时,需要评价其对肝肾功能是否会造成损害,可选择肝功能、肾功能检查中的谷丙转氨酶、谷草转氨酶、血肌酐、血尿素氮等检查项目; 如评价其对血液系统的影响,可提取血常规中白细胞、红细胞、血小板等相关指标。
2. 3 对中成药安全性评价指标的界定
对中成药进行安全性评价还要对所分析的目标数据进行明确的界定。例如评价丹红注射液对肝肾功能损害时,首先要选取所有应用了丹红注射液的人群,在其中选择单纯冠心病患者,在这部分患者中选择肝功能检查中谷丙转氨酶、谷草转氨酶,肾功能常规中的血肌酐、血尿素氮等指标,这些指标要保证其在用药前后均有完整的检测结果,并且这些结果出现了异常变化,即用药前正常至用药后异常,或用药前原本异常,用药后更加异常的数据,同时还要满足用药后的理化指标为停止用药后7 d 内检测的数据。没有比较就没有鉴别,界定对比数据是本研究的另一个重要问题。在选取对比数据时要保证其与目标数据限定条件相同。如分析丹红注射液时,选取未使用丹红注射液的单纯冠心病患者信息,选择出现异常变化的谷丙转氨酶、谷草转氨酶、血肌酐、血尿素氮等安全性评价指标,并且同样在停止用药7 d 内的检测数据,与使用丹红注射液的异常理化指标相匹配,通过对比分析对丹红注射液做出安全性评价。正确选择安全性指标与明确的界定为进一步的数据挖掘做了充足的准备,但是数据挖掘方法的选择才是整个研究的重点内容。
2. 4 中成药安全性评价数据挖掘方法的选择
HIS 数据仓库信息量丰富,数据量庞大,要充分利用这个资源宝库,分析方法的选择是关键。本研究选用数据挖掘的方法对HIS 数据仓库进行分析。目前数据挖掘常选用的方法有回归分析、贝叶斯分析、聚类分析、决策树、关联规则、粗糙集、神经网络、遗传算法、支持向量机等[9],还有一些高级统计学方法如倾向性评分法( propensity score) [10]、工具变量法( instrumental variable) [11]等,对于HIS 数据仓库分析也较为适宜。
2.4.1 倾向性评分法
倾向性评分法是Rosenbaum 和Rubin于1983 年提出的[11],倾向评分是指在给定协变量的条件下,一个观察对象接受某种处理( 或暴露) 因素的可能性。倾向性评分的核心是控制混杂因素,通过这种方法均衡各对比组间各个特征变量的可比性。HIS 数据仓库的变量多,干扰分析的因素也多,应用倾向性评分的方法可很好的控制这些因素。倾向性评分主要方法有变量调整法( adjustment)[12]、分层法( stratification) [13]、配比法( matching) [14]、加权法[15-17],可根据不同的需求选择不同的方法。但是,倾向性评分法也有其局限性。倾向性评分法是建立在很强的假设基础上,要求所有的变量都是已知的,对于来源于临床实际的HIS 数据仓库信息存在很多未知变量,故在应用本方法进行分析时要注意其使用条件的限制。
2.4.2 工具变量法
工具变量法可对已知的和未知的变量均予以平衡,因HIS数据仓库中有许多缺失项目,所以这种方法较适合HIS 数据仓库的分析。工具变量法可处理协变量与结果等因素的相互关系。如欲研究的协变量可能会与变量的分配及结果相关,就会造成对结果的有偏估计,此时可寻找一个与结果等变量无关而与需研究的协变量相关的变量即工具变量,从而得到对效果的无偏估计。但是应用工具变量法的难度在于是否能够找到合适的工具变量,如不能找到则不能应用本方法。
2.5 中成药安全性评价结果与临床实际相结合
应用数据挖掘的方法对HIS 数据仓库分析后得到的结果只是统计层面的结论,是否符合实际还要与临床相结合。如对某种中成药经过上述分析后未得到阳性结果时,可能是由于药物本身并不存在安全性问题,但是也要考虑到是否与数据挖掘方法选择有关,也有可能是由于现有的HIS 数据不足以得到阳性结果,所以在作出结论时要谨慎。进一步的研究可以对经过数据挖掘方法得到的中成药安全性评价结果分析,如采取查找原始病例、查找该中成药发生不良反应的相关文献报道、请医生与专家根据经验判断相结合的方式综合判断,针对重点中成药品种可采取医院集中监测或药理实验的方法对中成药安全性问题进行全面深入的研究,最终将上市后中成药再评价结论推广应用于临床。
3 讨论
近年来,随着现代科学技术进步,中成药产业迅速发展并在临床广泛应用,加之百姓与医生对不良反应认知度的提高,不良反应的报道也越来越多。中成药的安全性问题关系到国民的健康甚至生命。医院信息化管理系统不仅为临床日常医疗活动提供了方便,而且为药物安全性再评价研究提供了大量的数据信息。将多家医院HIS 数据整合建成海量数据仓库,并利用其中的数据作为中成药安全性评价的数据来源,不但能够为中成药的安全性评价提供有效的方法,而且能够使HIS 中的数据重新被利用,还能够节省大量的科研成本。
由于HIS 数据库并非为中成药安全性评价专用数据库,其中缺乏不良反应记录,这很大程度上限制了其用于安全性评价。本研究选择血、尿、便常规,血生化检查中的血肌酐、血尿素氮、谷丙转氨酶、谷草转氨酶检查等常规实验室检查项目作为安全性评价指标,希望利用其海量的数据优势发现中成药上市后安全性问题,以此为上市后中成药的临床安全使用提供参考。
数据挖掘应用于中成药安全性评价的方法有很多,但是根据HIS数据库的特点,目前本研究选择了更利于控制混杂因素的倾向性评分、工具变量等高级分析方法,探索一种更适合HIS 数据库分析需要的数据挖掘方法,为分析HIS 数据库上市后中成药安全性再评价提供一种新的思路。
参考文献:略。
以上是关于荐文基于HIS“真实世界”数据仓库探索上市后中成药安全性评价方法的主要内容,如果未能解决你的问题,请参考以下文章
运用真实世界数据,开展治疗方案与预后关系研究 | 一键实现基于R语言的倾向性评分匹配(PSM)