当搜索引擎碰上风湿病大数据化.....
Posted 风湿界
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了当搜索引擎碰上风湿病大数据化.....相关的知识,希望对你有一定的参考价值。
投稿发送至RP@high-med.com
应聘全职及兼职编辑,发送简历至
chenlf@high-med.com
风湿性疾病是一种可以累及全世界5%~10%人群的一类疾病,可以分类为器官特异性疾病或系统性疾病,从流行病学角度来说,大部分系统性风湿性疾病[除了系统性红斑狼疮(SLE)和干燥综合征(SS)]都应该为定义为少见病(少于5人/10000人),特点在于在诊断年龄、性别分布和种族差异方面有广泛的人口模式。各国的风湿病学专家为了风湿性疾病的流行病学做了大量的研究工作,但是对于整个群体来说,可能数目仍显不足。
现在社会进入大数据时代,讲究数据的最大化以更好地了解事情的全貌,并通过数据的无穷大来克服个体数据缺失造成的误差,可是鉴于大数据收集的工程量较大,数据的统一性、安全性等是实际操作中无法回避的问题,因此临床医疗大数据化仍然是一件好看不好做的事。全球网络化让我们看到了另一种收集大数据的方法,文献“Google-driven search for big data in autoimmune geoepidemiology:Analysis of 394,827 patients with systemic autoimmune diseases”这篇文章的作者们通过谷歌作为搜索媒介,初步调查了风湿性疾病的一些流行病学的特点,这个方法值得我们在日后的研究予以借鉴,也可以帮助我们更好地了解风湿性疾病流行病学究竟真相如何。
单从数据而言,确实非常庞大,整个研究结果最终入选了359838名系统性风湿性疾病进行最后的分析,需要注意的是尽管RA也被认为是弥漫性结缔组织病的一种,但考虑到它的主要症状仍然在关节,因此在这个研究里并没有被纳入,同时其他可以有关节外表现的如强直性脊柱炎、痛风等都不在其中。
纳入分析的研究有以下特点:
1. 数据来源往往是从计算机数据库获得的。数据库分为两大类:行政数据库(主要用于医疗以外的目的) 和病历数据库(专门为临床目的收集。
2. 来自保险公司、政府机构、互联网公司和医疗服务提供者的网上资源或来自国家公共卫生系统。
3. 研究人口:“以人口为基础”一词传统上用来描述一项研究,该研究涉及特定地理图中定义的一般人口医疗领域,而不是以病人为基础的人群,包括住院患者(以医院为基础)或门诊患者(以初级保健为基础)。
4. 病人的选择:病人绝大多数根据世界卫生组织的《国际疾病分类》或使用临床诊断。
从以上几条,我们需要明白这些数据仍然不能代表全部患者,很多无法进行网络数据库资源共享的区域的数据可能没有被包含其中,这就可能带来偏差。但是完美的大数据是不可能存在的,就像热力学第三定律中那“只能无限靠近却永远不能达到的绝对零度”一般,因此我们就继续看吧。
从数量来看(见图1),SLE患者数量排布第一并不奇怪,但血管炎(包含大中小血管炎)的数量之多仍然让我们吃了一惊,要知道纳入的队列均为超过1000人的研究,在此基础上统计的患者数量排名二、三、四位的均为血管炎,这也提示了这个神秘而复杂的疾病其实数量巨大,日常工作中对血管炎的诊断注意力也应该提高一个台阶。
(图1 不同系统性风湿性疾病患者的数量)
性别方面(见图2),系统性风湿性疾病女性的比重明显大于男性,提示女性是风湿病的易发人群。性别差异比较大的疾病包括干燥综合征(男女比例可高达1:9.57),其次是系统性硬化病和SLE。只有在肉芽肿多血管炎中,男性才较女性明显升高,性别在风湿性疾病的差异之大可见一斑,这也提示和性别相关的因素,如性染色体,内分泌激素可能都在疾病中起到一定作用。
(图2 不同系统性风湿性疾病的性别比例,红色女性,蓝色男性)
不同疾病在发病年龄段也出现了迥异的趋势(见图3),如血管炎好发于老年患者;SS,系统性硬化症等好发于中年人;SLE等好发于年轻人。这里需要注意的是诊断年纪和真正的发病年纪相差甚远,但发病年龄鉴定较为困难,从本文纳入包括诊断时间和发病时间的数据来看,大部分疾病从初始诊断到确诊都相隔5年以上,这也和各项分类疾病(如强直性脊柱炎)研究中发现的疾病延误时间一致,由于大部分风湿性疾病治疗都存在时间窗,时间窗内治疗带来的益处不胜枚举,但现实中这个时间窗可能只是个镜花水月,无法触及罢了。这也侧面提示了风湿性疾病专科化,基层化的必要性和紧迫性。
(图3 不同系统性风湿性疾病患者的诊断年龄)
地区和种族差异一直是疾病流行病学非常关注的点,从本研究来看,不同地区疾病的流行程度确实不同(见图4),而我国SLE和过敏性紫癫的患者总人数在世界上是名列前茅的。
(图4 不同风湿性疾病最好发的区域图示)
最后我们来看看这些数据的来源情况(见图5),目前的数据库来源于两种,一种指行政数据库,另一种则是医疗数据库,从本研究发现的结果来看,很多地区建立完善的行政数据库了解医疗数据,而许多国家的医疗数据库水平也不堪多让。可喜的是我国已经在这块上毫不逊色,国家风湿病数据库目前已成为世界最大的几个数据库之一,为中国和世界的风湿病发展做出了自己的贡献。
(图5 本研究收集数据来源,黄色医疗数据库,蓝色行政数据库)
大数据时代来临,我们都真正做好准备了吗?
参考文献:
Google-driven search for big data in autoimmune geoepidemiology: Analysis of 394,827 patients with systemic autoimmune diseases[J]. Autoimmunity Reviews, 2015, 14(8):670-679.
以上是关于当搜索引擎碰上风湿病大数据化.....的主要内容,如果未能解决你的问题,请参考以下文章