医学图像识别与挖掘研究方法初探
Posted 统计家园
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了医学图像识别与挖掘研究方法初探相关的知识,希望对你有一定的参考价值。
一、医学图像识别研究方法
随着信息技术的快速发展,图像的数量呈指数型增长,图像识别技术可以智能、高效地完成海量图像的分类与识别,因此,图像识别一直是计算机视觉领域的研究热点。医学图像识别一般包括图像预处理和图像特征提取。图像预处理是通过去除图像中的噪声和干扰,增强有用信息,来提高图像识别的准确率。图像的特征提取是将图像转化为非图像的描述,比如数值表示或向量描述等,其基本思想是将高维空间中的原始图像映射或变换为低维特征描述。
[1]车翔玖,董有政.基于多尺度信息融合的图像识别改进算法[J].吉林大学学报:2020(6):1-8
研究背景:随着深度学习技术的发展,深度学习被应用在诸多其他领域之中,如自然语言理解、语音识别、图像分类、图像检测以及语义分割等。而将深度学习方法应用于医学图像处理领域,这方面的研究却稍显空白。针对医学图像样本中存在噪声元素多、正负样本区分度不明显的问题,设计了一种递进式的多尺度信息融合机制,并结合自然图像分类中的注意力机制,对现有的卷积神经网络结构进行改进,建立了端到端的图像自动识别模型。
数据来源:数据集取自kaggle网站,所有的X光片均来自于广州市妇幼医疗中心1-5岁的儿童患者,所有X光片均在患者进行常规临床护理取得,有效的保证了数据集的真实性。
数据处理方式:本文在残差网络基础之上,设计一种递进式的多尺度信息融合的机制,该机制针对ResNet各个阶段输出特征图的特性,抛弃了过于低层次的特征输出,将后续网络中相邻的两个阶段的特征图进行融合,用作下一阶段的输入,将这一过程迭代进行。并分别在不同的基准网络之上设计了相同的对照实验,按照这些实验方案对本文设计肺炎疾病识别神经网络模型进行训练验证,计算得到相应的评价指标,通过对实验结果的对比确定了网络的最优结构。
研究结论:采用改进后的模型对肺炎疾病正负样本X光片进行识别,准确率、查准率和查全率均得到较大提升,并设计了多组交叉对比实验。实验结果表明,改进后的模型在时间和空间复杂度具有优越性,图像识别准确率提升。
与同类研究相比较的优缺点:文献[1]在残差神经网络中同时使用注意力机制与多尺度信息融合机制,对于提升图像识别任务的准确率具有较大帮助。
阅读参考价值:文献[1]针对现有医学图像在识别时存在的问题,将多尺度信息融合机制与卷积神经网络相结合,可以为今后研究医学图像识别提供一种方法借鉴。
[2]阚红星,张璐瑶,董昌武.一种2型糖尿病中医证型的舌图像识别方法[J].中国生物医学工程学报,2016,35(06):658-664.
[3]张萌,胡显伟,王元斌,张斌.AdaBoost算法在中医舌诊图像分区识别中的研究[J].小型微型计算机系统,2008(06):1149-1153.
研究背景:舌诊是中医获取诊断信息的主要来源之一。但传统中医以经验模式传承,主要根据医生的主观诊断病情,缺乏客观依据。随着中医数字化的广泛应用,利用计算机技术对舌象进行分类识别,寻找既符合中医辩证标准,又能快速准确对舌象进行分析诊断的方法,已成为计算机和中医领域共同关注的课题。
数据来源:文献[2]采集218例2型糖尿病患者舌象彩色图像和临床医生现场证型辨别结果。其中,气阴两虚夹瘀证舌象图像130例,热盛伤津证59例,阴阳两虚证29例。数据[3]以小儿肺炎为典型研究病例,采集1000张标准舌像图片作为训练样本。
数据处理方式:文献[2]首先对于原始舌图像进行色差校正,进行图像分割,包括舌体分割和苔质分离。其次,选择颜色特征、裂纹特征、齿痕特征作为舌图像分类识别特征。最后,设定训练集和测试集,构建随机森林分类器进行图像识别。文献[3]首先确定图像分类特征,对舌像进行预处理操作,包括滤波、提取、修正等几个过程,经过预处理后的图像是只包含舌体部分的标准舌像图片。其次,训练得到每一分区的一组弱分类器,通过弱分类器的组合得到该分区的强分类器。最后,将舌像分类特征与训练得到的分区强分类器组合,构成强分类器组。
研究结论:文献[2]研究的分类识别结果符合临床2型糖尿病中医证型舌诊规律,实验结果具有一定的科学参考价值。文献[3]提出了一种基于AdaBoost算法的中医舌像分区识别方法,并取得了理想的效果。实践证明,AdaBoost算法可以利用简单的弱分类器构建出高精度的强分类器,通过构建多个二分类器,解决了多分类问题。
与同类研究相比较的优缺点:文献[2]由于阴阳两虚证属于糖尿病晚期证型,样本量总体偏少,分类器无法准确学习。文献[3]训练样本数据分布不均匀、样本的标准化和规范化等问题严重影响了识别的准确率,需要进一步解决。
阅读参考价值: AdaBoost算法为复杂识别和复杂分类器设计难题提出了新的探索途径,而文献中提到的舌像分区识别方法 ,不仅提高了识别准确率,也为类似问题提供了参考,可以更大程度的将领域知识应用到实际当中。
[4]丁斋生,周冬明,聂仁灿,侯瑞超,刘琰煜,帅新芳.结合多尺度局部极值分解和SCM模型的医学图像融合方法[J].计算机应用与软件,2020,37(07):142-147.
[5]肖明尧,李雄飞,朱芮.基于NSST域像素相关分析的医学图像融合[J].吉林大学学报:2020(8):1-10
研究背景:由于成像机制的多样性,不同模态的医学图像显示不同种类的信息。传统的单模态医学影像包含的信息具有局限性,医生往往需要综合分析、比较多种影像结果得出临床诊断,效率较低。多模态医学图像融合技术可以将不同模态的医学图像的显著信息进行整合,通过单一图像进行表达,从而降低信息的冗余性,提高临床诊断效率与准确性。
数据来源:文献[4]和文献[5]数据均来自哈佛医学院全脑图库。
数据处理方式:文献[4]首先利用多尺度局部极值分解方法将源图像分解为一系列不同尺度的平滑图像和细节图像。然后,使用最大值法提取平滑图像的最大值,使用稀疏表示方法进行平滑图像的融合,对细节图像取均值,作为DCSCM模型的激励,融合细节图像部分。最后,通过融合后的平滑图像和细节图像重构出最终的融合图像。文献[5]首先利用NSST分解待融合的医学图像,获得高频和低频子带。然后,在高频子带,利用邻域像素相关性计算邻域像素相关系数矩阵,设计融合系数矩阵,并提出相关性拉普拉斯能量和作为融合规则;在低频子带,计算像素能量以及邻域像素能量梯度信息,构建能够保持能量信息的融合决策图。最终,通过逆NSST变换获得融合医学图像。
研究结论:两篇文献均在主观视觉方面和客观评价指标的多种信息保留方面取得了优异的效果。
与同类研究相比较的优缺点:文献[4]针对CT-MRI图像融合中容易造成细节和对比度信息丢失等问题,提出一种基于多尺度局部极值分解方法和双通道脉冲发放皮层模型的图像融合方法,效果显著。但是,使用的基于区域能量的稀疏表示字典融合方法会导致算法运行复杂度上升,运行时间略长,有待日后提升改进。文献[5]提出的融合方法可以很好地并保留源图像的显著信息以及纹理细节,减少融合过程中的能量损失,保持融合图像的对比度,提高其视觉质量。
阅读参考价值:医学图像融合的结果要求保留源图像的信息,同时准确地展现细节特征,使其更符合人眼的视觉特性并且更容易被机器识别。文献[4]和文献[5]均运用多尺度变换的医学图像融合方法,为实现上述要求提供的方法途径。
[6]王郁中,杨杰,周越,郑元杰,王忆勤.图像分割技术在中医舌诊客观化研究中的应用[J].生物医学工程学杂志,2005(06):1128-1133.
研究背景:舌诊是通过观察舌象来了解机体生理功能和病理变化从而获取病人健康状况的一种诊察方法,是中医四诊的重要内容之一。传统舌诊主要依赖于医生的个人经验和知识,这就造成了诊断结果的主观性和可重复性差等缺点,并且舌诊经验不能科学和客观化的保留。因此,建立一套基于图像处理的舌象特征量化系统以能够给舌诊的机器诊断提供特征信息的客观化研究就显得非常重要,而且,这个研究对推动现代信息科学和中国传统医学的交融结合有重要的意义。
数据来源:文献[6]选取1500余幅舌图像进行了实验,但是并没有指定数据具体来源。
数据处理方式:文献[6]采用基于颜色、纹理相结合的无监督的图像分割方法来进行舌苔与舌质的同类区域划分。首先,采用PGF算法对图像进行平滑处理,并利用Lloyd算法进行颜色量化。其次,求取每个像素的相对位置信息,图像中每个像素的颜色用它对应的标识代替后形成了一个颜色类图像。最后,选取种子区域,当种子区域确定后,区域就从种子点开始增长,反复地将与区域内的点相邻的且满足一定相似性要求的点归入该区域。
研究结论:划分方法已经很好的将不同舌质舌苔区划分出来,而且将纹理相似的区域归为一类,使它的层次感很鲜明(已经有薄、厚等语意特征),再加上量化后的颜色复杂度减小使颜色特征更为明显。
与同类研究相比较的优缺点:文献[6]不仅考虑到微观汇总得到的颜色信息,而且考虑到了舌苔区的宏观特性,划分出来的舌苔区实际上已经包含了厚、薄、腻、剥等空间信息。
阅读参考价值:基于边缘检测与GVF动态轮廓线相结合的舌体分割方法和基于颜色—纹理的无监督同类舌苔舌质区域划分算法,能够有效的将舌体分割出来,并在颜色量化的基础上进行舌苔舌质同类区域划分,给后续的特征提取提供了重要信息,为舌诊客观化研究的临床实用性打下坚实基础。
[7]于宁波,刘嘉男,高丽,孙泽文,韩建达.基于深度学习的膝关节MR图像自动分割方法[J].仪器仪表学报,2020,41(06):140-149.
[8]钱宝鑫,肖志勇,宋威.改进的卷积神经网络在肺部图像上的分割应用[J].计算机科学与探索,2020,14(08):1358-1367.
研究背景:医学图像分割是指对医学图像中的器官和病灶进行提取。医学图像分割的本质就是按照灰度、纹理等图像特征,根据同一区域特征的相似性和邻域特征的不同将感兴趣区域分割出来,从而为临床医学提供可靠的信息。如今,深度学习和卷积神经网络技术广泛应用于图像处理,并且在医学图像分割领域取得了很大的进展。
数据来源:文献[7]数据来源于公共数据集OAI-ZIB,数据集包含507套MR图像,每套包含130张2D切片,每张切片的分辨率为384×384,由专家手动分割出膝关节的不同部位。文献[8]数据来自LUNA16数据集,是最大公用肺结节数据集LIDC-IDRI的子集。
数据处理方式:文献[7]在U-Net深度卷积神经网络的基础上,提出了端到端的DRD U-Net。通过使用残差模块增强了特征的复用能力并降低了模型的优化难度,利用扩张卷积模块 ASPP 获取不同尺度的感受野以适应不同大小的分割目标,设计的多输出融合的深监督模块能够直接利用不同层次的特征实现信息互补。文献[8]提出了一种编/解码模式的肺分割算法。一方面在编码模块采用多尺度融合的编码方式,提高了模型对不同尺度特征的适应能力;另一方面采用 ASPP,充分提取了上下文多尺度信息。最后通过注意力机制的级联网络结构,加强目标区域信息的捕捉,有效避免了在特征解码上冗余信息的获取。
研究结论:文献[7]在公开数据集上评估了本文算法和其他的最新分割算法,实验结果的对比分析表明,本文算法在膝关节股骨、胫骨、股骨软骨、胫骨软骨的分割方面都取得了更好的分割精度。文献[8]能有效分割肺实质区域,与其他方法相比分割效果更好。除此以外,提出的方法泛化性较强,可广泛应用到不同的医学图像分割任务中。
与同类研究相比较的优缺点:基于深度学习的分割方法是属于像素分类的一种,传统的基于像素分类的方法通常使用手工特征,而基于深度学习的方法能够自主学习图像特征,并且将特征提取和像素分类相结合,在训练过程中相互促进,因此分割精度也较传统算法高。
阅读参考价值:两篇文献表明了深度学习在图像分割研究领域中的优势,为后续图像信息的深度挖掘提供良好的研究价值。
[9]张滨凯,王翔,郑津津.结合字典学习和稀疏聚类的医学图像分割算法[J].中国科学技术大学学报,2019,49(10):791-796.
研究背景:在医学图像的分割中,提高分割精度和准确度,实现半自动甚至全自动分割,是学者的重要研究目标。聚类算法是一种无监督的自适应分割方法,其基本思想是根据像素之间的相似性进行分类,不需要人工标记,仅通过迭代实现图像的分类和特征值的提取,可以看作一种自我训练的分类方法。在此基础上,将空间邻域信息引入聚类分割,从而降低噪声的干扰,提高分割精度。
数据来源:文献[9]数据来源于SBD数据库提供的人脑MRI序列。
数据处理方式:文献[9]提出了一种结合字典学习的医学图像聚类分割算法,将字典作为聚类分割的聚类中心,通过稀疏表示确定聚类归属从而实现医学图像分割。对于单幅医学图像,通过稀疏表示和字典更新的交互迭代直到能量函数值收敛,即可实现无监督地自适应聚类分割;对于序列图像,则可以通过训练样本图像得到训练字典,再通过训练字典进行序列分割。
研究结论:相较于传统的基于区域的聚类分割算法,本文算法不仅在单幅图像分割中有较好的分割精度,并且在序列图像的分割中保持了很好的准确性和一致性,取得了较好的分割结果。
与同类研究相比较的优缺点:由于医学图像多是序列图像,同样的器官或组织在不同层的图像中具有连续性和特征相似性,而基于单幅图像的聚类分割算法难以保证不同层分割的一致性,文献[9]提出的稀疏表示和字典学习的方法克服了传统聚类分割方法的弊端,简化信号的处理,具有良好的鲁棒性和自适应能力。
阅读参考价值:因为医学序列图像不同层图像具有一定的连续性和相似性,文献[9]提出了一种以字典作为聚类中心,以稀疏表示实现聚类分割的医学图像分割算法,为今后研究图像分割开阔了思路。
二、医学图像挖掘研究方法
医院信息化建设日益成熟,由最初的医院信息系统到现在以电子病历为中心的各种信息系统,均以直线增长方式上线运行。数字化医院信息系统的广泛采用使医学数据,特别是图像数据以TB级的容量膨胀。如何充分利用经卫生部及医院巨额投资的各个信息系统所获取的海量与零散数据,已成为医疗行业迫切需要解决的问题。数据挖掘技术在中医和医学图像方面的应用日益成熟,为大数据背景下日趋复杂的医学图像数据分析提供了新的研究途径。最常用的数据挖掘方法包括ID3等决策树算法、以Apriori最为经典的关联规则算法、应用于大量未知类别数据分类的聚类方法等。近年来,学者将智能算法如遗传算法、神经网络等应用于医学的数据挖掘,并提出粗糙集和遗传算法结合、粗糙集和神经网络结合的结合算法。
[10]邹丽,蒋芸,陈娜,沈健,胡学伟,李志磊.基于决策树对支持向量机的医学图像分类新方法[J].计算机工程与应用,2016,52(21):76-80.
[11]张春芬,朱玉全,陈耿,王敏.基于Cascade组合分类器的医学图像分类方法研究[J].计算机工程与应用,2007(36):211-213.
[12]Quellec G.Medical Case Retrieval From a Committee of Decision Trees[J].Computerized Medical Imaging and Graphics,2010,34:617-631
研究背景:近年来, 随着计算机、图形图像及生物工程等相关技术在医院信息化建设中的广泛应用,许多医院均已收集了大量的影像数据,如DSA、超声图像、电阻抗图像等。在这些医学影像数据中,绝大部分影像已经被医生确诊,即已经知道确诊影像所属类别(正常、异常甚至何种异常) ,如何充分利用已确诊病例影像数据信息和医生的临床诊断经验来判断未确诊医学影像所属类别,辅助医生进行临床诊断,正是计算机辅助医学诊断系统要实现的一个重要目标。因此,医学图像分类方法的研究具有广泛的应用前景。
数据来源:文献[10]数据来源于数据集是MIAS,它是研究乳腺X光图像的标准数据集,图像均为1024×1024的灰度图。数据集包含322幅乳腺X光图像,它们分属于三类:正常、良性和恶性。其中,属正常的图像208幅、良性63幅和恶性51幅。文献[11]实验数据采用的是大小为512×512像素的二维肝脏CT图像,具体数据来源没有注明。文献[12]数据来源于糖尿病视网膜病变数据集(DRD)和乳腺钼靶筛查数字数据库(DDSM)。
数据处理方式:文献[10]首先对图像进行预处理,包括图像去噪和图像增强。其次,对处理后的图像提取特征,采用的特征提取方法是灰度共生矩阵,提取了四种统计参数:角二阶矩、熵、惯性矩、相关系数。最后,对特征数据建立决策树,用GA-DTTSVM 对提取的特征数据做分类。文献[11]首先利用朴素贝叶斯分类器得出图像样本分别属于正常和异常两个类别的概率,再将该决策信息与初始数据合并作为下层分类器的输入,进行训练和测试,利用分类算法的互补性克服单分类器的缺陷, 达到了较高的分类精度和稳定性。文献[12]提出了一种新的医学信息检索框架:支持由图像序列和上下文信息组成的查询。使用决策树组合异构信息,处理缺失值并避免过度拟合。并以大数据集(如DDSM)和小数据集(如DRD)进行效果验证。
研究结论:文献[10]将该算法和DTTSVM以及Multi-TWSVM作对比,实验结果表明该算法不仅保持了较高的分类精度,而且在训练速度上体现出一定优势,具有一定的实用价值。文献[11]从综合特征数据集和Gabor小波特征数据集的分类精度看出,由于采用的特征数据集不同,单分类器所得出的分类精度上下浮动稍大, 而组合分类器则比较集中,可见在分类器稳定性上组合分类器较单一分类器也要略胜一筹。文献[12]通过对两个数据集检验精度的计算,基于内容的信息检索框架中使用决策树技术将明显提高分类的准确度。
与同类研究相比较的优缺点:单一的分类算法往往因为算法自身的弊端而不能做到医学图像的精准分类,文献[10]和文献[11]将贝叶斯算法、遗传算法、支持向量机和决策树等算法结构建了混合算法,在实际应用中可利用各类算法的优缺点取长补短,效果显著。
阅读参考价值:在医学图像分类研究过程中发现,随着技术的发展,利用混合模型进行图像分类的技术优势明显,越来越得到重视,为今后的图像分类研究提供了宝贵的经验。
[13]谢福鼎,赵凤霞,稽敏.基于加权复杂网络聚类的医学图像分类器研究[J].计算机工程与设计,2009,30(17):4057-4060.
[14]王大玲,鲁家乐,吴霜,张一飞,于戈.图像分类与聚类算法在医学图像挖掘中的应用[J].计算机工程,2007(02):168-170.
[15]Marrocco C. computer-aided detection system for clustered microcalcifications[J].Artifical Intelligence in Medicine,2010,50:23-32
研究背景:分类和聚类是数据挖掘中广泛采用的两种技术。前者根据训练数据集中的数据所表现出的特性,为每一个类找到一种准确的描述或者模型,由此生成的类描述或模型用来对新的数据进行分类。后者是将数据对象分组成多个类,在同一个类中的对象之间具有较高的相似度,而不同类之间的差别较大。就医学图像挖掘而言,如果获取了大量图像及相应的诊断结果,以诊断结果作为类标识,准确地描述图像特征与其对应疾病的关系模型,便可根据这些模型对新的图像进行分类(诊断)。同样,根据图像的特征,将特征相似的图像聚类,也将有助于疾病的诊断。
数据来源:文献[13]数据来自于某医院的PACS系统库中。选取358张MIR脑部图片组成数据集,有些病人正常,有些病人脑部有肿瘤。将其分为3类:正常、良性、恶性,后两类又统称为非正常。其中正常的图223幅,非正常135幅(良性92幅,恶性43幅)。文献[14]使用的CT图像数据来自沈阳市某医院,使用的胸部CT图像来自西安某公司医学光盘库。文献[15]数据来自奈梅根大学建立的乳腺癌数据库,该数据库由21名患者的40张数字化乳腺X线图像组成。
数据处理方式:文献[13]首先进行图像的预处理,用图像处理中常用的去噪方法去除图像中的噪声和刚性平移运动伪影校正算法去除图像中的伪影。然后,针对预处理的图像,提取图像均值、方差、偏斜度和峰值。再次,计算相似度矩阵,并构造加权复杂网络。最后,将节点按照加权网络综合特征值从大到小排序,依次选取加权网络综合特征值高的节点作为聚类的初始聚类中心,采用k- mean算法根据图片的相似度进行划分迭代,形成聚类。文献[14]对图像划分训练集和测试集,对训练集和测试集图像应用Paint Shop Pro进行分割获取灰度级,应用ID3决策树分类算法对训练集进行分类。并将头部图像分类3组,胸部图像分为4组,设置不同的半径进行DBSCAN聚类。文献[15]选择用一个树形结构的马尔科夫随机域算法对图像进行分割,然后再用基于经验原则和组合分类器的方法对分割的各个区域进行聚类分析。
研究结论:文献[13]通过对MIR脑部图片进行分类,与传统的聚类方法比较,该方法的分类精度平均提高了8%左右。文献[14]提出了采用灰度级作为CT图像特征的思想、灰度级的提取和存储方法,采用决策树分类算法和基于密度的聚类算法对胸部和头部 CT 图像进行分类和聚类,对结果进行了初步的分析。文献[15]在一个公开的乳房X光片数据库上进行了测试,并与以前的方法进行了比较,结果表明,该算法相较于之前的研究更加的有效,特别是在灵敏度方面。
与同类研究相比较的优缺点:文献[13]根据节点间的连接度和节点的加权网络综和特征值较好地选取了初始聚类中心,克服了k-means聚类算法对初始值敏感的缺点,从而使得聚类质量大大提高。特别是根据节点间连接度选取聚类中心,降低了选取同一类的不同节点作为聚类中心的概率,减少了算法的迭代次数,提高了算法的效率。文献[15]在分割阶段,所采用的MRF模型的树状结构能够通过对所有场参数的自适应局部估计来减少计算负担,并保留图像中的小细节。分类阶段利用了分类器组合的优势,能够将单个微钙化和集群作为一个整体进行信息整合。
阅读参考价值:聚类算法是图像数据挖掘重要的一种算法,文献中利用改进的聚类算法和包含聚类算法的混合模型算法将为后续图像聚类研究提供思路和方法。
[16]武园园,宋余庆,朱玉全.基于关联规则的医学图像分类算法[J].计算机工程与设计,2008(12):3234-3236.
[17]王乾,吕亚男,李东红,宋立新.基于关联规则的乳腺肿块多模检索[J].哈尔滨理工大学学报,2017,22(02):124-128+134.
研究背景:医学影像是医生诊断的一重要依据,如何能够快速、准确的从海量数据中找到和待查询病例最相似的案例辅助医生进行判断成为一个急需要解决的重要问题。采用基于关联规则的特征选择算法进行特征选择,利用关联规则挖掘算法获取底层特征和语义特征之间的关联规则,实现了底层特征和语义特征结合的多模检索。
数据来源:文献[16]数据来自江苏大学附属医院影像诊断科的肝部CT图像数据,从中随机抽取 1000 幅图像,其中肝部正常图像、异常图像各500幅。两类图像各选取100幅作为训练样本,其余用于分类。文献[17]选取了美国南佛罗里达大学构建的数字乳腺X线图像数据库中的170幅图像,其形状描述语义为医学影像专家标注。
数据处理方式:文献[16]首先进行图像的预处理和特征提取,构成了77维表征医学图像的特征矢量。其次,对这77维特征用Nguyen(贪心算法)进行离散化,映射到连续正整数集合,再将77维离散化后的特征用粗糙集进行属性约减,最终保留15维特征。最后,用CARMI算法对训练数据集进行挖掘,得到关联分类规则存储于数据库。文献[17]首先获取图像的底层特征,选择出与图像形状以及肿瘤良恶性有关系的特征。然后利用选择出来的形状特征得到分类关联规则,通过关联分类算法构建图像形状分类模型。最后,结合图像与良恶性有关的底层特征,得到和输入案例最相似的图像。
研究结论:文献[16]以CMAR算法为基础,提出了一种基于关联规则的医学图像分类的CMRMI算法,通过引入双支持度,减少无意义的特征对分类造成的干扰,实现对医学图像自动分类,实验结果表明该算法有较好的性能。文献[17]基于给出的关联规则的多模检索方法提供的检索结果,在辅助语义标注和辅助诊断上具有较好的性能,弥补了基于内容单模态检索信息不足的局限。
与同类研究相比较的优缺点:文献[16],CARMI算法采用基于FP-growth的方法,在处理医学图像这样的较大数据集以及长模式数据时,FP- growth 算法比以往的基于Apriori方法的关联分类效率高的多。文献[17]采用多模检索方式,相较于单模检索方式,有效的提高了图像的检索精度并且能够由图像的底层特征获知图像的视觉语义特征。
阅读参考价值:关联规则也是图像数据挖掘的一种重要算法,使用关联规则,弥补了基于内容单模态检索信息不足的局限,为边缘语义建立关联分类模型,为研究提供更有效更全面的语义信息。
[18]陈娜,蒋芸,邹丽,沈建,胡学伟,李志磊.基于判别式受限玻尔兹曼机的医学图像分类法[J].计算机科学,2015,42(05):315-319.
研究背景:随着计算机技术的快速发展,对X光片的分析也实现了从传统人工分析到计算机辅助分析的转换,这种转换可以使乳腺癌的诊断更快速、更准确。目前人们主要从两个方面对医学图像进行分析,一方面人们选择直接从图像的处理中发现病灶,比如对图像进行纹理分析研究、对图像进行结构的研究等。另一方面,大数据背景下,人们还选择通过数据挖掘的方法对医学图像进行分析。
数据来源:实验采用的是来自乳腺分析学会的数据库和筛选的乳腺X光数 字数据库中的数据集,这是研究乳腺X光图像的标准数据集。
数据处理方式:文献[18]利用K近邻平滑滤波器对图像进行去噪,通过对图像进行纹理处理来重点保留图像的高亮点,然后对图像进行二值化处理,最后采用判别式受限玻尔兹曼机对医学图像进行分类,主要利用了判别式受限玻尔兹曼机自动学习图像特征并利用学习到的特征对图像进行分类的性能。
研究结论:对比分析发现,DRBM对图像的分类准确率明显高于其它基于特征提取的医学图像分类方法。
与同类研究相比较的优缺点:目前很多数据挖掘方法已经成功应用在了医学图像的分类中,但这些方法大部分都是先提取医学图像中的统计学特征,然后再在此特征数据集的基础上对图像进行分析,从而实现对医学图像的诊断,如关联规则、决策树、遗传算法、人工神经网络、支持向量机等。但是基于统计特征提取的医学图像分析方法中特征提取的好坏直接影响着图像的分析结果,而且特征的选择会受到经验等主观因素的影响。DRBM是一种无向判别模型,直接从图像中学习特征并利用这些特征对图像进行分类。
阅读参考价值:多数图像挖掘算法都是基于特征提取的基础上进行的,文献[18]使用的受限玻尔兹曼机模型不需要提取图像特征信息,直接进行学习分类,为之后的研究开阔了思路。
[19]郭依正,焦蓬蓬,周巧扣,周游.基于灰度共生矩阵的肝脏CT图纹理特征分析[J].实验室研究与探索,2012,31(08):62-64+80.
研究背景:纹理是图像的一个固有属性,纹理特征提取是图像识别、图像数据挖掘、图像检索等研究内容的首要问题,一直是图像领域研究的热点。
数据来源:数据来源于人体腹部CT图像数据集,随机抽取其中20幅,正常肝脏图像和异常肝脏图像各10幅。
数据处理方式:首先确定图像ROI区域,接着构造一个新的能综合反映共生矩阵各角度信息的灰度共生矩阵,然后提取基于该矩阵的纹理特征参数。
研究结论:实验结果反映,提取的纹理特征对图像内容有较好的区分性,当有肝脏病变发生时,肝脏微结构发生了明显变化,从而使正常肝脏与异常肝脏CT图像之间的纹理特征出现了较大的差别,表现为图像纹理粗糙。
与同类研究相比较的优缺点:本文虽然采取了灰色共生矩阵这一典型的纹理特征提取方法,但是在图像灰度级L和距离d的选取都是作为借鉴选取的,是否是最佳选择还需证实。
阅读参考价值:灰色共生矩阵算法可以用于纹理特征分析,但是目前影响GLCM算复杂的4个变量多采用经验选取,主观性太强,为后续研究改进提供思路。
[20]刘晓虹,朱玉全,刘哲,宋余庆,朱彦,袁德琪.基于改进多尺度LBP算法的肝脏CT图像特征提取方法[J].计算机科学,2019,46(03):125-130.
研究背景:肝脏疾病会对人类构成生命威胁,而早期肿瘤的及时发现可以在很大程度上提高肝癌病人的生存概率。近年来,计算机断层扫描由于具有操作便捷以及价格合理的特点,已经成为一种常用的非侵入性的医学成像技术,所得到的肝脏CT图像可供医生进行纹理分析,并以此诊断病情。
数据来源:实验所需的数据集是由江滨医院影像科的专家进行采集并勾画的,共采集了292组肝脏平扫CT图像。
数据处理方式:首先将图像进行预处理,然后对得到的ROI区域进行多尺度的LBP特征提取,经过特征选择后再进行分类。
研究结论:实验结果表明,本文方法对肝脏CT图像的诊断率相比各类改进 LBP方法均有明显的提升。通过实验分析可以看出,本文所提方法有一定的临床应用意义,可以用于医生的辅助诊断。
与同类研究相比较的优缺点:目前的实验结果虽然相较其他方法有所提升,但准确率仍有待提升,距离应用于临床诊断还远远不够。
阅读参考价值:文献[20]只对实验数据集做了二阶的MSLBP的实验,在今后的研究中可将MSLBP应用到更多的尺度中,以证实它的有效性。
以上是关于医学图像识别与挖掘研究方法初探的主要内容,如果未能解决你的问题,请参考以下文章