数字(D)成像(I)与通讯(Co)

Posted zssure

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数字(D)成像(I)与通讯(Co)相关的知识,希望对你有一定的参考价值。

背景:

正如同笛卡尔定义了我们所生活在的三维世界和爱因斯坦定义了第四维度时间,在第一章中我们给出了统一的标定DICOM世界的坐标系,以及相关的变换理论,接下来我们要逐步走进DICOM世界内部,观察其内部的“真实景象”,探究其背后的“原理”。

DICOM, 全称Digital Imaging and Communications in Medicine,是应用于医疗领域成像与通讯的约定(这里没有使用协议而是使用的约定,目的是为了弱化由于文字本身的抽象含义而造成的理解偏差。从广义来看,任何我们学到的理论,甚至所谓的“迷信”与“科学”都是特定时间内人类感受和认知世界的一种方法或者理论,是人类对经验总结的抽象,所以可以简单认为是一种约定俗成的“约定”)。虽然只有简短的几个单词,但每一个单独出来其内涵都足够丰富,都可以独立成为一个学科或一个学科的一个分支。Digital代表数字化,与其相对的是Analog模拟。数字信号与模拟信号的处理是一门相当复杂的学科;Imaging成像,从最早的小孔成像,人类就已经开始尝试去改进和发明新的技术来记录保存自身所观察到的“自然世界”,这里面会牵涉到对比度、分辨率等常见的概念;Communication通讯,表示信号在两方或多方之间的传输,这里面会牵涉到数字信号与模拟信号的转换、采样定理(香农采样定理)、量化、信息熵(香农信息论)等等概念。每一个部分都蕴含了各自领域诸多先人智慧的结晶,想通过一篇简短的博文来讲解清楚它们各自的发展必然是无法实现的,
本篇博文希望以科普的视角,首先,从人类视觉原理出发,探索一下“影像”在人类大脑中的形态;其次,从胶片冲洗到数字化影像技术,回顾一下人类记录“影像”的各种尝试,这期间会简单介绍诸如分辨率、对比度等概念;最后过渡到DICOM世界中的各类技术成像,诸如心电、超声、X-Ray、CT、MR、PET等。让大家了解DICOM世界并不孤立、并不复杂,与我们生活中常见的各类成像技术是相通的,若要说其唯一的独特性,那就是——是人类试图去认知世界的另一个视角,即认识世界中的人类自我的一种方式。

一、视觉:

当婴儿呱呱坠地,睁开眼睛的那一刻,它已经开始与整个世界进行交互,而且是海量数据的交互。眼睛作为视觉器官,是人和动物利用光的作用来感知外部世界的感受器,获得对机体生存有意义的各种信息,至少有80%以上的外界信息经由视觉获得(其他的来源于听觉、触觉、味觉等等)。因此了解眼睛的视觉成像原理,对我们了解人类认识世界和改造世界至关重要。正如刚萨雷斯在著作【1】中所提到的一样,

“虽然数字图像处理领域建立在数学和概率统计表示法的基础上,但人的直觉和分析相比之下在选择一种技术时起到核心作用。这种选择常常是主观的视觉判断

人眼的解剖结构如下图(摘自参考资料【2】)所示,

眼睛的结构近似于一个圆球,其平均直径大约为20mm。主要的结构包括最前端的角膜(Cornea)、稍内一些的虹膜(Iris)——虹膜开口的区域叫做瞳孔(pupil),再到晶状体(Lens,这个单词同样可以表示镜头、透镜)、玻璃体(Vitreous Humor),最后是视网膜(Retina)、巩膜(Sclera)。前后形成一个通透的光路系统,这一点与常见的望远镜、显微镜、相机等成像设备的原理类似。由于光在不同介质中传播时会发生折射,当光线依次经过角膜、晶状体、玻璃体三种介质(折射率参见下图,节选在参考资料【2】)后,光线会逐渐聚焦最终汇集在视网膜上。视网膜负责将接收到的不同光强引起的刺激转变成电脉冲最终传输到大脑进行解码,此时才完成眼睛的“成像”。

随着科技的进步,以及仿生学的发展,现如今发明的各类成像系统(光学成像系统或其他)在某些方面,例如分辨率、距离等,已经超越了人眼的生理极限,但这整套视觉感知系统背后的深层原理我们却依然几乎是一无所知,即使现如今所谓的人工智能神经网络技术势头迅猛,但离逼近人类的极限还有好一段路要走,有兴趣的同学可以阅读参考资料【3】和【4】,看一下在人眼认为再简单不过的识别场景下所谓的人工智能神经网络多么的脆弱——当然对待未来我们还是要充满信心,历史总是在进步的,或许不久的未来我们会跳跃式的逼近人眼的视觉系统,届时无人驾驶、人脸识别、智能诊断也就不在话下了。

【备注】在现实生活中,我们也时常可以感受到人眼的神奇所在,例如下面(节选自参考资料【5】)这些利用人眼自身特性而构造出诸多奇特的图像或图形,也就是所谓的“视觉错觉”。——然而这些错觉对于AI算法来说却不用在意,因为这些错觉在精准的度量和表达下是不存在的,例如下图最左侧的橙色圆的大小是相等的。

二、成像:

人类意识中的“成像”最早应该来源于视网膜的电刺激,正如上文所述现如今的技术手段还无法完全解释这一现象,——或许真的来源于那只看不见的“上帝之手”——。但人类却一直没有停歇脚步,用各种尝试去试图记录日常生活中的“影像”。如果我们宽泛的来看,从象形文字开始人类就已经试图用自己的方式去复现这个“世界”,包括绘画家、雕塑家、建筑师,人类成像的手段和技术在逐步进步。

2.0 小孔成像:

但说到标准的成像,即我们人眼能够感受到的可见光所反映出来的“自然世界”,可以追溯到汉朝墨翟的“小孔成像”(如下图,详情参考【6】):用一个带有小孔的板遮挡在墙体与物之间,墙体上就会形成物的倒影。这里小孔就充当了“镜头或者透镜”的角色,类似于人眼的角膜和晶状体,墙体就类似于人眼视网膜,从这里我们也可以知道视网膜上的第一次成像是真实世界的倒影。其实现在我们常说的相机,英文单词Camera Obscura,字面含义就是“黑暗的房子”的意思。

小孔成像第一次使得人类可以在一个非人眼视网膜的“介质”上来重现真实的世界,但这里的“成像”却无法持久保留下来,一旦光线改变,影像也就消失了。要想将这里的倒影记录并保存下来,人类又经历了长达两千年的漫长时光,直到欧洲“摄影术”的出现。

2.1 胶片Photographic Film:

胶片的出现也是经历了漫长的周期(参考【6】),从最早的“日光蚀刻法”、到“银版摄影法”、再到“火棉胶摄影法”,直到1888年美国柯达公司(美国的柯达Kodak、欧洲的爱克发Agfa、日本的富士FujiFilm,绝对是胶片成像年代的巨头)成产出了一种“柔软、可卷绕”的新型感光材料,胶片才算真正走向了成熟。
胶片成像大致需要经历这几个过程,
- 在相纸(photographic paper)表面涂一层乳胶,内部悬浮着大量各种尺寸的卤化银颗粒。颗粒可以与光线发生化学反应,其大小、形状和分布决定了胶片的灵敏度、对比度和分辨率,小的颗粒对光线不敏感,大的颗粒对光线敏感;颗粒分散区域对光线不敏感;颗粒聚集区域对光线敏感。卤化银颗粒通常很微细,只有在高倍显微镜下才能观察到。在 12 1 英 寸 2 乳胶中约有400亿( 40,000,000,000 40 , 000 , 000 , 000 )个之多。
- 当乳胶被暴露在光线下,内部悬浮的卤化银颗粒受到光刺激会发生化学反应,使得卤化银晶体聚结而形成的块,但这些块仍然是极其微细的。乳剂层接受到的光量愈多,晶体的变化和聚结愈明显。也就是说不同强度的光照射到胶片上,胶片乳剂层的微观领域就有不同数量的晶体发生结构变化和相互聚结。这种特性就是胶片能够记录“光信息”的根本。

可以用生活中我们常见的场景来模拟演示一下,
1)碎铁屑与磁铁。如下图所示:

图a)中是我们从小学的自然课本里就会看到的碎铁屑在磁场下的分布形态,这里可以看出碎铁屑的分布可以模拟出来磁场场线的分布情况;图b)到图g)碎屑分布越来越复杂,所表达的信息越来越丰富,“成像”也越来越清晰,最后的g)是否有一点狒狒的意思(^_^),(更多的图像可以参考【6】)

2)碎铅笔屑。如下图所示:

上面两幅黑白灰度图与我们用“碎铁屑+磁铁”演示的效果类似,不同的是这里的铅笔屑我们可以任意摆放。另外,由于铅笔屑的五颜六色,下面两幅图给我们呈现出了一个缤纷多彩的世界(数据截图来源于【7】)。

通过这两个生活中的示例,是不是就可以清晰的理解胶片的成像原理了?我想是的。相较于我们人眼清晰可见的碎铁屑和碎铅笔屑,胶片乳胶中悬浮的卤化银晶体颗粒很细微很细微,而且数量众多,因此胶片能更详细、更清晰的表达我们的客观世界。当然上述介绍的胶片成像过程还不够完整,在晶体颗粒与光线发生化学反应后,此时形成的仅仅是“潜影”,我们肉眼还是看不见的,要想真正变成我们生活中的照片,需要经过冲洗(冲洗的英文单词是啥?竟然是develop)和定影等操作(详情可参见百度百科【8】)。

【备注】:正如数码相片是由像素这个最小单位构成的,而胶片则是由银盐颗粒构成的。所谓的颗粒感是胶片感光质量不佳的副产物,如同数码相片的高ISO噪点,是摄影师极力避免的。另外,像素作为单位,大小是固定的,但银盐颗粒却不是这样,不同型号的胶片颗粒大小是不同的,一般越新型号越昂贵的胶片颗粒越细腻。所以就有了“颗粒度”这个重要的评价指标,简称RMS/PGI。很明显,当颗粒肉眼可见时,它对胶片的另一个评价指标——解析力(Resolving Power),即每毫米可分辨的线对——有一定的影响,颗粒越明显解析力就越差。到了数码时代,人们更习惯用“锐度”来代替“解析力”这个叫法(详情参见【9】)。

2.2 数字成像Digital Imaging:

其实胶片成像已经能够“清晰”的还原和记录我们周围的世界了,但是人类是贪婪的,什么也阻挡不了人类前进的脚步,尤其是科学世界观诞生之后。在”成像”技术的发展过程中,历史也是惊人的相似,正如很多技术的推动和进步都是来源于战争和军备竞赛一样(这里面的例子就太多了,诸如摩尔斯密码与电报、雷达与无线电、原子弹与核物理等等,有兴趣的可以直接google战争与科技),数字成像来源于上世纪60年代的太空军备竞赛:

1957年,冷战时期美国与苏联都在尝试将卫星发射到太空中,在同年10月份苏联抢占先机发射成功。发射成功后,就有政客考虑是否可以让卫星携带一个相机进入太空,这样就可以轻而易举的监控敌人了。这个想法当然是可行的而且现如今早已成熟了,但在当时以胶片photographic film成像时代,照片需要在暗房内冲洗+定影,显然这在太空中的卫星上是不可能实现的,即使最终实现了也无法将冲洗后的胶片传回地球(详情参考【10】)。

这时候就催生了新的需求,也就推动了数字成像技术的发展。当然一项技术的发展都需要一段时间,最早的无胶片的成像(photography without film)在1973年由柯达公司(对,你没有看错,就是那个胶片时代的霸主Kodak)一位工程师Steven Sasson通过CCD技术来实现(这个是申请了专利的【11】),当时的设备重大8磅,而且成像只有10万个像素,这自然跟我们现在的成像技术无法比拟。从第一台数字成像设备出现后,采集设备(镜头和传感器)、存储设备、压缩技术也随之进入了快速发展的时代,直到今天我们日常人手一台智能手机自带高清数码相机。
上文介绍胶片成像时提到过胶片之所以能够“捕捉或度量”光线,是因为有对光敏感且可以发生化学反应的“银盐颗粒”。数字成像时代要想记录光线,同样需要一种“介质”来捕捉和度量光线。所以在这里简单介绍一下数字成像时代的关键“介质”——成像传感器(Imaging sensor)。之所以叫做传感器可以理解为是一种“介质”可以将输入端接收到的“光线”转换成电流(电荷)并以电信号的形式传导到后续的处理系统存储下来。这些介质在感光特性上与胶片中应用的“银盐颗粒”相似,都是光敏感,但胶片时代主要是应用了介质银盐颗粒与光线发生的化学作用,而数字时代主要是利用“介质”在感光后的物理变化,这种介质大多都来源于一种元素“硅”,可以说我们现在生活的时代是一个“硅基时代”。在以硅为基础的数字化成像时代,主要有CCD和CMOS两大类。CCD是集成在半导体单晶材料上,而CMOS是集成在金属氧化物的半导体材料上,两者的大致区别:

从原理上,CMOS的信号是以点为单位的电荷信号,而CCD是以行为单位的电流信号,前者更为敏感,速度也更快,更为省电。现在高级的CMOS并不比一般CCD差,但是CMOS工艺还不是十分成熟,普通的CMOS一般分辨率低而成像较差。(详情参考【12】

具体两者的区别可参照下面两幅比较形象的图(图一来自于【13】,图二来自于【14】)

三、DICOM成像:

DICOM成像也就是医学成像,即Medical Imaging,是应用于临床分析和医学治疗的一种来表达人体内部器官和组织的可视化技术。随着技术的发展,现如今的观察级别已经越来越深,从最初的宏观层面的解剖学结构的X光与CT、到功能类的MR,再到代谢类的PET,直至现如今的微观层面的分子、蛋白质、甚至是基因,都能够实现“可视化”。
从1895年德国物理学家威廉·伦琴(Wilhelm Conrad Rontgen)发现一种特殊射线(即我们俗称的X光)以来,医学成像技术进入了崭新的篇章,发展至今天,除了X光以外,还有诸多成像技术,并发展出了多种影像技术应用。主要有:
1. X光片(Radiography)。也就是我们常常体检时候做的“胸透”或“胸片”。
2. CT(Computerized Tomography,即电脑断层扫描)。这是一种结合X光成像技术与电脑处理技术的诊断工具。通过对一定间隔的每一个断层进行X光成像,后期利用重建技术可以实现对人体三维立体成像。
3. US(Ultrasound,即超声)。超声波属于一种声波,也是一种机械波(人类耳朵可听到的声波频率介于20~20,000 Hz之间,因此频率大于20,000 Hz的声波称为“超音波”(ultrasound),而频率小于20Hz的声波,则称为次声波(infrasound))。学过简单物理知识的大致了解波在不同介质中传输会发生反射和折射,超声成像正式利用检测技术来检测高能超声波穿透人体不同组织时所返回的信号来成像的。因此超声图像中在不同组织交界处图像清晰。
4. MRI(Nuclear Magnetic Resonance Imaing,即核磁共振)。是利用核磁共振(nuclear magnetic resonance,简称NMR)原理,依据所释放的能量在物质内部不同结构环境中不同的衰减,通过外加梯度磁场检测所发射出的电磁波,即可得知构成这一物体原子核的位置和种类,据此可以绘制成物体内部的结构图像。——这里都是技术术语比较绕,你可以简单想象成为人体每个组织细胞都是一个小磁针,但是在正常情况下每个磁针的方向是杂乱无序排列的,因此人自身是不带电的。但是当把人体放到一个巨大的磁场中,小磁针就会被磁化然后改变方向而一致排列,此刻通过一些手段让某一平面的小磁针统一改变一下方向并记录这些改变方向的每个小磁针的位置就可以简单的“成像”了。
后续还有PET,即正子发射电脑断层扫描(Positron emission tomography with computerized tomography)、单一光子发射电脑断层扫描(SPECT/CT, Single photon emission computed tomography with computerized tomography)等等。

整个DICOM标准中记载的成像技术(即Modality)有近上百种,详情如下(参考【15】):

医学图像技术与最传统的胶片成像、数字成像在成像原理和流程上基本没有区别,唯一一点需要注意的是所捕获和度量的“光”不同。日常的摄影,无论是胶片还是数字,都是对可见光的成像,即可以简单的理解为对人眼的仿生学。但是真实世界中的光谱远远大于我们肉眼识别范围,(眼见不一定为实,顶多为partial实,^_^)。

在上述表中我们肉眼可以识别的范围是很小很小的一部分(也就是我们日常认为的赤橙黄绿青蓝紫,如下图的彩色渐变条部分),这一部分是人类进化过程中所特殊形成的,具体到每个人身上也会略有不同,而且不同的动物所见的范围也不同(其实除了人类以外,大多数动物的世界都是黑白的)。

因为人眼可见光这个波段的限制,在各种医学成像技术没有出来之前,人类医学只能靠触觉、听觉、视觉(可见光范围)来进行诊断,随着成像技术的进步,人类已经逐步掌握了可见光范围以外的“光”,并能通过后期的成像技术来观察不同的世界。用于医学中的“光”大多处在可见光波段的上方,即频率更高,波长更短,这意味着能量更大,穿透力更强。所以可以透过皮肤看到人体内部的组织结构。这就是医学成像与常规摄影最大的不同之一
接下来我们介绍另一个不同点,这里就要提到几个概念:

3.1 WindowWidth 与WindowCenter

WindowWidth(缩写WW),即窗宽;WindowCenter(缩写WC),即窗位(有时候也会写做WindowLocation,缩写WL)。前文提到过医学成像与日常摄影成像第一个不同点是因为成像光谱的波段不同,都是“非可见光”。所以用这些光去度量人体组织时会生成超出人眼睛可以识别的度量级别(当然这里跟是否是可见光没有本质关系,可见光如果划分的灰度级较多,只要超过255个,人眼也是无法分辨的,例如我们像现在的级数为16、32的时,人眼正确识别率分别约为68.75%、45.31%),那么就需要通过一个“范围调整”来逐个部分逐个部分的观察——你可以想象一下一个长度为100m的绳子你用1m的尺子去衡量,只能分段测量。如下图所示:

设备成像的数据灰度级范围如图中最上方灰度渐变条所示,最大值为1000,最小值为-1000,总共约2000个灰度级。而人的肉眼只能观察0~255,256个灰度级(如图下方小的灰度条所示)。现在我们来做一下基本的解方程计算,图中有1、2、3三次窗宽和窗位的调整。
第一次,窗宽是400~500,总共101个灰度。我们把这101个灰度映射到人肉眼可见的0~255上,大致计算如下:

WW=500400+1=101,WL=400+5004002=450 令 W W = 500 − 400 + 1 = 101 , W L = 400 + 500 − 400 2 = 450
Output=f(x)=0255100x1020255,x<400,400<=x<=500,x>500 O u t p u t 人 眼 = f ( x ) = 0 , 当 x < 400 255 100 x − 1020 , 当 400 <= x <= 500 255 , 当 x > 500

第二次,窗宽是0~255,总共256个灰度。大致计算如下:

WW=2550+1=256,WL=0+25502128 令 W W = 255 − 0 + 1 = 256 , W L = 0 + 255 − 0 2 ≈ 128
Output=f(x)=0x255,x<0,0<=x<=255,x>255 O u t p u t 人 眼 = f ( x ) = 0 , 当 x < 0 x , 当 0 <= x <= 255 255 , 当 x > 255

(c)2006-2024 SYSTEM All Rights Reserved IT常识