读 W. J. T. Mitchell 之《图像学》
Posted 知则
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了读 W. J. T. Mitchell 之《图像学》相关的知识,希望对你有一定的参考价值。
W. J. T. Mitchell, 陈永国. 图像学. ISBN: 978-7-301-31142-4
当初买这本书的时候是看这本书叫“图像学”以为是讲图形图像处理基础理论的。买下之后才发现是讲哲学的。其中涉及的很多术语我都没见过,所以这本书实际上没看懂。但钱都花了,就硬着头皮读了下来。
虽然这本书是讲哲学的,但由于好歹涉及“图像”所以多少还是有一些关于图像的内容。所以,可以说这本书和图像处理的主题有一些关系,但又没什么直接关系。这些若有若无的关系就是这本书中也讨论了图像的性质和意义等话题。让人惊异的是,一些哲学家似乎并没有图像处理的背景,但凭借哲学化的分析,竟然得出了一些令人折服的洞见。例如书中提到的贡布里希对图像轮廓的分析:
常常有人说轮廓是一种习俗,因为我们环境中的物体不受线条的束缚……然而,把轮廓看作习俗的传统观点是以一种过分简化为基础的。我们环境中的物体,实际上清楚地与其环境相脱离,至少当我们一开始运动时它们就脱离了。轮廓就相当于这种经验。(出自:Gombrich, "Image and Code: Scope and Limits of Conventionalism in Pictorial Representation", in Image and Code.)
对于这个观点,我想不少做自然图像分割的人都会认同。有时候真是不得不感叹,搞哲学的这帮人到底咋想出来的。
当然了,这本书虽然涉及一点图像处理的话题,却并不以图像处理为主要论述对象。其主线其实是图像和语言的对立。书中把视觉的,直观的,二维的,空间的,感性的,绘画的图像和听觉的,抽象的,一维的,时间的,理性的,诗歌的语言对立起来,讨论二者的性质和关联。对于这个宏大的话题,由于我实在是不懂所以也没法做啥评价。不过书中把语言和听觉关联显然还是受表音语言的影响太深。实际上一门语言也可以借助非听觉的形式,甚至借助图像的形式而存在。所以把语言与听觉绑定似乎不够本质。可能把语言与理性思维、逻辑思维关联更加合理。因为一方面纯粹的语言不一定得是声音的,而是来自思维的;另一方面,声音虽然看不见,但它本身其实也是一种“形象”。
最后分享一个读这本书时看到的一个对图像处理很有启发的点。在图像处理领域,图形学解决的是从语言到形象的问题,图像学解决的是从形象到语言的问题。做这两方面研究的时候,人们总是不经意间默认图像和语言之间存在可转换性。这本书中提到了这样一种疑问:难道图像和语言之间真的能做完美的转化么?虽然理论上基于贝塞尔曲线的图形学方程可以无限近似任何一种自然场景下的图像。但同样的信息以方程的形式给出和以图像的形式给出,对于观者来说真的一样么?
对于一个没有经过图形图像处理训练的人来说,仅凭直觉判断,他的回答或许是“不一样”。因为方程和曲线图形看起来就不同。但对于完整学习了信息论、概率论、信号处理、数字图像处理、图形学等知识的人来说,他的回答却可能是“一样”。因为曲线方程和曲线图形这两种形式蕴含的信息量是完全相同的。对于这些受过训练而回答“一样”的人来说,他们或许忽略了一个至关重要的点——接受曲线方程或曲线图像信息的是人。人的大脑处理语言和图像时所使用的可能是完全不同的机制。输入等价但处理机制完全不同,可能最终的结果就是输出也不同。
因而,将图像还原为语言或者将语言渲染为图像或许是一种行得通的方法,但却不一定是一种完全的方法。有一些观察图像时的感觉经验,可能是无法通过主观转化变成语言标签的。对于看图做标签的人来说,除了“猫”,“狗”这类可以语言化的感觉经验外,还有相当一部分感觉经验是难以言表的。既然这些经验无法通过观测者本身转化为语言标签,那么就无法构建数据集进行训练。一种可能的解决方案是通过第三者观测那个观测图像的人的状态,把其客观表现作为标签。
求点赞,求收藏,求分享
欢迎关注我的公众号,微信搜索:知则
以上是关于读 W. J. T. Mitchell 之《图像学》的主要内容,如果未能解决你的问题,请参考以下文章
系统设计论文总结之:Butler W. Lampson. Hints for computer system design
c_cpp Arduino的微弱之处 - 改编自T. NAKAGAWA的代码