我们的大脑,究竟是怎么建立稳定视觉世界的?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了我们的大脑,究竟是怎么建立稳定视觉世界的?相关的知识,希望对你有一定的参考价值。

看” 似乎是一个简单的过程,只要睁开眼睛我们就能看到周围的世界。睁开眼睛你可以看到川流不息的人海,你可以看到五彩斑斓的花朵,你可以看见车水马龙的大街。一切都是那么自然,不过你有没有思考过“看” 是怎么完成的呢?我们是怎么能够把景色净收眼底的呢?心理学家和认知神经科学家们其实在这个领域耕耘无数载,“看”的科学被他们称之为视觉研究。

一切心理过程都有着神经科学的表现。当我们的眼睛上视网膜(retina)接收到光线时候,它会把看到的光线转化为电信号,通过神经元之间的信息传递,往大脑皮层而去。经过对外侧膝状体(LGN)的中继,视觉信息达到了大脑皮层。首先接收信息的就是初级视觉皮层(V1),它会分析所看见物体的大小,方向,边缘等信息。之后,视觉信息会被个个大脑区域逐步分析,比如下颞叶皮层(IT)会分析看到的东西是什么,而中颞区皮层(MT)会分析所看到东西的运动和位置信息。最终,我们的大脑会汇总看到的一切,解读出我们眼前的事物。按照神经科学以及人工智能的巨擎 David Marr所言:“视觉正是信息处理过程”,我们在 “看” 世界的时候,就是视觉信息在视觉处理脑区内被逐步分析解读的过程。


    

图 1、这张图是我们视觉系统的简化图。其结构已经非常复杂。

研究眼底的视网膜正是研究视觉过程的“窗户”。视觉起始于眼睛底部的视网膜。在视网膜上有视杆和视锥两类光感受器,他们对于不同波长的光线敏感程度不同,于是我们能看到五彩斑斓的景象。事实的确如此,不过视网膜只不过是视觉的起点。光线会汇聚在眼睛底部的视网膜区域。在这里,我们有两类光感受器:视杆细胞(柱状)以及视锥细胞(椎状)。有趣的是,视杆和视锥细胞其实分布在视网膜的最后。它们接收到光线之后,会把这部分能量转化为电信号向前面的神经节细胞传递。是不是有点像叶绿体把光转化为能量?让我们反思下戴维·马尔的洞察,视觉神经系统的每一层都是在做信息处理,比如光感受器就是把光信号转化为生物电信号。虽然整个视觉系统每一层的信号转换,以及方式方法不同,不过在抽象的角度看,他们都在做类似的事情。

之所以感受光线的神经元在排布在视网膜最后,有一个很不错的解释。因为光线的传递过程中,眼内各种半透明的结构都会导致光线的反射、折射、和衍射。越多曾半透明结构,更大可能导致成像模糊。而光感受器在最后几层可以有效地减少各类光学干扰。不过当然,排在光感受器前面的神经节细胞等神经元也会影响到光的接受。

    

视网膜上成像最清晰的地方就是中央凹(foveal)了。在这里,只有视锥细胞。而且在视锥细胞之前没有任何神经元影响成像。因此光学干扰被压低到最小。但是为什么只有视锥细胞没有视杆细胞呢?这就是视网膜的有趣之处:视锥细胞接收到的的清晰度更高。虽然每个眼球内视网膜上的光感受器有一亿多个,不过只有六百万个是视锥细胞,其余是视杆细胞。视锥细胞对于亮光敏感,也对色彩敏感。我们看到的世界大多数是视锥细胞为我们提供的。视锥细胞大多出现在中央凹。它们基本与参与中继的神经节细胞一一对应,保证传递信息的精确。但是视杆细胞往往在中央凹之外,他们的成像也不够清晰,上百个视杆细胞才会与一个神经节细胞对应,这样能保证信息强度足够大(毕竟在模糊的情况下,传递的信息也是很模糊,通过这样的“举手表决”可以加强信息的强度)。

之所以我们能看到颜色,还得归功于视锥细胞。科学家把视锥细胞分为三类,根据他们所敏感的光线波长分为S(短波),M(中波),和L(长波)三种。下图就是这三类细胞对于不同波长光的敏感程度。可见光正是一个光谱带,短波更加蓝,因此S型视锥细胞对于蓝色的光线更敏感。不过色彩知觉可远比这个复杂,还得涉及到细胞感受野的拮抗理论,还有视觉皮层的一些工作方式。学海无涯,哪怕简单的视觉也是如此复杂。

视网膜接收到的信息会通过视神经向大脑皮层传去。我们的左右半脑其实处理的都是对侧的信息。在这里我得要给大家普及下更加正确的说法:在不同半脑的初级感觉皮层(视觉,听觉,触觉),的确是更倾向于接收对侧的信息,但是同侧信息也有;而在高级处理皮层就对双侧信息都加以处理。用更科学的术语来说,我们看下右眼,它能接收颞侧信息(在这里就是右边,靠近太阳穴的那一侧的信息),也可以接收鼻侧信息(用右眼看鼻子是不是能看到左侧的信息?)。这两类信息会在视交叉做一个交叉。总归左边的信息输到右侧大脑,反之亦然。经过传递与预处理,视网膜上的信息最终会抵达初级视觉皮层。也就是大脑的最后端枕叶区域。从这里开始,大脑正式开始对视网膜接收到的信息进行处理。


首先接收到信息的就是初级视觉皮层(V1)。在这里的神经元可以从视网膜提供的信号中恢复出颜色信息,方向信息,以及边缘信息。按照伦敦大学学院的李兆平教授的观点,初级视觉皮层提供了一张‘看’到的特征图。不过初级视觉皮层,顾名思义,它的处理还是很初级的。在它之后的V2皮层会对于初级视觉皮层的信息进行线性与非线性转置(根据Freeman团队与2013年在《自然》杂志上的研究成果),从而恢复出更为复杂的信息:材质信息。再之后,视觉信息兵分两路。其中关于运动,位置,方向的信息更多地向中颞叶皮层(MT)而去以抵达顶叶;这被称为背侧通路(图上绿色部分)。而分析视觉信息的内容(比如这是什么汽车,这是什么树)会被传递到v4皮层最终抵达下颞叶皮层(IT);被称为腹侧通路(图上紫色部分)。

    

背侧通路和腹侧通路的划分假说,得要说到著名科学家Leslie Ungerleider。她通过摧毁猕猴的部分脑区的方法发现了两个通路的功能不同。在腹侧受损之后,猕猴没法判断两个图案是否一致;但是在背侧受损之后,猕猴就不能判断某个特别的图案是在左边还是右边。

在腹侧和背侧通路上,视觉的处理就非常的复杂了。倘若在初级视觉皮层,神经元的处理可以用数学公式来描述的话,在腹侧通路上的下颞叶皮层的活动对于我们来说还是无法用数学模型表达

。这种数学描述就是所谓的计算视觉:像物理学一样,用数学模型来解释复杂的处理过程。所以,在上世纪六、七十年代时候,当以Hubel和Wiesel两位诺奖得主为代表生理学家摸清楚初级视觉皮层的功能时候,计算机学界的科学家以及用电脑模拟人脑指日可待。但是我们到现在还没有能力彻底地描述腹侧通路,可以说前路漫漫。

视觉已经是神经科学中探索最为广泛与深刻的一部分,但它依旧迷雾重重。哪怕是聪明的科学家们都没有办法避免科研道路上的挑战。在2017年,视觉科学协会(Vision

Science Society)年度大会上,来自明尼苏达大学的Kendrick Kay教授提到他的研究取向:“不要用我们自己的视觉系统来研究人类的视觉系统。” 简单说来,“看”这件事情太过轻松和简单,会让我们有时候低估了视觉的复杂性。

参考技术A 我们的大脑中是有很多个视觉神经连接到眼球,而眼球通过视觉传播,再从视觉神经传递给大脑,最后就有了我们所看到的画面。 参考技术B 我们的大脑究竟是怎样建立视觉世界的?这个我们的大脑首先要根据眼睛首先根据我们的视觉看到外面收的学校以及色彩以及它的三维成像所决定的 参考技术C 现实世界的物体在光反射后从眼睛进入后反馈到大脑形成影像,经过长期进化,人的大脑慢慢的有了可以辨别物体的能力,通过基因遗传给后代,形成稳定的视觉世界。 参考技术D 我们的大脑建立起稳定视觉世界是由于视觉神经很稳定,而且眼睛收到的画面能投射在视觉神经。

特征究竟是什么

特征究竟是什么

神经网络中的权值是什么

神经网络的结构又是什么

机器学习的模型是什么

参数是什么

这一切都是现实世界在算法中的倒影

机器学习的根本就是要找到这个倒影

我们用模型去映射这个现实世界

好像以前做牙齿矫正 要做一个石膏模型 用一个石膏放在嘴里,然后取出来就可以做出牙齿的模型

机器学习也是如此,我们用一个模型(石膏)去做成牙齿的形状,牙齿就是他的数据,牙齿的形状就是参数。

如果模型不好 比如用木头就不适合模仿牙齿 这个系统就不能很好的拟合牙齿的形状,然后我们需要放到口中含一会儿 也就是训练这个模型 训练时间要不长不短 太短了 不能取出牙齿的形状

太长了 石膏就凝固了 就会过拟合

以上是关于我们的大脑,究竟是怎么建立稳定视觉世界的?的主要内容,如果未能解决你的问题,请参考以下文章

jitter究竟是怎么产生的?

国际赛事“收割机”再战权威 :PaddlePaddle 助力百度大脑视觉团队获MOT榜单第一

技术分享:人脸识别究竟是如何完成的?

特征究竟是什么

《计算机视觉》第1期

对“机器视觉”的一点思考