logo资料库

计算机视觉 (马颂德, 张正友, 1998).pdf

第1页 / 共276页
第2页 / 共276页
第3页 / 共276页
第4页 / 共276页
第5页 / 共276页
第6页 / 共276页
第7页 / 共276页
第8页 / 共276页
资料共276页,剩余部分请下载后查看
第 一 章 绪 论 人类通过视觉感知外界信息• 俗话说“ 百闻不如一见” ,就是说视觉感知环境信息的效 率很髙• 人类感知外界信息,80%以上是通过视觉得到的. 让计算机或机器人具有视觉,是 人类多年以来的梦想. 虽 然 ,目前我们还不能让计算机也具有像生物那样高效、灵活的视 觉 ,但这种希望正在逐步实现. 人类是通过眼睛与大脑来获取、处理与理解视觉信息的.周围环境中的物体在可见光 的照射下,在人眼的视网膜上形成图像,由感光细胞转换成神经脉冲信号,经神经纤维传 人大脑皮层进行处理与理解. 视觉 ,不仅指对光信号的感受,它包括了对视觉信息的获取、 传输、处理、存储与理解的全过程. 信号处理理论与计算机出现以后,人们试图用摄像机获 取环境图像并将其转换成数字信号,用计算机实现对视觉信息处理的全过程,这样 ,就形 成了一门新兴的学科—— 计算机视觉. 计算机视觉的研究目标是使计算机具有通过二维图像认知三维环境信息的能力.这 种能力将不仅使机器能感知三维环境中物体的几何信息,包括它的形状、位置、姿态、运动 等 ,而且能对它们进行描述、存储、识别与理解. 计算机视觉发展得益于神经生理学、心理 学与认知科学对动物视觉系统的研究,但计算机视觉已发展起一套独立的计算理论与算 法,它并不刻意去“ 仿真” 生物视觉系统,其原因有三: ( 1 ) 几十年来,虽然神经生理学、心理学与认知科学对生物视觉系统从解剖学、电生 理过程与信息处理等不同角度进行了大量卓越的研究,但对视觉认知过程的认识还远远 不够 ,尤其是对大脑皮层中高层次视觉信息处理的认识还是十分肤浅的. ( 2 ) 研 究 表 明 ,大脑神经细胞构成了一个极其复杂的,巨大的互连网络,这种神经网 络在体系结构上与当前计算机体系结构有很大的差别. 虽然,近年来人工神经网络的研究 得到很大的重视(即用计算机或专用芯片去局部仿真神经网络),但这种仿真也只能是近 似的、局部的,要实现大量人工神经元的互连网络在技术上目前还是很困难的. 另外,不少 计算机视觉工作者认为,只要从信息转换的角度真正理解了视觉信息处理过程并发展出 一套信息处理的计算理论,用哪种体系结构去实现它是无关_ 要的.本书要讲述的内容就 是多年来计算机视觉工作者对实现各种视觉功能发展出的」 整套计算理论与算法.近年 来对神经网络的研究表明,其中许多算法既可以用通用的串行的计算机体系结构实现,也 可以用神经网络实现. ( 3 ) 在许多工业应用场合,视觉系统要观察的环境常常比较简单. 60 年代第一次做 的计算机视觉系统的实验[Roberts 1965],环境被限制在所谓“ 积木世界” ,即周围的物体 都是由多面体组成的,需要识别的物体可以用简单的点、直线、平面的组合表示•计算机视 觉的研究工作就是从对这些简单的物体识别与定位开始的. 另一方面,用计算机视觉的方 法还可以处理与识别更广泛的图像,例如遥感图像、医学图像等,这些图像的处理和识别 与一般摄像机的图像有较大的不同,处理与识别的方法也不同•
2 第 一 章 绪 论 为了从整体上理解计算机视觉系统的体系结构,我们先从信息处理的角度分析人的 视觉系统结构. 1 . 1 . 1 生物视觉通路 1. 1 生物视觉通路简介 图 1. 1 为视通路示意图.物体在可见光的照射下经眼的光学系统在眼底视网膜上形 成物像,视网膜上的感光细胞又将视网膜上接收的光能转换成神经冲动,经过视交叉部分 地交换神经纤维后,形成视束,传到中枢神经系统部分,包括丘脑的外膝体(lateral genic­ ulate nucleus , 简称 L G N ),上 丘 (superior colliculus)和 视 皮 层 (visual cortex) . 上丘只与 眼动等视觉反射有关,外膝体和视皮层直接与视知觉有关. F l . i 视通路示意图 关于眼、外膝体与视皮层的解剖学结构,光化学与电生理作用以及它们在视觉信息 处理中的基本作用的详细描述可参阅视觉生理学的有关书籍,如阮迪云、寿天德编著的神 经 生 理 学 [Ruan 1992].由视通路可以看到,眼 、外膝体与视皮层构成了对视觉信息处理 的三个基本层次. 进一步的分析表明,外膝体与视皮层,尤其是视皮层还有更为复杂的分 块 分 层 结 构 ,分块表明了视觉信息处理的并行性质,不同区域的神经细胞具有不同的功 能 ;分层表明了视觉信息处理的串行性质. 因此 ,生物视觉系统是一个串行与并行处理相 结合的复杂系统. 1 . 1 . 2 感受野的分层等级假设 视通路上各层次的神经细胞,由简单到复杂,它们所处理的信息,分别对应于视网膜 上的一个局部区域,层次越深人,该区域就越大,这就是著名的感受野(receptive field) 与 感受野等级假设,感受野是支持视觉信息分层串行处理的最重要的生理学证据. 以信息处理的第一级为例,视网膜上的神经节细胞(gauglion cell,以下简称GC) 将感 光细胞上接收到的光信号转换成电信号再由它的轴突传出,但 每 一 个 G C 细胞只能接收 视网膜上一个局部区域的信号,该 区域就是G C 的感受野,研究表明,G C 感受野及其对光 信号的转换作用可划分为以下几种: ( 1 ) 对空间亮度变化敏感的感受野,形状可用两个同心圆表示. 如 图 1. 2 所示,这种
1 . 1 生物视觉通路简介 3 同心圆形状的感受野按其对光信号的转换作用又可以分为中心兴奋区、周边抑制区组成 的 on-中心型以及中心抑制区、周边 兴 奋 区 组 成 的 o ff-中心型. 图中还画出了这两种感受 野对光信号的响应曲线(图中只画出了沿同心圆直径方向上一个截面上的响应曲线),该 曲线近似于两个方差不同的高斯函数的差. 具 有 这 种 感 受 野 的 G C 细胞对于在同心圆区 域上受到均匀光照的光刺激的反应,为响应曲线的积分 ,一 般 讲 ,G C 的输出为响应曲线 与光信号乘积的积分. 图 1. 3 表示当视网膜上光信号为一边亮一边暗的具有一定对比度 的信号时,感 受 野 位于不同 空间 位置的G C 的输出,只有当亮暗边缘线过同心圆中心时, G C 的输出与感受野受到均匀光照时一样,设 为 £ ,而当边缘线位于同心圆其他位置时, 输出分别髙于或低于该平均输出 E 、如将输出看作实际输出减去平均输出£:,则当亮暗边 缘线过感受野同心圆中心时,输出为零• 可 见 ,由 G C 的输出与感受野的位置可以检测亮 暗边缘线,这是本书第三章将要介绍的边缘抽取的生物学基础. 图 1.2 on-中 心 型 与 off-中 心 型 感 受 野 图 1 . 3 不 同 位 置 感 受 野 的 G C 细 胞 对 具 有 黑 白 对 比 度 的 光 信 号 的 响 应 ( 2 ) 除具有上述响应特征及感受野的G C 细胞外(这 种 G C 细胞也称为 x 型细胞),还 有 一 种 j 型 细胞,它的响应不对亮度的空间变化敏感,而是对时间变化敏感,即当感受野
4 第 一 章 绪 论 圆形区域内的亮度随时间变化时,G C 输出会增大或减少^ 细胞 也 可 划 分 为 o n 型 或 off 型. 这种对局部亮度随时间变化敏感的性质是物体运动分析的基础. 以上介绍的是视网膜G C 细胞的感受野,这是视觉信息处理第一层次的感受野.对于 更 高层次,包括外膝体细胞与初级视皮层(即视皮层的前几层),也发现了类似的性质,即 每一个单个细胞只接受视网膜上的局部信息,但层次越高感受野越大,即信息处理是从局 部到更大的区域的. 例如外膝体上的一个细胞,可以接受来自空间感受野相邻的多个GC 细胞的信息,由于每个G C 细胞有一个感受野,多 个 G C 细胞的感受野就组成了一个更大 的区域,而且该区域也具有同心圆的形状.这种感受野从局部到整体的层次结构就是著名 的感受野层次等级假设[H ubd 1979] . 这种假设一直到初级视皮层还可得到神经生理学 与认知心理学的实验证据(对实验证据的解释仍有争论),但这种假设到底能走多远,即进 人更高层次以后,甚至到最后层次,是否有一个最复杂的神经细胞,它的感受野已大到图 像上的某一个大区域,由该细胞来负责全部该区域信息的综合,最后达到识别该区域上物 体的目的,这一点(它被称为祖母细胞假设)尚有很大的争论. 1 . 1 . 3 视觉信息处理的多通道、多任务并行处理性质 感受野的等级假设与局部性质主要支持视觉信息处理的自下而上的分层次串行处理 性质. 但视觉系统的任务不是单一的,它要识别物体的形状与颜色,要得到三维物体的深 度信息,要检测物体的方位与运动参数. 另 外,物体的空间与时间频率性质也有很大差异, 例如较细的表面纹理表现了物体表面较高的空间频率特征;较快的运动,表现为图像较高 的时间频率特征. 神经生理学的研究表明,视通路的各个层次上存在着基本互相独立的并 行通道,分别完成不同的视觉任务,下面我们简要介绍几个不同的并行通道. (1) x , y 通道 在介绍视网膜神经节细胞(G C 细胞)的感受野性质时曾提到G C 的 感 受 野 有 之 分 ,进 一 步 分 析 表 明 ,更 深 层 次 的 细 胞 的 感 受 野 也 有 之 分 ,即某一层次的神经细胞 ( 例如外膝体的神经细胞)只接受来自x ( 或 3;) 型 的 G C 细胞的信号,使 它 也 具 有 夂 或 _y) 型的感受野. 由 于 7 ,^ 型感受野的不同,t 通道传递高空间分辨率的,时间上变化慢速的 信息与颜色信息,而 y 型通道传递低空间分辨率的,高时间变化频率的信息• (2) 空间与时间频率通道 虽 然 :r ,y 型细胞分别对具有空间频率或时间频率的信息敏感,心理物理实验证明, 外膝体上的某一个神经细胞并不对所有频率的信息敏感,而是对某一频段的信息呈现较 强的反应,在视觉皮层也发现了类似的证据,即皮层的某一部分只对某一定频率的信号敏 感. 这些实验证据表明,在视通路中存在处理不同频道的信号的独立通道. (3) 颜色信息通道 首先在视网膜上就存在不同的光感受细胞,即锥状细胞与杆状细胞,其中杆状细胞对 颜色不敏感,而锥状细胞又分为对不同光谱(红 、绿 、蓝 )敏感的三种细胞,对外膝体与视觉 皮 层 1 7 区的分析也表明,它们都有专门的区域从事颜色信息的处理与识别. (4) 左右眼信息通道与立体视觉 由 图 1. 1 的视觉信息通道简图中可见,眼 睛 ,外膝体与视皮层都有左右二侧.分析表
1.2 M a n •的计算视觉理论框架 5 明,左右两侧的神经细胞分别处理由左右两眼的半侧来的信息,也就是说,每一个眼睛的 左右侧视野的信息是交叉地分别投射到左右侧外膝体与视皮层的.视皮层处理来自两眼 的信息得到双眼视差信息(详见第五章)是立体视觉的基础,也就是说,只有比较来自双眼 的信息,才能使我们有深度感,最近的研究表明,直 到 视 皮 层 的 17,18,1 9 区,还存在独立 处理不同视差的并行通道. (5) 空间方位信息通道 早期对视觉通路信息处理的研究认为,视皮层细胞对空间几何元素(如直线)的方位 敏 感 ,阮迪云[Ruan 1992]等对外膝体细胞的研究表明,这种方位敏感性也存在于外膝体 细胞,即具有相似最优方位敏感的细胞在外膝体层次已经聚集在一起.可见在视皮层处理 之前,外膝体已经对方位信息进行了组织,在视觉通路中存在着处理方位信息的通道. ( 6 ) 视皮层对形状、颜色、运动与深度信息的并行处理 对 视 皮 层 17至更髙层次的研究表明,对物体的形状、颜 色 、运动、深度等不同视觉信 息处理已明显分离开,对视皮层不同区域分别处理什么信息已有大量的研究,最近发展的 功 能 核 磁 共 振 (FM R I) 与高分辨率脑地形图为分析视皮层各部分的功能提供了技术手 段. 以上介绍表明,视觉信息处理是一个串行与并行相结合的复杂信息处理过程,目前搞 清的仅仅是极小的一部分. 而 且 ,从信息处理的角度看,对大多数处理单元我们仅仅知道 非常浅的知识,即只知道这个单元对某种信息“ 敏感” ,而信息是如何表征的,如何变换的, 则仍不清楚,尤其是较髙层信息的处理. 关于串行与并行处理进入高级皮层后,信息是如 何综合的,更是很有争论的问题. 还有一些认知心理实验,观察到与上述有些论述完全不 相容的现象,例如陈霖发现[Chen 1982,1989] ,人对大范围拓扑特征感知早于对局部几 何特性的感知,并认为这种现象是对当前的视觉计算理论不相容的. 总 之 ,对生物视觉系 统的认识还很初步,计算机视觉工作者从这些初步的研究结果出发,试图独立建立视觉信 息处理各个阶段或各种功能的数学模型,本书中介绍的内容就是20多年来的有关研究成 果,其中有些信息处理方法可能与生物视觉系统类似,也有一些可能完全不同. 1.2 M an: 的计算视觉理论框架 80 年代初,Mar r [M arr 1982]首次从信息处理的角度综合了图像处理、心理物理学、 神经生理学及临床精神病学的研究成果,提出了第一个较为完善的视觉系统框架,这一框 架虽然在细节甚至在主导思想方面尚存在大量不完备的方面,许多方面还有许多争议,但 至今仍是广大计算机视觉工作者接受的基本框架. 计算机视觉这门学科的形成,应该说与 这一理论框架有密切的关系•下面我们从几个方面来描述这一理论框架. 1 . 2 . 1 视觉系统研究的三个层次 M a rr从信息处理系统的角度出发,认为对此系统的研究应分为三个层次 ,即计算理 论层次、表达(representation)与算法层次、硬件实现层次. 计算理论层次要回答系统各个部分的计算目的与计算策略,亦即各部分的输入输出
6 第 一 章 绪 论 是 什么,之间的关系是什么变换或具有什么约束.M a rr对视觉系统的总的输入输出关系 规定了 一个总的目标,即输人是二维图像,输出是 由 二 维 图 像 “ 重建” (reconstruction) 出 来的三维物体的位置与形状.M a rr认 为 ,视觉系统的任务是对环境中三维物体进行识别、 定位与运动分析,但这仅仅是一种对视觉行为(behavior)的目的性定义,而不是从计算理 论层次上的目的性定义. 三维物体千差万别,应存在一种计算层次上的一般性目的描述, 达到了这一“ 目的” ,则不 管是什么具体的物体,视觉任务均可完成.M a rr认 为 ,这一“ 目 的” ,就是要通过视觉系统,重建三维物体的形状、位 置 ,而 且 ,如在每一时刻,都能做到这 一 点 ,则运动分析也可以做到. 对视觉系统的各个层次与模块,M a rr也初步给出了计算理 论层次上的目标(详见下一节). 对于表达与算法层次,视觉系统的研究应给出各部分(或称各模块)的输人、输出和内 部的信息表达,以及实现计算理论所规定的目标的算法,算法与表达有关,不同的表达方 式 ,完成同一计算的算法会不同,但 M a rr认 为 ,算法与表达是比计算理论低一层次的问 题 ,不同的表达与算法,在计算理论层次上可以是相同的. 最后一个硬件层次,是要回答“ 如何用硬件实现以上算法 区分以上三个不同层次,对于深刻理解计算机视觉与生物视觉系统以及它们的关系 都 是 有 益 的 ,例如我们在本章开始时就指出,人的视觉系统与目前的计算机视觉系统在 “ 硬件实现” 层次上是完全不同的,前者是极为复杂的神经网络,而后者是目前使用的计算 机 ,但它们可能在计算理论层次上完成相同的功能. 本书的全部内容都是在前两个层次上,即计算理论,表达与算法层次. 应该指出,目前 计算机视觉的研究工作也主要在这两个层次上. 对 于硬件实现,目前只有比较成熟的部 分 ,如低层次处理中的去噪声,边缘抽取;对简单二维物体识别及简单场景下的视觉方法, 已有专用芯片或其他并行处理体系结构方面的研究与试验产品;从系统上构造一般的视 觉系统,虽有一些尝试,但一般并不成功. 1 . 2 . 2 视觉信息处理的三个阶段 M a rr从视觉计算理论出发,将系统分为自下而上的三个阶段,即视觉信息从最初的 原始数据(二维图像数据)到最终对三维环境的表达经历了三个阶段的处理•第一阶段构 成所谓“ 要素图” 或“ 基元图’’(primary sketch),基元图由二维图像中的边缘点、直线段、曲 线、顶 点 、纹理等基本几何元素或特征组成;第 二 阶 段 ,M an*称 为 对 环 境 的 2. 5 维 描 述 , 2. 5维 描述是一种形象的说法,意即部分的、不完整的三维信息描述,用“ 计算” 的语言来 讲 ,就是重建三维物体在观察者为中心的坐标系下的三维形状与位置.当人眼或摄像机观 察周围环境物体时,观察者对三维物体最初是以自身的坐标系来描述的,另 外 ,我们只能 观察到物体的一部分(另一部分是物体的背面或被其他物体遮挡的部分). 这 样 ,重建的结 果是以观察者坐标系下描述的部分三维物体形状,称 为 2 .5 维描述. 这一阶段中存在许多 并行的相对独立的模块,如立体视觉、运动分析、由灰度恢复表面形状等不同处理单元,本 书的许多章节都涉及到这一阶段. 2. 5 维描述是不够的,事 实 上 ,从各种不同角度去观察 物 体 ,观察到的形状都是不完整的,不能设想,人脑中存有同一物体从所有可能的观察角 度看到的物体形象,以用来与所谓的物体的2. 5 维描述进行匹配与比较,因此 ,2. 5 维描
1 . 3 本书各章内容简介 述必须进一步处理以得到物体的完整三维描述,而且必须是物体本身某一固定坐标系下 的描述,这一阶段称为第三阶段,即三维阶段. 以上前两个阶段,宥些文献称为视觉的低层次处理,或 早 期 视 觉 ,也有人将第一阶段 称为早期视觉,第二阶段称为中期视觉. 1 . 3 本书各章内容简介 本书主要内容为三维计算机视觉,两维图像的特征检测为三维视觉的第一步,在许多 图像处理的专著中已有全面的介绍,本书不作详细论述•但三维视觉的许多方法都是由二 维图像的点、线等边缘特征出发的,因此在本书第二章介绍了边缘检测方法,其中有些方 法可在图像处理的专著[Gonzalez 1987,Rosenfeld 1982,Wang 1 9 9 5 ]中找到,但有些方 法 ,尤其是边缘检测的快速算法与最优边缘检测方法,只是在近年的文献中才能看到.计 算机视觉所涉及的数学知识较多,如随机过程、最优化方法、射影几何等,由于国内工科大 学一般不讲射影几何,第三章介绍了射影几何的一些常用结论,一般不给证明,有关射影 几何的进一步知识,读者可参阅[Semple 1949] ,这一章还介绍了以后各章中常用的各种 几何元素的数学表达方法.本书介绍的大多数内容都是由图像定量恢复三维物体形状的 方 法 ,要做到这一点,首先需要对摄像机定标,以得到摄像机的内外参数,或 者 说 ,对摄像 机建模并求取模型参数.本书第四章讲述各种摄像机模型与适用于不同任务的摄像机定 标方法• 第五章介绍立体视觉方法,即用双摄像机得到的图像(称为立体图对)恢复三维物 体深度信息的方法,其中射影几何意义下的重建是近几年来提出来的方法,读者如缺乏射 影几何的知识,可以不读这一节. 第六至第十章为运动分析,即由序列图像估计三维物体 运动参数与形状的方法. 除了第六章运动与不确定性描述为运动分析问题的数学基础外, 第七至第十章介绍了三种运动分析的方法. 运动分析方法可分为两类,即由图像灰度变化 求取运动参数 的光流法 ,与由特征几何元素对应求取运动参数的方法,第七章介绍光流 法 ,第八章介绍由序列图像特征几何元素及运动模型跟踪特征几何元素的方法,特征跟踪 可给出特征几何元素的对应,是由特征几何元素求取运动参数的方法的基础,第九章与第 十章分别介绍由两维或三维特征几何元素的对应求取物体运动参数与形状的方法.第十 一章介绍直接由图像灰度或颜色恢复物体三维形状的方法,图像灰度或颜色与物体表面 反射光的强度和光谱有关,由几何光学理论可得到物体表面反射光强度及光谱与物体形 状的关系,但反射光强度还与光源方向、强度、光源光谱及物体材料性质有关,为了由图像 灰度或颜色恢复物体三维形状需要多幅图像信息或利用物体表面形状的连续性假设,该 章介绍了由多个点光源分别照射同一物体得到多幅图像以恢复物体形状的光度立体视觉 方 法 ,及由单幅图像与物体表面形状的连续性假设恢复三维物体形状的方法. 在恢复(或 称重建) 物体形状后,为了识别物体,需要预先建立物体的模型,第十二章介绍一些常用的 建模方法与识别方法. 应该指出,建模与识别属视觉高层处理,对生物视觉系统的信息高 层 处理,目前还远远缺乏深入的理解,计算机视觉中提出的建模方法与识别方法也都是针 对比较简单的物体的.本书第十三章介绍的距离图像获取与处理是计算机视觉的特有方 法 ,以前各章介绍的方法与生物视觉系统都是由两维图像出发的,由两维图像出发恢复三
8 第 一 章 绪 论 维物体形状,计算复杂性很高,当今技术的发展使我们有可能开发直接得到物体三维深度 信息的传感器,该章介绍了多种用于计算机视觉的深度传感器(range finder) 或称距离传 感器. 由于用这种传感器可以直接得到物体表面密集点的三维信息,从而大大简化了视觉 系统的低层处理. 因此,虽然这种传感器的成本较高,使用场合也有一定限制,但基于这种 传感器的视觉系统已有较广的工业应用• 本书最后一章讨论了计算机视觉的系统体系结 构与发展前景,针对计算机视觉系统在理论上与实际应用中存在的问题,给出了改善计算 机视觉系统在体系结构上应考虑的10个方向. 目前,研究者们提出了大量的视觉计算方法,许多方法似乎在计算理论层次上很相 似 ,但在计算机实现时在计算复杂性或抗噪声能力上却相差甚远. 计算机视觉界普遍认 为,视觉计算方法在提出时,必须有严格的实验验证,并与其他方法比较.本书附录给出 了一些实验数据的软盘及说明,有条件的读者可由这些数据检验本书给出的算法,或验证 自己提出的算法. 1 . 4 计算机视觉的现状与阅读本书需注意的问题 8 0 年代至今,研究者们按照M a rr所提出的基本理论框架,对以上所述的各个研究层 次与视觉系统的各个阶段中的各种功能模块,进行了大量的研究. 现 在 ,国际上以计算机 视觉为主题,或主要以计算机视觉为主题的国际会议有国际计算机视觉会议(ICCV) ,国 际模式识别会议(IC PR ),国际计算机视觉与模式识别会议(CVPR) ,欧洲计算机视觉会 议 (ECCV)与亚洲计算机视觉会议(ACCV) . 以计算机视觉为主要内容之一的国际刊物 也 有 很 多 ,如 International Journal of Computer Vision, IEEE Trans, on P A M I,IEEE Trans, on Robotics and Automation, IEEE Trans, on Image Processing, CVGIPCCom- puter Vision, Graphics and Image Processing), Visual Image Computing, IJPRAI (In­ ternational Journal of Pattern Recognition and Artificial Intelligence),Pattern Recogni- tic n 等 ,一些相关的会议与刊物就更多了,每年的研究论文不下数千篇,发表的不下数百 篇. 大体上讲,对计算机视觉系统的各个部分,研究者们都在计算理论、表达与算法及硬件 实现等各层次上提出了大量的方法. 但总 的来讲,这些方法都存在这样或那样的问题,或 缺乏通用性,或抗噪声能力低,或存在多解性,其原因可归纳如下: 计算机视觉的问题是一个逆问题(inverse problem) ,输人的图像为二维图像的灰度, 它是三维物体几何特征、光照、物体材料表面性质、物体的颜色、摄像机参数等许多因素的 函数,由灰度反推以上各种参数是逆问题. 这些问题往往是非线性的,问题的解不具有唯 一 性 ,而且对噪声或离散化引起的误差极其敏感• 另一个原因是M a rr的视觉系统框架是 一个自下而上的、模块化的、单向的、数据驱动型的结构. 神经生理学的深入研究表明,这 种结构与人的视觉系统还有很大差距. 虽然对这种差别目前还缺乏深入的理解,但显然人 的视觉系统上下各层次之间、各功能模块之间存在着更为复杂的互相作用• 更重要的是, 由眼动等现象可知,生物视觉系统的认知过程是一种复杂的与外界交互作用的主动性过 程 ,Gibson [Gibson 1979]曾指出,感 知 是 一 种 行 动 (action)而不仅仅是一种被动式的反 应(response).近年来提出的有目的的,主动式视觉或者基于模型的视觉都在这一方面突
分享到:
收藏