计算机视觉的任务及目前研究
计算机视觉的任务及目前研究
的现状的现状
A personal view
A personal view
胡占义
中国科学院自动化研究所
计算机视觉的任务
计算机视觉的任务
中心任务就是对图象进行理解
– 对单幅图象的理解
– 对多幅图象的理解
– 对视频图象的理解
21世纪,是对video图象进行理
解的世纪
Marr计算计算视觉理论
视觉理论
Marr
Marr计算视觉理论有二个核心论点:
1:人类视觉的主体是重构可见表面的几何
形状;
2:人类视觉的重构过程是可以通过计算的
方式完成的。
Marr计算计算视觉理论
视觉理论
Marr
三个层次
计算理论
表达与算法
算法实现
三个步骤
Primitives
2.5 D
3D
视觉理论的三个层次
视觉理论的三个层次
计算理论
计算的目的是什么?为什么它是合适的?
它是依据什么决策实施的?
表达与算法
计算的输入与输出采取什么表达形式?
计算理论如何完成?
硬件实现
表达与算法如何物理实现?
算法的三个步骤
算法的三个步骤
图像
3D物体识别
物体种
类形状
位置的
描述
Zero-crossing
Raw primal sketch
Full primal sketch
立体视觉
运动分析
轮廓分析
光照分析
12
2
D
表达
人类立体视觉模块
人类立体视觉模块
尽管人们对Marr计算视觉理论提出了这
样那样的质疑和批评,但Marr计算视觉
仍然是计算机视觉的主流理论。
也许Marr的“视觉主体为对可见表面的重
构”假设是错误的,但人类的立体视觉通
道是最主要的通道之一。
人类视觉通道
人类视觉通道