第十章 特征空间
10.0 引言
10.1 特征提取
10.2 特征选择
10.0 引言
模式识别中把每个对象都量化为一组特
征来描述,构建特征空间是所有模式识
别问题的第一步
通过直接测量得到的特征称为原始特征
比如人体的各种生理指标(描述其健康状况)
数字图象中的每点灰度值(以描述图像内容)
10.0 引言
原始特征数量可能很大,不利于学习。
比如 1024*768的灰度图像,256灰度级。
直接表示,每幅需要786,432 bytes。进行训
练识别所需空间、时间、计算量都无法承受!
很少的样本分布会在如此高维的特征空间中
显得十分稀疏,因而产生过学习的现象。
特征空间有很大的冗余。完全可以用很小的
空间相当好地近似表示图像,这一点与压缩
的思想类似。
10.0 引言
如何提取特征与具体问题有很大关系,
特征是对象的表达,根据知识来考虑
特征的稳定性
特征的可分性
例:
白细胞的浓度
指纹的细节特征
指纹细节特征
10.0 引言
模式识别中处理特征空间的方法可分为两类:
特征提取(Feature Extraction):用映射(或变换)
的方法把原始特征变换为新特征,称为特征提取
傅立叶变换
小波变换
PCA变换
ICA变换
Gabor变换
。。。
10.0 引言
特征选择(Feature Selection):从原始特征中
挑选出一些最有代表性、可分性能最好的特
征来,称为特征选择
10.1 特征提取