logo资料库

手写数字识别算法的实现和对比研究.doc

第1页 / 共32页
第2页 / 共32页
第3页 / 共32页
第4页 / 共32页
第5页 / 共32页
第6页 / 共32页
第7页 / 共32页
第8页 / 共32页
资料共32页,剩余部分请下载后查看
摘要
Abstract
第一章 引言
1.1问题来源
1.2研究意义
1.3近年的国内外研究情况
1.4基本思路
1.4.1 基于概率统计的方法
1.4.2 最短距离模版匹配
1.4.3 用矩来描述图像
第二章 研究理论基础
2.1 基于概率统计模式识别的理论概述
2.2 矩对图像的描述理论概述
2.2.1 几何矩
2.2.2 Zernike 矩
第三章 手写数字识别具体实现
3.1 提取字符轮廓并数值化
3.2 基于概率统计的识别方法
3.3 最短距离模版匹配算法
3.4基于矩特征值的图象分类
3.4.1 Zernike矩
3.4.2 几何矩
第四章 实验结果与分析
4.1 实验结果
4.2 结果分析
第五章 总结与展望
参考文献:
致谢
附录 1
论文题目: 手写数字识别算法的实现和对比研究 学 院: 专业年级: 学 号: 姓 名: 指导教师、职称: 2012 年 5 月 18 日
Implementation and Comparison of the Handwritten Numeral Recognition Algorithm College: Specialty and Grade: Number: Name: Advisor: Submitted Time: May 18, 2012
目录 摘要 ........................................................................ I Abstract ................................................................... II 第一章 引言 ................................................................ 1 1.1 问题来源 .............................................................. 1 1.2 研究意义 .............................................................. 1 1.3 近年的国内外研究情况 .................................................. 1 1.4 基本思路 .............................................................. 2 1.4.1 基于概率统计的方法 .............................................. 2 1.4.2 最短距离模版匹配 ................................................ 2 1.4.3 用矩来描述图像 .................................................. 3 第二章 研究理论基础 ........................................................ 4 2.1 基于概率统计模式识别的理论概述 ....................................... 4 2.2 矩对图像的描述理论概述 ............................................... 4 2.2.1 几何矩 .......................................................... 5 2.2.2 Zernike 矩 ...................................................... 6 第三章 手写数字识别具体实现 ................................................ 8 3.1 提取字符轮廓并数值化 ................................................. 8 3.2 基于概率统计的识别方法 ............................................... 9 3.3 最短距离模版匹配算法 ................................................ 10 3.4 基于矩特征值的图象分类 ............................................... 11 3.4.1 Zernike 矩 ..................................................... 11 3.4.2 几何矩 ......................................................... 12 第四章 实验结果与分析 ..................................................... 14 4.1 实验结果 ............................................................ 14 4.2 结果分析 ............................................................ 15 第五章 总结与展望 .......................................................... 16 参考文献: ................................................................. 17 致谢 ....................................................................... 18 附录 1 ..................................................................... 19
摘要 自从计算机问世以来,让机器具有模式识别的能力一直是计算机科学家们的努力方向。 研究表明,对视觉和听觉信息的处理过程不仅仅是一个感知过程,也是一个认知过程[5]。 因此,研究模式识别,是理解人类智能本质的重要途径。字符识别是一个传统和经典的模 式识别问题,手写数字识别是一个经典的模式识别问题。手写体数字具有不同字符字型相 差不大、相同字符有多种不同写法、数字没有上下文关系等特点。 在本文中,讲述如何实现手写数字和小写字母的识别。分别运用贝叶斯公式[2]、最短 距离模版匹配、几何矩和 Zernike 矩对手写数字的识别。 关键词:模式识别;手写数字识别;贝叶斯;概率统计;Zernike 矩;几何矩 I
Abstract As the computer technology develops, giving these machine has the ability of pattern recognization is what the computer scientist make effort on. As research shows, the process of dealling vision or voice information is not only a process of perception but also a process of percevie. Therefore, studying pattern recognition is an important way in understanding the mankind’s intelligence and ability.Character recognition is a traditional and typical pattern recognition problem, and Handwritten Numeral Recognition is a typical large vocabulary pattern recognition problem. Different characters do not vary much, the same character can be written in many ways, there is no context between characters, and so on. In this paper, we will study on the realization of these algorithm of Handwritten digits and lower case letters recognition by using Probability Statistics method, Minimum Distance Template Matching, Geometric moments and Zernike Moments. Keywords: Handwritten digit Recognition; Bayes; Probability; Zernike moment; Geometric moment II
福建农林大学本科毕业论文 第一章 引言 1.1 问题来源 模式识别[1],就是通过计算机用数学技术方法来研究模式的自动处理和判读。我们把 环境与客体统称为“模式”。随着计算机技术的发展,人类有可能研究复杂的信息处理过 程。信息处理过程的一个重要形式是生命体对环境及客体的识别。字符识别是模式识别领 域中一个非常活跃的分支。这一方面是由于问题本身的难度使之成为一个极具挑战性的课 题。另一方面,是因为字符识别不是一项孤立的运用技术,其中包括了模式识别领域中其 他分支都会遇到的一些最基本的和共性的问题。也正是由于字符识别技术的飞速发展,才 促使模式识别和图像分析成为一个成熟的科学领域。 1.2 研究意义 手写体数字识别的研究有很大的使用价值,例如在邮政编码、税务报表等需要处理大 量字符信息录入的场合,如果能由机器自动实现这些字符的识别,对这些数据的处理,这 将促进这一事业的进展。 手写数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值: 1、 阿拉伯数字是唯一的被世界各国通用的符号,对手写数字识别的研究基本上和文化 背景无关,这样就为各国、各地区的研究工作者提供了一个施展才智的舞台。在这个领 域大家可以探讨、比较各种研究方法。 2、由于数字识别的类别数较小,有助于做深入分析及验证一些新的理论。 3、尽管人们对手写数字的识别已从事了很长时间的研究并已取得很多的成果,但到目前 为止机器的识别能力还无法与人的识别能力相比,这仍是一个有难度的开放问题。 4、手写数字的识别方法很容易推广到其他一些相关问题,比如在此基础上对英文字母的 识别。在此,我就把研究的方法推广到了小写英文字母的识别上。 1.3 近年的国内外研究情况 (1)1929年G.Tauschek发明阅读机,能够阅读0-9的数字。[1] (2)30年代Fisher提出统计分类理论,奠定了统计模式识别的基础。因此在20世纪 60-70年代,统计模式识别发展很快,被识别的模式越来越复杂,特征越来越多,就 出现了维数灾难,但由于计算机运算技术的迅猛发展,这个问题得到一定的克服,统 计模式识别仍是模式识别的主要理论。[1] (3)50年代Noam Chemsky提出形式语言理论,美籍华人付京孙提出句法模式识别。[1] (4) 60年代L.A.Zadeh提出了模糊集理论。模糊模式识别理论得到了比较广泛的应 1
用。[1] 福建农林大学本科毕业论文 (5)80年代Hopfield提出神经元网络模型理论。近些年人工神经元网络在模式识别 和人工智能上得到较为广泛的应用。[1] (6)90年代小样本学习理论。支持向量机也受到了很大的重视。[1] 1.4 基本思路 对手写数字的识别有许多种方法,比如基于概率统计的识别方法[2]、模版最短距离匹 配[2]、基于几何矩[8]、Zernike 矩[8]对图像的描述和神经网络识别法[5]等等。在本文我使用 了基于贝叶斯公式[6]的概率统计法、最短距离模版匹配、图像几何矩和 Zernike 矩特征提 取的识别方法。 1.4.1 基于概率统计的方法 对样品方格化,每个格子用一个数值表示该格子内黑色像素所占的比例,记为 sample[];然后把人 sample[]数组二值化,就是把 sample[i]分为 sample[i]>PRECISION 的一类和 sample[i] PRECISION 的概率 P[i][j];取 (1.4.1) (1.4.2) 其中,当前待分类样品 current[j] > PRECISION 时 P’[i][j] = P[i][j],否则 P’[i][j]=1-P[i][j]。 那 么 PXw[i] 将 某 种 程 度 上 体 现 了 当 前 图 像 和 数 字 i 样 品 的 接 近 程 度 。 取 PwX[i]=Pw[i]*PXw[i]/PX,那么 PwX[i] 可以表示当前样本所属 i 类的概率。取最大的 PwX[i],那么理论上当前图片应该分类到 i 类中。 2、对于当前的待定字符,取 PA[i] 表示出现数字 i 的概率、sample[j]>PRECISION 的概率 PB[j],以及但数字 i 出现时 j 特征值大于 PRECISION 的概率 PAB[i][j]。对于单 个特征点可以得出一个当前待定字符所属各类别的后验概率 PBA[j][i],取总和最大的那 个所在类为最终识别结果。 1.4.2 最短距离模版匹配 对图片方格化后,取当前待分类图片和样品库中所有样品的距离。这里的距离是每个 特征之差得绝对值。也就是计算 如果两个模版越吻合那 dis 将会越小,反之也成立。我们取使得 dis 最小的那个样本所在的 分类。 (1.4.3) 2
1.4.3 用矩来描述图像 福建农林大学本科毕业论文 用矩[8]来描述个图像像素点的分部,矩是一个数值,比如 n 阶 m 重 Zernike 矩[7]Znm,如 果 m 不等于 0,那将是一个虚数,我们取其摸即可。然后把当前待识别图像和库中所有样 品的矩做比较,取最接近那个。为了减少冗余数据,可以先进行细化[10]字符后在做矩的特 征提取。 3
分享到:
收藏