logo资料库

zxing源码分析——QR码部分.docx

第1页 / 共7页
第2页 / 共7页
第3页 / 共7页
第4页 / 共7页
第5页 / 共7页
第6页 / 共7页
第7页 / 共7页
资料共7页,全文预览结束
Java 代码结构: zxing 源码的结构还是比较清晰的,有关 QR 码的代码主要在以下几个 package 中。Java 代码中有生成 QR 码的代码,在 C++代码中是没有生成部分, 只有解析部分。 其中 qrcode 中是编解码的接口,外部代码通过这两个类来进行 QR 码的编 解码。 detector 是用来在摄像头抓取的图像中检测出 QR 码的那部分,并将其提取 出来。这部分代码是解码的关键,也是可以进行优化的部分。 decoder 是按照 QR 码的编码规范将之前 detector 中提取出的 QR 码符号进 行解码操作,将图像解析为真实的信息。 QR 码解码流程:
1、将图像进行二值化处理,1、0 代表黑、白。 2、寻找定位符、校正符,然后将原图像中符号码部分取出。(detector 代码实 现的功能) 3、对符号码矩阵按照编码规范进行解码,得到实际信息(decoder 代码实现的 功能) 二值化: zxing 中条码的二值化都是使用 Binarizer 实现,一维码使用 getBlackRow 方法,二维码的使用 getBlackMatrix 方法。Binarizer 有两个生成类, GlobalHistogramBinarizer 和 HybridBinarizer;这两个类对 getBlackMatrix 方法 的实现有不同,HybridBinarizer 中的实现对于某些条件下的图像有些特殊的处理, 暂时没有看懂,这里只介绍 GlobalHistogramBinarizer 中二值化的方法。
二值化的关键就是定义出黑白的界限,我们的图像已经转化为了灰度图像, 每个点都是由一个灰度值来表示,就需要定义出一个灰度值,大于这个值就为白 (0),低于这个值就为黑(1)。在 GlobalHistogramBinarizer 中,是从图像中 均匀取 5 行(覆盖整个图像高度),每行取中间五分之四作为样本;以灰度值为 X 轴,每个灰度值的像素个数为 Y 轴建立一个直方图,从直方图中取点数最多的 一个灰度值,然后再去给其他的灰度值进行分数计算,按照点数乘以与最多点数 灰度值的距离的平方来进行打分,选分数最高的一个灰度值。接下来在这两个灰 度值中间选取一个区分界限,取的原则是尽量靠近中间并且要点数越少越好。界
限有了以后就容易了,与整幅图像的每个点进行比较,如果灰度值比界限小的就 是黑,在新的矩阵中将该点置 1,其余的就是白,为 0。 提取符号码: 这部分是解码的关键部分,解码能力的高低也主要体现在这里(不过我感觉 二维码本身设计的就比较好,对图像扭曲变形的纠错能力比较高,所以代码部分 对这方面的处理就比较少)。这部分的目标是从像素为单位的原始图像中提取出 符号码部分,并转换为模块为单位的符号码矩阵。 将二值化之后的矩阵交给 Detector,其 detect 方法就是接口方法。调用这个 方法就会返回取好的符号码矩阵。下面详细介绍 detect 方法所做的工作: 1、寻找定位符 寻找定位符是 FinderPatternFinder 这个类来实现的。 在图像中每隔 iSkip 就采样一行, int iSkip = (3 * maxI) / (4 * MAX_MODULES); 在这一行中将连续的相同颜色的像素个数计入数组中,数组长度为 5 位,即去找 黑\白\黑\白\黑的图像(如开始检测到黑色计入数组[0],直到检测到白色之前都 将数组[0]的值+1;检测到白色了就开始在数组[1]中计数,以此类推)。填满 5 位后检测这 5 位中像素个数是否比例为 1:1:3:1:1(可以有 50%的误差范围), 如果满足条件就说明找到了定位符的大概位置,将这个图像交给 handlePossibleCenter 方法去找到定位符的中心点,方法是先从垂直方向检测是 否满足定位符的条件,如满足就定出 Y 轴的中心点坐标值,然后用这个坐标值
去再次检测水平方向是否满足定位符条件,如满足就定出 X 轴的中心点坐标值。 至此就找到了一个定位符的中心坐标。 按照上面所说的步骤找出所有三个定位符的中心坐标,接下来开始定位三个 定位符在符号中的位置,即左上(B 点)、左下(A 点)、右上(C 点)三个位 置。先通过两两之间的距离定出哪个是左上那一点(左上那点到其他两点的距离 应该相差不远),然后通过计算 BA、BC 向量的叉乘定出 A 和 C 两点。 2、寻找校正符 通过 ABC 三点的坐标计算出校正符的可能位置,然后交给 AlignmentPatternFinder 去寻找最靠近右下角的那个校正符,寻找方法与寻找定 位符的方法基本相同,如果找到就返回校正符的中心坐标,如果没有找到也没关 系,解码程序可以继续。 3、透视转换,生成最终矩阵 找到了三个定位点和一个校正符的坐标(校正符没有找到可以用一个计算值 来代替),符号图像的位置就已经确定了,现在要进行图像变形,建立起以模块 为单位的符号矩阵与原图像之间的关系,使用的方法是 George Wolberg 写的 Digital Image Warping 一书中 PerspectiveTransform 方法(书中 54-56 页)。 转换关系确立了就将新矩阵(以模块为单位的符号矩阵)中每一个点对应到原图 像中的点,去看该点是黑是白,并将 0、1 置填充到矩阵中。这样就生成了最终 的符号码。
解码 QR 符号码: 有了符号码矩阵就按照QR 码的编码规范去进行解码。这部分功能是 Decode 类实现的。 先获取版本信息,然后获取到格式信息,从格式信息中取得纠错等级。然后 去读码字,读码字的方法很简单,从右下角开始,两列为单位,从最后一行开始, 先向上读,读到顶端再向下,这样依次读完整个图像(详细参见 QR 码编码规范
ISO16022-2006)。然后将所有码字还原回 block,进行 RS 纠错,然后形成一 个二进制流交给 DecodedBitStreamParser 解析成真实的信息。 至此,解码过程结束
分享到:
收藏