电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

二维识别算法范文

来源:文库作者:开心麻花2025-11-191

二维识别算法范文(精选7篇)

二维识别算法 第1篇

1 二维图像的概述

二维图像指的是在同一个平面中用点和线拼画出的一幅图像, 其具有平面性, 比如三角形、长方形等图形。二维图像与三维图像相比少了立体感, 但是可以更直观地表示出图像的表面特征。本章节对二维图像的特征进行了详细的介绍, 接着又对二维图像的研究意义方面进行分析, 最后对二维图像的应用范围进行了描述[1]。

1.1 二维图像的特征

现在大众的观点认为二维图像中物体的亮度、角点、梯度、边缘和轮廓线等是最为基础的特征信息;还包括一些经过特殊处理的特征信息, 例如像对称性、旋转不变性、经过多种变换后产生的新特征;由于这些特征信息的数量和种类过于大量化, 研究者常常要根据不同的情况来选择不同的特征[2]。研究工作中使用的二维图像就是图像中最具有特征性的部分, 这些具有特征性的部位就可以用来作为识别点。就像世界上没有两张完全相同的叶子, 也没有完全相同的二维图像, 正是因为每张二维图像都有自己的特征, 所以就可以根据这些特征来识别不同的事物。

1.2 二维图像研究的发展历程

人类认识世界的方式就是用自己的方式去理解这个世界, 当人类用自己的视觉观察世界, 就会有意或无意地用自己的方式来记录自己观察到的世界, 这样最原始的图像就出现了。最开始的记录内容可能有非常浓厚的艺术目的, 常常用带有浓重的原始宗教或图腾崇拜色彩来表示一件事物。随着科学知识的不断进步, 人们对世界的认识越来越深刻, 其记录方式往往会越来越简单, 简简单单的几笔, 就能勾画出一幅完整的画面, 这样的画面具有线条简洁、突出重点等特征。对现在的二维图像的研究而言, 研究学者追求的就是用最简单的结构来突出事物的独有特征, 以达到后期的识别目的。

1.3 二维图像的意义和应用范围

二维图像具有特征性是二维图像拥有相关高级应用的基础, 对于二维图像的研究有着非常广泛的应用。

提高机器的识别能力要根据二维图像的表示方法来改进, 可以对机器进行设置让其“看到”相应的二维图像。

在现代化农业生产中, 对农作物和动物进行编号和拍照可以用于对农作物的生产和畜牧动物养殖的高科技管理。拍到的图像就是一个二维图像, 代表着植株或动物的特征表达, 这样就可以对作物和动物的生长过程进行管理。

二维图像在医学中的应用相当频繁。医学的二维图像的数据量非常大, 比如CT或MIR等, 医生借助二维图像在计算机的帮助下完成初步的分析和诊断, 以获得有效的可靠信息。

在军事安全中, 二维图像在嫌疑犯的识别、出入管理、摄像头等方面都有使用。另外在娱乐行业、通讯业这些行业, 二维图像的特征表示也都有非常好的应用。

2 人脸识别算法

最早的人脸识别技术出现在20世纪60年代末, Capon教授[3]在Nature上发表了两篇论文, 其中就对最初的人脸识别技术进行了阐述。当今人脸二维图像库还未完全成型, 不利于人脸特性识别研究成果的共享和评价。本小节内容主要就当前的人脸识别技术作出了讨论分析, 讨论了几个主要人脸识别方法, 最后探讨了人脸识别技术的应用范围。

2.1 人脸识别概述

近几年来, 人脸识别技术在各种应用的推动下已经有非常大的发展了, 现在各个研究机构针对人脸识别技术已经有比较可观的成果了。人脸识别技术与指纹、虹膜、语音等其他人体生物特征相比更加直接、方便。人脸识别在访问控制、身份识别、档案管理、基于二维图像的识别和视频检索等方面有着非常广泛的应用, 现在国内很多机构都已经研制出一套比较好的人脸识别系统和技术方法, 一些成熟的商家机构也将人脸识别技术投入到实际应用。最早期的人脸识别技术就是应用最简单的集合特征识别, 例如像眉毛的弧度、眼中心到眉毛的位置、嘴的厚度、脸宽等特征;发展到现在是基于模板的整体匹配思想, 最近在这些新方法下人脸识别技术有了很大的进步。

2.2 当前的人脸识别技术

本章节主要介绍了现在世界上常用的3种人脸识别方法:基于几何特征的人脸识别方法、基于模板匹配的人脸识别方法和基于弹性图匹配的人脸识别方法[4]。

2.3 基于几何特征的人脸识别算法

基于几何特征下的人脸识别方法是最早的研究方法之一, 现在很多新的技术方法就是在此为基础上发展而来的。对于每个人来说, 人脸的轮廓、大小和各个器官的几何分布位置是不一样的, 几何特征就是提取人脸部特征区域的形状和对应的几何关系为基础来进行人脸识别的。这个方法就是提取眉毛、眼睛、鼻子和嘴巴这些特征点, 计算出这几个特征点的大小以及它们之间的几何关系来进行人脸识别。

2.4 基于模板匹配的识别算法

模板匹配识别方法属于模式识别中的一种较为传统的方法, 这个方法首先是用积分投影的方法确定出面部特征位置, 提取局部的特征的模板, 然后进行模板匹配, 利用计算机计算相应的关系系数, 并进行分类。有研究人员进行了模板匹配识别方法与几何特征识别方法两者的稳定性和优越性的比较试验, 结果显示模板匹配识别方法明显要优于几何特征识别方法。

2.5 基于弹性图匹配的识别算法

弹性图匹配是一种考虑到识别目标局部特点之间拓扑结构的, 具有适应性的局部特征的匹配方法, 基于弹性图匹配下的人脸识别方法的基本思想是动态链接结构。弹性图匹配的理论基础是图匹配, 它用图来描述人的脸部特征, 用图的顶点来表示人脸的局部特征点, 边表示面部特征之间的拓扑连接关系, 测匹配度时要同时考虑顶点和边的距离。

3 二维图像表示的人脸识别算法研究

在本小节中主要介绍了基于二维图像下表示的人脸识别算法的研究。

3.1 二维线性特征子空间特征提取方法主成分分析

Turk在发表的论文中首次提出了将主成分分析法 (2D Principal Component Analysis, 2DPCA) 作为人脸特征提取算法并应用, 并在人脸识别领域取得了较大成功。此后有人将这个算法与二维人脸图像结合来表示一个较长的一维向量形式后来计算协方差矩阵, 由于转换后协方差矩阵的维数过高, 容易超过样本数目, 出现奇异矩阵、运算复杂度高和对计算机硬件要求过高的缺陷, 从而导致人脸图像特征抽取困难。所以, 之后有学者提出了一种直接利用二维图像矩阵计算协方差矩阵的方法, 优点就是能够很好地保持人脸的结构关系, 并可以有效减少计算复杂度;将二维人脸图像矩阵直接映射到子空间, 称之为二维主成分分析法解决以上问题。

3.2 线性判别分析算法

线性判别分析算法 (2D Linear Discriminant Analysis, LDA, 2DLDA) 是人脸识别中重要的特征提取方法, 从一维加权LDA算法发展到二维形式技术, 完善了一维形式的不足之处。线性判别分析算法就是利用平衡子空间的类间距的方法, 提出一种新的能够克服当前不足之处的算法, 这样的算法理解起来更加直观, 应用起来更加简便;线性判别分析算法还具有收敛性, 在类间距差别较大时应用有很好的效果。有学者对线性判别分析算法的结果进行了检测, 结果表明此算法是可行的、有效的。

3.3 局部保距投影

局部保距投影 (2D Locality Preserving Projections, 2DLPP) 能够在子空间很好地保持人脸基本流行结构, 经常应用于人脸识别技术中, 随着科技的发展, 二维局部保距投影已经成为一种新的人脸识别技术中重要的特征提取方法[2]。局部保距投影方法可以很好地消除二维图像的部分冗余信息和噪音;在特征提取方面可以有很好的表现;并且它具有降维功能, 在一定程度上减少了很大一部分工作量, 显著地降低了计算的复杂程度。在多个人脸数据库中的人脸识别实验结果显示在频域中使用二维局部保距投影的识别率要明显高于其他的技术的识别率。

4 结语

本文主要对传统人脸识别算法的不足进行了分析, 然后指出基于二维图像表示的人脸识别算法的进步之处, 弥补了传统算法的不足, 但仍然指出二维算法仍有需要改进的地方。比如提高准确性以达到局部与整体的有效结合、满足实时要求等, 这些都是有待解决的问题。

参考文献

[1]路翀.基于二维图像表示的人脸识别算法研究[D].大连:大连理工大学, 2012.

[2]张正.直接基于二维图像表示的人脸识别技术研究[D].哈尔滨:哈尔滨工业大学, 2006.

[3]刘党辉, 沈兰荪.人脸识别研究进展[J].电路与系统学报, 2004 (1) :85-94.

二维识别算法 第2篇

近年来, 随着人脸识别技术的发展和研究的深入, 提出了很多成熟的识别算法, 如基于人工神经网络算法、基于模板匹配的算法、基于隐马尔科夫模型的算法等, 各种算法都有各自的优缺点。目前, 人脸识别方法正朝整体识别和部件分析相结合的趋势发展。多种算法结合是目前人脸识别领域最受关注的方法, 其优势在于综合利用了人脸面部的各种特征信息, 将各种成熟算法的优势相结合, 与单一算法相比, 大大提高了人脸识别的效率和准确率。

人脸识别的两个重要部分是特征提取和特征分类识别。本文采用二维主成分分析方法进行特征的提取, 充分利用其特征提取能力强的特点, 再利用神经网络进行特征分类和识别, 充分利用其分类能力强的特点, 将二者相结合来提高识别率。但是神经网络需要大量的样本进行训练, 一张11292的图像就超过万维, 如果直接送入神经网络进行识别会消耗大量计算时间, 因此在特征识别前对图像进行预处理和特征提取, 将提取的特征量送入神经网络进行分类识别, 这大大降低了计算量, 提高了识别的效率和准确率。

1 图像预处理

人脸图像存在多种影响识别效果的因素: (1) 采集环境光照; (2) 采集设备噪声; (3) 图像背景、服饰、发型; (4) 图像高维度。在识别前, 需要对图像进行预处理。

1.1 图像归一化处理

归一化处理包括图像几何归一化和图像灰度归一化。

图像几何归一化可以将采集的不同尺寸图像统一为同一尺寸, 去除姿态、服饰、环境背景的影响, 使人脸图像关键特征保持清晰一致。几何归一化主要包括图像旋转、图形缩放、图像剪切等, 实例如图1所示。图像的平面旋转可以在一定程度上将不同姿态的图像姿势调整一致, 旋转后图像的两眼连线保持水平, 获得图像的正面人脸。图像剪切可以降低图像的维度, 同时可以在一定程度上克服服饰、发型和背景的影响。

灰度归一化对图像进行灰度调整, 调整图像的对比度, 扩展图像的动态范围, 使图像的灰度分布在较大的范围内, 也可以去除一定的环境光照影响。直方图均衡化是常用的灰度归一化方法, 该方法简单有效。例如图1剪切后图像的直方图分布如图2所示, 直方图均衡化后直方图分布如图3所示。均衡化前图像灰度分布在一个较小范围, 均衡化后图像灰度范围变大, 各个灰度级像素出现的比例接近, 分布概率更接近, 此时的图像包含的信息量最大, 冗余信息最少, 更易于识别。

1.2 小波变换

小波变换可以降低图像维度, 去除冗余信息, 降低图像噪声, 具有良好的多尺度特征表征能力, 因此在图像处理中应用广泛。小波变换是基于多层次函数的数学工具, 在时域和频域都具有良好的局部化特性, 而且变换速度更快。

Daubechies紧支撑小波是由世界著名小波分析学者Inrid Daubechies构造的小波函数, 其对应的尺度函数核小波函数分别为:

φ (t) =2n=02Ν-1hφ (n) φ (2t-n) (1)

ϕ (t) =2n=02Ν-1hϕ (n) φ (2t-n) (2)

其中, hφhϕ是展开系数, 分别成为R度和小波。Daubechies小波函数具有正交、时频紧支撑、高正规性等优点, 它提供了比Haar小波更有效的分析和设计能力, 本文选用Daubechies小波函数对人脸图像进行变换。

选取db4小波, 经二维小波变换后的图像由一系列的不同分辨率的子图像组成, 图像特征的主要信息保存在低频子图中, 冗余信息和噪声信息一般保存在高频子图中。变换后的低频子图保留了原始图像的主要信息并且维度降低, 以变换后的低频子图作为识别对象, 不但降低了图像的维度, 而且去除了噪声和冗余信息。以图1直方图均衡化后的图像为例, 二层小波变换示意如图4所示, 一层二维小波变换后的图像分解为四个子图, 这四个子图从不同的角度描述了原图的信息, LL是低频子图, 保留了原始图像的大部分特征信息。LH、HL是水平和垂直方向变化子图, HH是高频子图。LH、HL、HH子图包含大部分原始图像的噪声, 因此可以直接去除。二层小波变换与一层小波变换类似, 在一次变换的LL子图上进行。本文采用二层小波变换后的低频子图作为后续特征提取的对象。

2 基于2DPCA的人脸特征提取

二维主成分分析2DPCA (two-dimensional principal component analysis) 是图像特征提取的一个向前图像处理技术, 其直接利用二维图像数据作为分析对象构建协方差矩阵, 计算容易, 特征抽取时间短, 特别适合人脸图像的像特征提取, 2DPCA算法如下:

假设训练样本集合T={A1, , AN}, N为训练样本总数, Ai (i=1, , N) 是mn维图像矩阵, 为训练样本集中的任意一个样本, 则有 (平均样本A¯;图像协方差矩阵G) :

A¯=1Νi=1ΝAi (3)

G=1Νi=1Ν (Ai-A¯) Τ (Ai-A¯) (4)

根据协方差矩阵提取特征的方法如下:

获取最优投影轴:令A (mn) 为给定的人脸图像样本, Xn维列向量, Y为样本图像AX方向的投影后的特征向量 :

Y=AX (5)

为获取最优投影方向X, 定义最优化准则函数:

J (x) =tr (Sx) (6)

其中SxY的协方差矩阵, tr (Sx) 是Sx的迹, 求最优化准则函数的最大值即可得到最优投影方向X

Sx=E (Y-EY) (Y-EY) T

=E[ (A-EA) X][ (A-EA) X]T (7)

tr (Sx) =XT[E (A-EA) T (A-EA) ]X (8)

令样本图像A的协方差矩阵:

G=E[ (A-EA) T (A-EA) ] (9)

可知G为非负定nn矩阵, 由式 (4) 、式 (6) 、式 (8) 、式 (9) 可知:J (x) =XTGX, 其中X是一维列向量, J (x) 取最大值时对应的XG最大特征值对应的特征向量, 称为最优投影轴, 由此得到满足条件① {X1, , Xd}=argmaxJ (X) , d<n;② XiΤXj=0, ij, j=1, , d。前d个较大特征值对应的特征向量X1, , Xd

特征提取 对于给定样本图像A可得:Yk=AXk, k=1, , d, 相应的Y1, , Yd即为样本图像A的主成分向量, 组成了样本图像A的特征矩阵, 完成了样本图像A特征提取。

3 神经网络分类器

3.1 神经网络分类器设计

神经网络由许多并行运算的功能单元组成, 具有很强的容错性和鲁棒性, 可以将其看作是一个函数映射, 是一个多层前馈型网络, 适用于有明确的输入和输出的对应关系。本文采用标准的三层神经网络作为分类器, 结构如图5所示, 包括输入层、隐含层和输出层, 其中输入层有M个节点, 对应提取的人脸特征维数, 隐含层有N个节点, 输出层有L个节点, 对应识别出的人脸类别数, 且N>M>L

输入层到隐含层的激活函数采用Sigmoid函数, 隐含层到输出层的激活函数采用线性函数purelin函数, 可得网络输出与输入的关系如下:

y^k=j=1rvj.f[i=1mωijpi+θj]k=1, , Ν (10)

其中ωij为连接权值, θj为阈值, y^k为网络实际输出, y^为期望输出。

设网络的总误差小于ε, 最小均方函数为误差函数, 可得:

E=1Νk=1Ν[yk-y^k]2ε (11)

3.2 神经网络分类器的训练

设人脸图像有M类, 选取任意人脸图像A的特征向量为网络输入, 设样本图像A为人脸图像的第i类, 目标输出为[0, 00, 1, 00], 即输出层的第i节点输出为1, 其他节点输出为0。将网络权值初始化为 (-1, 1) 之间的随机数, 采用批处理的方式, 有动量的梯度下降训练函数对训练样本进行训练, 当误差函数没有达到设定的最小误差ε时, 转入误差后向传播, 将误差值沿连接通路逐层向后传送。并修正各层的连接权值, 如此循环, 直至达到期望的最小误差值, 完成网络训练。

4 算法流程

(1) 读入人脸图像数据。

(2) 归一化预处理。

(3) 小波变换预处理。

(4) 从预处理过的图像中选取10人的图像, 根据不同的实验方案选取训练样本和测试样本, 分别计算训练样本和测试样本的主成分向量。

(5) 将步 (4) 中得到的训练样本的主成分向量输入神经网络进行训练, 并保存网络。

(6) 将步 (4) 中得到的测试样本的主成分向量输入神经网络进行测试, 根据输出层节点的输出进行分类识别。

5 实验仿真与结果分析

5.1 实验设计

实验人脸样本图像采用英国剑桥大学的ORL人脸数据库, 该数据库由40个人的400张图像组成, 每人10幅不同的图像, 每幅图像为11292像素, 256灰度级, 它们是在不同时间, 光照略有变化, 不同面部表情 (眼睛张开或闭合、笑或不笑) 以及不同脸部细节 (有眼镜或没眼镜) 下获得的。

ORL原始图像的维数为11292, 图像归一化预处理后的图像为8080维, 经过二维二层小波变换后的低频子图像为2020维。实验采用Matlab进行仿真, 共设计了三种实验方案, 其中方案1与方案2的训练集相同, 但方案2的测试集数量有所减少。方案2与方案3的测试集相同, 但方案3的训练集有所增加。利用这三种方案可以检测出训练集变化对识别准确率的影响, 不但可以确定影响本方案识别效果的因素, 还可以比较出本方案与常规方法的识别效果, 具体方案如下:

方案1

训练集 选取10个人的图像, 每人随机选取5幅, 共50幅作为训练集。

测试集1 采用训练集作为测试集。

测试集2 将训练集外的50幅图像作为测试集。

方案2

训练集 选取10个人的图像, 每人随机选取5幅, 共50幅作为训练集。

测试集1 在训练集中选取每人2幅, 共20幅图像作为测试集。

测试集2 在训练集外中选取每人2幅, 共20幅图像作为测试集。

方案3

训练集 选取10个人的图像, 每人随机选取8幅, 共80幅作为训练集。

测试集1 在训练集中选取每人2幅, 共20幅图像作为测试集。

测试集2 在训练集外中选取每人2幅, 共20幅图像作为测试集。

5.2 实验结果分析

采用上述实验方案, 分别使用本方法和只用神经网络的传统方法进行仿真实验, 得到的实验结果如表1所示。由表1可以看出, 在相同的测试集合情况下, 随着训练样本数量的增加, 两种方法的人脸识别准确率都有所提高, 这说明采用神经网络作为分类器的方法, 对训练样本数量是非常敏感的。另外, 本方法的识别率明显高于将原始图像未经2DPCA特征提取, 而是直接输入神经网络进行识别的常规方法, 这说明通过2DPCA方法提取特征, 再送入神经网络进行分类, 可以明显提高人脸识别的准确率, 因此, 证明了本方法的优越性。

6 总 结

本文通过改进神经网络的输入, 采用综合图像预处理方法, 在保留图像基本特征信息的前提下, 去除了图像的冗余信息, 降低了图像的噪声和维度, 从而大大降低了计算量, 提高了计算速度。然后再应用二维主成分分析方法提取人脸特征向量, 作为神经网络的输入, 进行分类与识别, 有效提高了识别准确率, 并缩短了计算时间。但本方法也存在神经网络训练速度慢, 特征提取计算量仍较大, 没有进行最优特征选取和验证的缺点。随着多信息融合技术的发展, 下一步的工作将进行虹膜信息与人脸信息融合算法的研究, 将虹膜特征作为分类器输入的一部分, 选取并验证最优特征, 在进一步提高识别准确率的同时大大降低计算量。

摘要:提出基于神经网络的二维主成分分析人脸识别算法。通过图像的预处理改善了图像的质量, 提高了图像的亮度和对比度, 降低了图像的维度, 然后利用二维主成分分析方法进行人脸关键特征的提取, 并将该特征作为神经网络的输入, 用改进的神经网络作为分类器, 并通过实验证明了算法的有效性和可行性。

关键词:人脸识别,神经网络,二维主成分分析,小波变换

参考文献

[1]Brunell R, Poggio T.Feature recognition:features versus templates[J].IEEE Trans Pattern Analysis and Machine Intelligence, 2008, 15 (10) :1042-1052.

[2]Jian Yang, David Zhang.Two-Dimensional PCA:A New Approach toAppearance-Based Face Representation and Recognition.

[3]曹林, 王东峰, 邹谋炎.基于小波变换和隐马尔可夫模型的人脸识别方法[J].计算机工程与应用, 2005, 41 (7) :18-23.

[4]姜文翰, 周晓飞, 杨静宇.基于小波和最近邻凸包分类器的人脸识别.微计算机信息, 2008, 2 (1) :212-214.

[5]Rafael C Gonzalez, Richar E Woods, Steven LEddins.数字图像处理[M].电子工业出版社, 2005.

[6]徐倩, 邓伟.融合类别信息的二维主成分分析人脸识别算法.计算机工程与设计, 2008, 29 (22) :5792-5794.

二维识别算法 第3篇

关键词:步态识别,步态能量图,二维主成分分析,分块双向二维主成分分析,特征提取

0引言

步态识别是一种根据人行走的姿态方式来达到识别人的身份的生物识别技术。相对于传统的生物识别技术,如声音、指纹、掌纹、虹膜、人脸、签名、DNA等,步态识别做大的特点是可以远距离进行,而不需要被识别者的刻意配合,且能有效地进行识别。作为唯一的远程生物认证技术,步态识别以其非接触性和非侵犯性、不易隐藏和模仿、不易察觉等特点,逐渐受到人们的重视[1]。

步态识别算法通常分为步态轮廓提取、步态特征的抽取和表达,分类和识别对象这三步。其中如何从步态序列中提取有效步态特征是整个算法中的难点,目前的算法主要分为基于模型和基于整体算法这两类。基于模型的算法先对对象建模,然后抽取角度等特征,这种算法对视角的变化的适应性较好,但为准确定位关节点等对步态轮廓图质量要求较高,计算量较大。基于整体的算法直接从人体轮廓中提取步态特征,通常计算速度快,且适用于低质量的步态序列,目前多数研究都属于此类,如文献[2]提出步态能量图表征步态特征,文献[3]以目标轮廓的宽度为提取特征等。主成分分析(PCA)可以将复杂数据降维,由于它简单且无参数限制,在计算机图形学中得到广泛应用。本文提出结合步态能量图和分块双向二维主成分分析的步态识别算法,使用步态能量图能有效地保留步态特征,且将一个周期序列压缩到一张二维图像上,从而减少了运算量,使用分块双向二维主成分分析提取步态特征,可以减小包和衣服变化等的影响,提高识别率,且进一步提高了运算速度。

1轮廓检测和预处理

假设摄像机静止固定,背景图像已知,图像中人体轮廓检测和预处理分为以下几步:

(1) 背景减除及二值化

用中值法提取出序列的背景图像,从序列中差分减除背景,将所获得的图像进行二值化。

(2) 后处理

二值图像中含有噪声点,利用形态学原理去除噪声,提取出最大连通区域作为人体轮廓。

(3) 归一化处理

将所得人体轮廓归一化到统一尺寸。

2特征提取

2.1步态周期检测

正常人的步态具有明显的周期性,一个步态周期如图1所示。通过分析步态序列垂直方向的投影,可以根据宽度变化提取出一个步态周期的序列,如图2所示,其中A点到B点即为一个步态周期。

2.2步态能量图

步态能量图(GEI)[2]定义如下:设 为一个步态序列,共n帧,其中B1,B2,,Bn为已化为向量的图片,则步态能量图为:

Μ=1ni=0nBi (1)

可以看出步态能量图实际为一个周期步态轮廓叠加的均值。步态能量图能反映轮廓的主要形状特性和变化,且能有效减小单个帧中噪声点的影响。能有效地表述步态的静态和动态特征。图1中最后为步态能量图。

2.3 (2D)2PCA简介[4]

(1) 行方向2DPCA

X表示n维线性列向量。2DPCA的思想是将mn的图像矩阵A通过Y=AX的线性变换直接投影到X上,得到m维投影列向量Y,称为图像AX方向上的投影特征向量。

为了确定一个号的投影轴X,引入投影特征向量Y的总体散布或协方差矩阵,通过求其迹的最大值确定最优投影轴。其准则:

J(X)=trace{E[(Y-EY)(Y-EY)T]}

=trace{E[(AX-E(AX))(AX-E(AX))T]}

=trace{XTE[(A-AE)T(A-AE)]X} (2)

定义图像协方差矩阵:G=E[(A-EA)T(A-EA)],它是一个nn维非负定矩阵,利用训练样本可以直接求得。假设有M个训练图像,Ak(k=1,2,,M)表示第k个训练样本图像,且AkRmn,同时定义所有训练样本的均值图像A¯=(1/Μ)k=1ΜAk,则G可表示为:

G=(1/Μ)k=1Μ(Ak-A¯)Τ(Ak-A¯) (3)

这样式(2)可表示为J(X)=XTGX,该准则为广义总体散布准则。使J(X)取最大值的一维列向量X被称为最优投影轴,即矩阵G的最大特征值所对应的特征向量。通常取前d个最大特征值所对应的特征向量X1,X2,,Xd构成的投影矩阵Xopt作为最优值,即Xopt=[X1,X2,,Xd]。

(2) 列方向2DPCA

Ak=[(Ak(1))Τ(Ak(2))Τ(Ak(m))Τ]ΤA¯=[(A¯(1))Τ(A¯(2))Τ(A¯(m))Τ]Τ,其中Ak(i)A¯(i)分别是AkA¯的第i个行向量。则式(3)可重写为:

G=(1/Μ)k=1Μi=1m(Ak(i)-A¯(i))Τ(Ak(i)-A¯(i)) (4)

式(4)表明图像的协方差矩阵G可以通过图像行向量的形式得到。假设训练样本图像均值为零,即A¯=(0)mn。这样可以认为最初的2DPCA是对图像行方向所做的处理。

现在将以2DPCA相同的方式求得图像列方向的协方差矩阵G。令Z表示m维线性列向量,将mn的图像矩阵A投影到Z上,得到一个1n的投影向量BT=ZTA。如式(2),由准则可得到最优投影轴Z:

J(Z)=trace{E[(B-EB)(B-EB)T]}

=trace{E[(ZTA-E(ZTA))(ZA-E(ZTA))T]}

=trace{ZTE[(A-EA)(A-EA)T]Z} (5)

从上式可得到图像列方向的协方差矩阵G为:

G=E[(A-EA)(A-EA)Τ]=(1/Μ)k=1Μ(Ak-A¯)(Ak-A¯)Τ=(1/Μ)k=1Μj=1n(Ak(j)-A¯(j))(Ak(j)-A¯(j))Τ(6)

其中Ak(j)A¯(j)分别表示AkA¯的第j列列向量。相似地,通过计算式(6)的前q个最大特征值对应的特征向量Z1,Z2,,Zq,得到最优投影矩阵Zopt=[Z1,Z2,,Zq]。由于式(6)的特征向量只反映图像每列之间的信息,可以认为这个2DPCA是沿图像列方向进行处理的。

(3) (2D)2PCA

行方向和列方向2DPCA分别对图像的行、列方向进行处理。下面将利用投影矩阵XZ产生(2D)2PCA方法。

设已获得nd维投影矩阵Xmq维投影矩阵Z,将mn维图像A同时向XZ方向投影,产生一个qd维矩阵C=ZTAX为特征矩阵,也称图像重建协方差矩阵。

由此可见,(2D)2PCA方法产生的特征矩阵的维数比2DPCA方法获得的维数少得多。因此与2DPCA相比(2D)2PCA在重建和识别时所用的系数减少了很多。

2.4分块(2D)2PCA

设模式类别有cω1,ω2,,ωc,第i类有ni个样本。A1,A2,,AM(M=∑i=1cni)为所有训练样本图像,每个样本均是mn矩阵。分块(2D)2PCA的思想是先将一个mn的图像矩阵A分成pq块图像矩阵,即:

A=(A11A12A1qA21A22A2qAp1Ap2Apq)

(7)

其中,每个子图像矩阵是m1m2矩阵,pm1=m,qm2=n,然后对所有子图像矩阵施行(2D)2PCA,得到表征步态特征的特征矩阵:

D=(Ζ11ΤA11X11Ζ12ΤA12X12Ζ1qΤA1qX1qΖ21ΤA21X21Ζ22ΤA22X22Ζ2qΤA2qX2qΖp1ΤAp1Xp1Ζp2ΤAp2Xp2ΖpqΤApqXpq)

(8)

由于子图像的规模减少,每个子图像所需的特征矩阵的维数也相应减小。分块(2D)2PCA中当分块为11时,则退化为(2D)2PCA。

由图3可以看出,背包造成的变化主要在右下角,为减少背包和衣服等对识别的影响,在分块的基础上去除了右下角的部分。

3分类

分块(2D)2PCA处理后,每个图像都对应一个特征矩阵。设有n个已知的模式类别,训练样本集为I={A1,A2,,AM},每个样本划分到指定的类ci(i=1,2,,n),对任一测试集Ak,其特征矩阵为Dk,训练样本Aw特征矩阵为Dw(w=1,2,,M),使用欧氏距离度量测试序列与参考序列的匹配相似度,d(Ak,Aw)=‖Dk-Dw‖。使用最近邻分类,对任一测试集Ak,如果d(Ak,Aj)=mind(Ak,Aw),Ajci,则Akci

4实验结果分析

在USF步态数据库[5]上进行了实验,并记录了Rank 1和Rank 5识别率。Rank n是在步态识别中常用的识别率参数,用来表示计算结果中与测试对象最相似的前n个训练对象中包含有真实对象的比率。USF步态数据库包括122 个对象,测试组分别为Probe A~Probe L,包括了这些对象在其他状态下的行走图像序列。本文算法在PC机上Matlab2009b环境实现,在USF步态数据库中12个测试对象组的识别率如表1所示。在实验过程中,还选择了几个步态识别算法与本文算法进行识别率比较。分别是基线算法[5]、MSCT&SST 算法[6] 、MPs算法[7]。其中基线算法作为各种算法性能比照的对象,它以测试序列与训练序列的最大相关作为特征;MSCT&SST 算法结合了动态和静态时空模板;MPs算法将轮廓表示为一维距离向量,然后向四个方向作投影,再使用PCA降维。几种算法的运算时间和计算复杂度见表2。不难看出,本文算法的识别率优于其它算法,分块(2D)2PCA( M(2D)2PCA)在背包和衣着变化时(H,I,J组)的优势更为明显,且有效地减少了特征维数和计算时间。

5结语

本文提出了一种基于分块双向二维主成分分析的步态识别算法,重点研究了步态特征提取,此算法首先将步态能量图分块,去除部分区域后用双向二维主成分分析对各分块提取特征矩阵,提取出来的特征矩阵维数较低且能有效地保留步态图像特征。从在USF数据库上的实验结果来看,此算法对鞋和背包等干扰因素具有很强的鲁棒性,相对于其他算法具有更高的识别率,且由于降低了特征矩阵的维数,算法的运算量大大低于2DPCA和(2D)2PCA。在地面变化时的识别率需要进一步改进。

参考文献

[1] Wang Liang,Tan Tieniu.Automatic gait recognition based on statistical shape analysis[J].IEEE Transactions on Image Processing,2003,12(9):1120-1129.

[2] Han J,Bhanu B.Individual recognition using gait energy image[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2006,28(2):316-322.

[3] Kale A,Sundaresan A,Rajagopalan A N,et al.Identification of humans using gait[J].IEEE Trans on Image Processing,2004,23(9):1163-1173.

[4]Zhang Daoqiang,Zhou Zhihua.(2D)2PCA:Two-directional Tow-dimen-sional PCA for Efficient Face Representation and Recognition[J].Neu-rocomputing,2005,69(1-3):224-231.

[5]Sarkar S,Phillips P J,Liu Z,et al.The human ID gait challenge prob-lem:data sets,performance,and analysis[J].IEEE Transactions onPattern Analysis and Machine Intelligence,2005,27(2):162-177.

[6] Lam T H W,Lee R S T,Zhang D.Human gait recognition by the fusion of motion and static spatio-temporal templates[J].Pattern Recognition,2007,40(9):2563-2573.

二维识别算法 第4篇

二维条码在各领域得到了广泛应用,快速、准确渗透到计算机管理领域的各个角落。这是因为二维条码能脱离数据库及时读取大容量、高可靠性信息,并且对身份进行准确描述,以防止各种证件、卡片及单证的伪造。本文探讨将二维条码PDF417技术运用到身份识别系统中,重点研究了二维条码的识别技术,包括数字图像处理中的图像灰度化、图像二值化、图像倾斜校正、图像边缘检测、条码解码算法技术等。

二维条码在发达国家很多领域都有应用,带来了巨大的经济利益。我国对人员的现代化管理需求日益剧增,需要在身份证件上对管理对象进行精确描述,未来的一段时间内,在身份识别技术上将有很大的发展空间。利用好二维码技术,必能提高生产力,提高工作效率。

本文介绍了二维条码的核心技术,运用图像处理方法和算法,准确识别那些污迹、破损、模糊的二维条码图,在二维条码识别技术上有新的进展。

1 系统分析

PDF417二维条码是一种高密度大容量的便携式数据文件,可实现证卡、报表等数据信息的自动录入、存储、携带,并可用机器自动快速识读。

条码图像预处理在整个系统中起着举足轻重的作用,直接影响着系统的性能指标,是整个系统的核心。条码识读框架如图1所示。

在复杂环境下获得的图像有许多不足,比如模糊、低对比度、高亮度等,只有经过图像的预处理才能正确解码。图像的二值化[6]是图像。

用灰度变换来研究灰度图像f(x,y)的方法称为图像的二值化。二值化处理就是求解阈值T,从而把灰度图像f(x,y)分为特征和背景两个部分。使用阈值是一种区域分割技术,用于物体和背景有较强对比的景物效果很好。它计算简单,能用封闭而连通的边界定义不交叠的区域。

本系统根据条码的结构组成和编码规则设计解码算法,实现PDF417条码图像的识别和解码,识别流程如图2所示。

2 开发平台

系统采用微软公司的Microsoft Visual Studio 2010.NET平台和C#语言。C#(音CSharp)是一种强大的、面向对象的开发语言,是微软专门用于.NET平台的编程语言。在当前的软件开发行业中,C#已经成为绝对的主流语言,可以和Java语言平分天下。C#作为一个全新的编程语言,可以实现大多数程序功能。包括Windows桌面应用程序、Windows服务程序、Web应用程序、WPF应用程序、WPF浏览器应用程序等。

3 系统实现

首先对图像进行灰度化和二值化识别处理,代码写在code类中。当打开条码图像时,把图片存在图片框中。断开与原图像的关联,以便原图像可以进行其它操作,方法名如下:

public Bitmap gray8_click(Bitmap curBitmap)

用加权平均值法对图像灰度处理后(之后是二值化过程),返回一个Bitmap对象复制到curBitmap2中,一般处理后的图片都放在curBitmap2中以便进行对比。

二值化图像时需要使用Otsu方法选取阈值,二值化后的图像同样保存在curBitmap2图像中,其方法名如下:

protected int GetOstuValue(Bitmap bitmap,byte[]bitmapBytes,int stride)//bitmap,求阈值图像,bitmapBytes是求阈值的图像像素信息,stride是求阈值的图像在内存中的扫描宽度,流程如图3所示。

程序设计有两个关键点:(1)图像的旋转过程;(2)图像的噪声去除。在图像旋转时确定角度有一个约定,就是条码有效部分外部不能有明显的直线污染,否则在检测条码边界时将不能检测到有效条码真正的边界,从而造成条码信息的完全错误。在去除噪声时,从中值滤波常用的窗口形状(见图4)可以看出,对类似水平直线的污染可以完全去除,但对垂直的直线污染却无能为力,没有在垂直方向上采用类似的模板窗口再次去除污染,是因为考虑到条码的一个条的宽度为1个像素,如果对单个像素宽度的垂直直线进行去除,就会把有效条码的条删除了。即如果在垂直方向有直线污染,对条码的识别将产生严重影响。

对大量条码图像测试后得知,污染如果是点,或者是类似单个像素的水平直线情况,都能有较高的识别率。但是下列情况将会对条码识别率有较大影响:(1)如果在条码的空白处有类似于直线的污染,将会严重降低条码的识别率,甚至不能对图片进行识别;(2)如果条码中在不是码字列开始的位置有垂直直线污染,将对识别率有严重影响;(3)如果类似水平直线高度的像素值大于1个像素,对条码识别率会有较大影响;(4)如果条码的行高太小,对条码会有很大影响。

实现的关键技术:

(1)图像旋转时角度的确定。利用Hough直线检测算法检测条码图片左边界,得到的左边界有可能是有效条码的上边界(向上偏斜较大角度)、左边界、下边界(向下偏斜较大角度)。因此还需组合各种情况,求出用来旋转时的角度。

(2)图像转换为二值化图像时,阈值的选取有多种方法,如:最大值法、平均值法、加权平均值法、Otsu最大类间方差法。综合分析后采用Otsu方法求阈值。

(3)用中值滤波方法去除噪声时,可以采用多种模板窗口。使用多种窗口比较后,最后采用效果最好的模板窗口,见图4。

(4)为求出条码图像包含有效行数目和每行有效码字列的数目,对图像进行带方向的边缘检测,使检测出的图像更有分析价值。

(5)解码算法的实现过程要根据标志值900、901、902、913、924分多种情况考虑,否则会有遗漏情况,造成解码出来的信息严重失真。

4 结语

本文依据GB/T 17172-1997标准,在VS.NET2010开发环境下用C#语言实现了从条码图像文件到文本信息的解码过程;采用有针对性的图像预处理方法,并充分利用条码图像的特点,达到提高PDF417条码识别率的目的。

首先对条码图像进行识别。识别图像前分析多种方法实现效果,选取一种较好的方法进行图像预处理。图像预处理过程为:图像二值化、条码部分图像旋转至水平、中值滤波去除噪声、水平和垂直方向边缘检测、水平和垂直方向投影、图像二值化,将图像从被识别物体和背景分离,实现图像分割的目的。对二值化后的图像去除噪声可使污染的点和类似水平的直线删除。通过对条码每一行采用垂直投影法,进一步减低噪声干扰,提高识别率。经图像预处理的图像,识别率有较大提高。实验表明,这种有针对性的图像处理方法是可行、有效的。为了进一步提高识别率,采用了相似边距离法,确定一个模块的基本宽度,求取满足这一宽度的模块,进一步提高了识别率。条码解码过程参照公开的算法解码,保证了可靠性和通用性。

摘要:二维条码已经运用到身份识别中。将个人信息和照片编在二维条码中,不但可以实现身份的自动识读,而且可以有效防止伪造和使用假冒证件。探讨了PDF417二维条码的识别与解码算法及在身份识别上的应用。分析了多种图像处理方法,针对条码图片的特点,采取特定的图像处理方法以得到最佳效果。在.Net平台开发环境下,用C#语言首先对各种图像预处理方法进行分析和对比,然后在图像识别时对图片进行预处理。对处理后的图像进行水平边缘检测和垂直边缘检测,得到条码行数和列数,最后依据PDF417公开解码算法进行解码,还原编码的文本信息。

关键词:身份识别,二维条码,图像预处理,解码算法

参考文献

[1]王小科.C#清华程序开发范例宝典[M].北京:人民邮电出版社,2015.

[2]李俊山,李旭辉.数字图像处理[M].北京:清华大学出版社,2013.

[3]李丽萍,周子尧,原坚威.PDF417二维条码的识别及应用[J].数字技术与应用,2014(6):141-145.

二维识别算法 第5篇

国内对于条码技术的研究, 较之国外而言, 相对稍晚一些。但随着国家科学技术的飞速发展, 二维条码技术已经在汽车行业、医学应用、装饰品管理及汇票收费等领域得到了应用;在国外条码技术已经进入系统应用阶段且经验丰富, 在使用方法和技术上, 很大程度地引导了我们二维条码技术的发展方向。目前, 我国二维条码的应用正在蓬勃发展, 许多重要部门和公司已经投入使用, 如铁路部门把条码技术应用于车票验证。

如今二维条形码广泛应用于各种证件系统中, 其中应用最广泛的是PDF417码。本文首先介绍PDF417条码结构的三大主要组成部分——起始符与终止符、左右行指示符、数据区符号字符, 接着探究PDF417条码的编码算法、相片编码算法和条码绘制方法, 最后在.NET平台上采用C#语言和GDI+绘图类进行条码图形的绘制, 实现了PDF417的编码过程, 并将其应用在身份识别系统中。经测试, 该系统已实现对个人身份信息 (包括个人相片) 的编码功能, 但相片的压缩算法有待进一步优化。

1理论依据及技术基础

PDF417条码是堆叠式条码的一种, 它的每个字符由4个条和4个空组成, 共有17个模块构成。PDF417条码可以表示字母、数字、二进制数据和汉字等。PDF417条码最多可以容纳1850个字符或者是1108个字节, 约500个汉字, 它有九个级别的纠错能力, 级别越高, 纠错能力越强。

1.1符号结构和表示

PDF417条码为多行结构, 符号空白区的地方有顶部、底部, 左空白区和右空白区。每行都有起始符和终止符, 中间是符号和数据字符。如图1所示:

起始符和终止符不在编码的范畴, 因为它们是唯一确定的。条码中间区域的组成模式称为条码技术的条、空组合序列。根据条码存储信息的不同, 条码的尺寸也相应改变。每个PDF417条码有3到90行组成, 每行由起始符开始, 左行指示符, 1到30个符号字符, 右行指示符, 终止符组成。它有三种模式结构:字节、文本和数字压缩模式, 各模式之间可以进行转换。

1.2开发环境

Microsoft Visual Studio 2010是面向Windows操作系统、Office 2010、Web 2.0的下一代开发工具, 是对Visual Studio2008一次及时、全面的升级。VS2010引入了很多新特性, 可以高效开发微软操作系统应用程序。C#是一个强大的面向对象编程的程序语言, 它是微软公司设计和开发的。C#继承了C/C++的强大功能和VB简易使用的特性。较JAVA而言, C#具有一些独有的特点, 如中间代码、命名空间的申明、基本的数据类型等。

系统图形开发需要的程序编程接口是windows中的一个子系统GDI, 它作为图像输出的接口提供了各种丰富的图形图像处理功。它需要调用GDI+库中的类完成图像操作和绘图工作, 方便程序开发人员编写与硬件设备无关的应用程序。

2系统设计与实现

2.1系统流程

整个编码系统运行的流程如图2所示。

2.2数据码生成

数据编码是通过数据的压缩编码和模式切换来实现。压缩编码模式包括文本、字节、数字模式。而文本模式又包括4种子模式即:大写模式、小写模式、混合型模式和标点型模式。

模式切换分为转移和锁定两种。锁定是目标模式;转移则是压缩模式, 这种切换方式是通过第一个码字来实现。

对于输入的数据流, 从第一个字符开始, 分析数据流并按不同类型对数据流进行分段处理。

(1) 若分段数据流全为中文, 则按字节模式对该段数据流进行压缩编码;

(2) 若分段数据流全为字符, 则按文本模式对该段数据流进行压缩编码;

(3) 若分段数据流全为数字, 则需判断数字位数目。若数字位数目大于13按数字模式进行压缩编码, 否则按文本模式进行编码。

2.3纠正码生成

纠正码是根据数据码形成的。当数据码生成后, 从对应的下拉框中获取纠错等级S, 从对应的文本框中获取数据码列数R。根据纠错等级可以生成错误纠正码字的多项式的系数。错误纠正码字和多项式一一对应。

本系统的纠错等级默认为1, 每层数据码列数为5。也就是说, 默认情况下, 错误纠正码字数和生成多项式系数个数均为4。

2.4条空序列生成

在生成条空序列之前, 要考虑数据码数目是否为数据码列数的倍数, 若不是, 需填充900, 以保证条码图形完整。当然, 数据码的行数要求为3~90, 若数据码不足3行, 也需填充900。

2.5图像生成

绘制条码图形之前要确定条码图形的宽度和高度, 确定图形的行数和列数, 确定每个符号字符在图形上的位置。系统默认的矩形条宽为2, 高为15, 且矩形条码的开始位置 (相对图形框) 为 (10, 10) 。对于已经形成的二进制序列, 若为1则用黑刷绘制一个矩形条, 若为0则用白刷绘制一个矩形条。

3系统功能实现及测试

系统主要实现信息编码和保存图像的功能, 其中信息编码又包括生成数据码、纠正码、条空码和图像。为方便测试, 主窗体连接了一个测试窗体, 设置了显示数据码、纠错码和条空码的功能, 以便观察身份信息在编码过程中的细节部分, 监控每一步数据变化的正确与否, 从而通过分析数据为发现问题、调试程序提供直接依据。系统主界面如图3。

为实现身份识别功能, 只需将四一七条码编码功能应用化。在此, 设计一个界面 (如图3) , 接受用户信息的输入 (包括姓名, 性别, 民族, 出生日期, 家庭地址, 身份证号) 和个人相片的导入, 将各项文字信息以“rn”为 (方便解码时提取信息) 界放在一个字符串str Data中, 将相片信息以数据格式放在文字信息的后面, 然后对其一起进行信息编码。

为方便进行信息编码, 设置了一个类Data Handle.cs专门处理数据, 包括生成数据码函数void Get Code () (通过调用类Compaction) , 生成纠错码函数void Get Error () , 生成条空码函数string Get Space () , 还包括数据处理函数string Handle () , 用以调用生成各数据。因条空码和所有数据个数需返回到主窗体中, 所以Handle函数使用string返回类型。因需返回的数据有两个, 所以将这个数据以“;”连接放到一个字符串中。在主窗体“信息编码”调用Data Handle类的Handle方法时, 只需利用字符串的Split方法获取传递过来的多个数据。

信息编码时, 若个人相片未导入, 则使用Data Handle类3个参数的构造函数public Data Handle (string Data, int Error Level, int Row Num) 编码文字信息, 否则使用4个参数的构造函数public Data Handle (string Data, int Error Level, int Row Num, byte[]img Bytes) 将个人相片数据一起编码进去。

系统测试是在软件役入运行前对软件需求分析、软件设计规格说明和软件编码进行查错和纠错 (包括代码执行活动与人工活动) 。查错的活动称测试, 纠错的活动称调试。可以说, 软件测试是为了发现错误而执行程序的过程。

对于该系统, 首先进行静态分析, 查看源程序结构是否正确、完善。然后进行黑盒测试, 看系统的每个功能是否能正常使用 (此时可考虑先进行单元测试, 再进行集成测试) , 测试界面如图4。最后进行白盒测试, 看系统内部的逻辑结构是否正确, 并对穿过系统的逻辑路径进行测试 (此时可在不同点检查系统的状态) 。

4结语

PDF417技术被成功应用于身份识别系统中, 从而实现了身份识别系统的文字信息编码功能。当然, 系统不仅能对文字信息编码, 还能对相片信息编码。

对相片编码时, 压缩算法不够优良从而使条码密度过高, 这是本系统的缺陷。而且, 本人在实现文字信息编码时, 出现了两个问题, 一是文本压缩子模式下混合型与标点型的切换不尽完善, 二是码字913中文本向字节的转移不能实现。以上问题亟待进一步解决。

参考文献

[1]王小科.C#清华程序开发范例宝典[M].北京:人民邮电出版社.2015

[2]李丽萍, 周子尧, 原坚威.PDF417二维条码的识别及应用[J]数字技术与应用, 2014, (6) :141-145

二维识别算法 第6篇

1 二维条码技术

二维码技术, 英文为2-dimensional bar code, 主要指的是借助相关的既定规则来进行不同图形、或者不同线条等等的几何排列, 从而形成具有独特属性的识别码信息。使用二维码, 只需要通过图象输入设备或光电扫描设备自动识读以实现信息自动处理, 所以二维码技术本身是在信息时代的必然产物, 其也是能够结合数据的写入、信息处理以及管理的一种新兴的科技。按照不同的编码原理, 可以将所有的二维码划分为以下几类:

第一类是线性堆叠式二维码, 主要是借助线条来进行二维码生成的方式。其原理是将不同的一维码进行有规律的堆叠, 从而形成二维码, 如Maxi Cod码制。

第二种是矩阵式二维码, 是在一个矩阵内容, 通过黑白色块的分布来进行二维码生成的模式, 如QRCode、Data Matrix等。

第三种是邮政码, 主要是借助不同长短的条形进行编码的写入。常见的编码包含了Maxi Code、Ultracode等多种码制。快递单的二维码就是这个类别。

2 基于二维码的车辆通行自动识别管理系统的构成

在进行基于二维码的车辆通行自动识别管理系统建设的过程中, 是通过不同的架构综合形成的, 包含了基本的二维码制作系统以及识别系统、数据信息处理及管理系统等。在进行单辆车的二维码制作的过程中, 其二维码中不仅包含了基本的品牌、车型等基础信息, 同时也包含了车辆的车牌等信息, 具体的关系构成如下图:

在系统运作的过程中, 要依据不同车辆的不同信息来进行二维码制作生成。每个二维码对应唯一的车辆。这个二维码标签是QR Code类别的, 是一种矩阵式的二维码, 具有许多独有的优势, 诸如较大的信息存储空间、较强的信息保密性等。此外, 其还具有超高速识读、全方位 (360°) 识读特点, 能在车辆通行时快速高效识读。

作为车辆的唯一信息载体, 借助二维码可以促使车辆在进入到相关区域过程中通过过道闸口摄像头监控设备自动解密后识别并与信息库数据检索比对予以放行。车辆信息管理系统可以对车辆信息数据库中信息添加、检索、删除、修改等操作, 对车辆出入记录存储管理等。

3 基于二维码的车辆通行自动识别管理系统的实现

基于二维码的车辆通行自动识别管理系统在实现方式上可采取独立一套装置或在现有道闸基础上改装升级。整个系统采用低成本方案, 系统实现框图如图2所示:

上位机系统管理软件采用微软MFC编译开发环境编写运行在PC机Windows平台上, 可直接安装在门卫室办公电脑上, 上位机系统管理软件集图像处理识别、二维码生成、车辆信息管理、人机接口界面等功能, 是整个基于二维码的车辆通行自动识别管理系统的中枢。

监控摄像头安装在道闸口, 除了本职监控功用还充当二维码识读传感器, 负责出入车辆图像信息采集, 经视频采集卡与PC机相连, 结合上位机软件对采集的车辆图像信息进行处理分析, 识读出车辆上的二维码标签, 对校验通过的车辆予放行。

下位机负责道闸驱动电机的控制及相关传感器的数据采集与处理, 通过RS232线缆与运行上位机软件的PC机相连相信。下位机MCU接收上位机下午的控制指令及上行下位机的相关状态信息, 在接收到指令解析之后进行解析并执行指令。

电机驱动电路是下位机MCU与道闸驱动电机之前的媒介, 下位机MCU的GPIO口输出经电机驱动电路控制驱动电机的运行, 电机带动道闸横杆等机械执行装置。

电源模块负责系统各路供电。

4 基于二维码的车辆通行自动识别管理系统的功能

基于二维码的车辆通行自动识别管理系统发挥的作用是以二维码标签作为车辆标识, 基于车辆信息数据库, 通过道闸口监控摄像头为图像采集传感器配合上位机软件, 对出入道闸的车辆进行自动识别, 控制道闸横杆自动放行与车辆记录管理的系统。

在识读车车辆二维码标签后, 可通过系统自动的进行车辆信息的查询与处理, 也可以借助系统来进行车辆新信息内容的重新编辑。而且借助该系统, 车辆于何时进入、何时离开都能够进行准确的穿查阅。此外, 依据系统的相关功能设置, 借助二维码还可以进行以下功能的兑现:

(1) 更便捷的实现外来车辆监管。借助系统模块写入, 可以对外来车辆的出入信息进行登记、拍照记录。由于外来车辆无本区车辆二维码标签, 对外来车辆采取人工录入通行记录, 并拍照留存证据。

(2) 信息联网共享功能。本功能模块主要实现多个区域系统信息联网共享, 联动管理, 当该系统应用达到一定规模, 再扩展设立服务器, 通过联网与服务器端信息共享。

5 软件及数据库设计

上位机软件使用VC开发环境, 图像处理上采用开源的Open CV库, 对采集的图像进行滤波、边缘检测, 再通过开源的Zbar库进行二维码识别。如图3所示:

数据库采用轻量化的SQLite3数据库, 建立车辆信息数据库、车辆通行记录数据库。车辆信息数据为每辆车分配一个ID号作为标识, 每辆车包括车辆相关信息、车主信息、单位信息等内容。车辆通行记录数据库记录存储车辆通行记录, 方便查询。

6 结语

基于二维码的车辆通行自动识别管理系统的建设是新兴科技发展下的产物。借助这种技术, 不仅可以更好的实现较大区域内的车辆自动监管, 同时借助该技术的实现, 可以实现对通行车辆的自动识别, 避免了以往门禁系统刷卡的麻烦, 提高车辆通行管理的效率。该系统实现成本低, 只须基本或很少的硬件设施投入, 可基于原有门禁系统改装升级, 且二维码标签成本比以原有车辆通行卡低许多, 是一种高效的低成本系统。基于二维码的车辆通行自动识别管理系统, 有着极其广阔的推广应用前景。

参考文献

[1]薛红, 薛军, 邹彦卿等.二维条码在车辆管理系统中的应用研究[J].计算机工程, 2002, 28 (6) :211-213.

[2]上海文基数码科技有限公司.二维码技术在车辆管理中的应用[J].交通与运输, 2003 (6) :42.

[3]胡平旺, 黄荣贵, 顾克庆等.二维码车辆信息管理系统应用研究[J].交通与计算机, 2002, 20 (6) :57-59.

二维识别算法 第7篇

人脸表情识别F E R (f a c i a l e x p r e s s i o n recognition) 即利用人类所具备的情感方面的先验知识, 通过对人脸表情信息的特征提取, 利用计算机图像处理和模式识别来实现身份鉴别和验证。人脸表情识别目前已经在很多领域获得了广泛的应用, 如图像处理、机器视觉、模式识别和神经网络等研究领域[1,2]。

人脸识别的主要过程为人脸检测、人脸图像预处理、特征信息提取以及人脸表情分类识别。其中, 人脸检测的主要功能是从复杂的背景中检测人脸是否存在以及其具体位置。人脸图像预处理主要是对图像进行尺度归一和灰度均衡化。人脸特征信息提取是人脸识别过程中非常关键的一步, 特征提取的好坏直接影响到最终的识别精度, 现有的人脸特征提取方法主要可以分为基于几何特征[3]和基于代数特征[4]的提取方法, 基于几何特征的提取方法使用人脸的形状和几何关系作为特征矢量, 分量主要包括人脸任何两点之间的曲率、欧氏距离等。基于代数特征的提取方法首先将图像转换为像素值为元素的矩阵, 然后进行各种代数变换或矩阵分解。

G a b o r变换[5~8]具有良好的时域和频域分辨能力, 能很好地表示人脸特征, 但对整幅图像进行不同尺度和方向的Gabor算法处理后的特征向量具有维数过大的缺点。DCT (Discrete Cosine Transform) [9]是一种实数域变换, 当图像经过DCT变换后, 其能量主要集中在低频部分, 因此能很好地实现图像的压缩。所以, 本文采用DCT对Gabor算法得到的特征向量进行降维, 实现在不丢失重要信息的同时实现特征向量的降维。然后使用粒子群优化的BP神经网络实现对特征向量的训练, 实现表情的分类识别。

1 二维Gabor变换

Gabor变换是为了克服Fouriter函数的纯频域分析的局限, 在Gaussian函数基础上提出, 其由一组不同尺度和方向的滤波器组成, 可以分析各个尺度和方向的图形纹理变化。其二维Gabor算法的核函数如公式 (1) 所示[6]:

在式 (1) 中, x表示给定位置的图像坐标, σ表示Gabor滤波器的带宽, kv表示Gabor滤波器的中心频率, 可将其设为2- (v+2) /2π, ϕu表示Gabor核尺度, 在这里取ϕu=πu/8。exp (iku, vx) 是振荡函数, 实部为余弦函数, 虚部为正弦函数,

-是约束平面波的高斯包络函数, -表示直流分量, 可用于去除滤波

器的直流成分, 避免二维Gabor变换对图像的亮度依赖性。Gabor变换在空间的频率域如图1所示。

二维Gabor小波变换是将图像上给定区域的像素灰度值与核函数进行卷积的结果, 将I (x) 表示图像在坐标x上的灰度值, 图像的Gabor小波可以表示为:

2 DCT离散余弦变换

DCT是一种常用的正交变换, 可以去除无关数据而不影响关键属性和特征, 被用于图像压缩。由于经过Gabor小波变换后的数据量仍然非常大, 所以需要进一步压缩, 在这里采用DCT变换, 既可以去除无关数据, 又能使能量集中在低频分量附近。

对于一幅MN的数字图像f (x, y) , 其2D离散余弦变换可以定义成如公式 (3) 所示:

在公式 (3) 中, u, v为频域变化因子, 当DCT系数C (u) C (v) 较大时, 信息主要分布在u, v较小的左上角区域, 也是有用信息的集中区域, 只要选取低频部分的DCT系数作为特征向量, 可以采用Zig-Zag方法进行DCT系数的提取, 如图2所示:

3 粒子群优化BP神经网络人脸表情识别

BP神经网络是一种采用反向传播算法对网络进行训练的多层前馈网络, 能对满足给定的输入输出关系方向进行自组织的神经网络, 误差传播的方向与信号传播的相反。而人脸表情识别可以将由Gabor算法输出经DCT压缩后的特征向量ix作为输入, 而将图像的分类识别问题作为函数映射的输出, 当ix属于j类表情时, yj=1。但BP神经网络由于权值和阀值等值的误差, 使得BP网络有可能陷入局部极小值, 且存在着训练次数多以及收敛速度慢的问题。所以下面首先采用粒子群算法对BP网络的个参数即权值和阀值等进行优化。

3.1 粒子群算法引入

PSO优化算法是对鸟类捕食的模拟形成的一种基于群体智能方法的演化计算理论。群中的粒子通过不断地寻求最优值, 进行不断迭代, 每次迭代过程中都会计算适应度值。迭代的过程中, 粒子总是不断地在解空间中寻求全局最优和个体最优极值, 直到达到预设的最大迭代次数或误差小于某个最大值为止。

假设需要优化的参数个数为D, 则此群体空间为D维, 其中的粒子总数为N, 则第i个粒子的位置如公式 (4) 所示:

第i个粒子的速度可以表示为公式 (5) 所示:

第i个粒子在迭代过程中搜索的最优位置和群体中所有粒子所搜索过的最优位置分别表示为公式 (6) 和 (7) 所示:

第t+1次迭代中, 则第i个粒子的位置在第t次迭代的基础上, 其第d维的分量可以更新为公式 (8) 所示:

第i个粒子的第k维的速度分量可以更新为公式 (9) 所示:

在公式 (9) 中, γ1和γ2是随机数。

3.2 改进的粒子群优化BP神经网络算法

改进粒子群优化BP网络算法:

输入:粒子群空间粒子数为N, 表示最大迭代次数, vid和xid位于0和1之间;

输出:BP神经网络的各权值和阀值的最优值。

步骤1:首先将粒子的维度设为参数个数, tmax=1, 将输入的粒子的位置输入目标函数得到粒子的适应度值。

步骤2:对于每个粒子, 将当前计算所得的适应度与bstit相比, 若比bstit大, 则bstit被更新为当前值;对于每个粒子的最优值与全局极值gblt比较, 若其值大, 则更新gblt为当前最优位置值。

步骤3:根据公式 (8) 对粒子当前位置进行更新, 按公式 (9) 对粒子当前速度进行更新;

步骤4:若达到算法允许的最大迭代次数tmax但误差e>0.002, 则转入步骤2, 否则转入步骤 (5) 继续执行;

步骤5:此时粒子所在位置的, 各维度即为通过粒子群优化的BP神网络的各参数。

3.3 BP神经网络表情分类识别

本文使用图3所示的三层BP神经网络模型来对人脸表情进行识别分类。

采用BP算法来对模型的权值进行训练, 现将其改进如下:

1) 将训练样本作为网络的输入, 并将ym设定为期望输出.在反向学习过程中, 每一数据对均可以循环利用, 直到网络权值稳定为止。

2) 计算实际输出:

其中, Th (t i) 为规则的阀值。

3) 根据3.2节所示改进的粒子群算法对BP神经网络的权值进行优化。

4) 返回2) 直到W (k) 对一切样本均稳定不变。

5) 将Gabor变换得到的经过DCT进行压缩的人脸特征向量作为测试样本进行分类。

4 仿真结果

实验样本从JAFFE数据库中选取10位日本女性, 每种表情5幅图像, 一共350幅图像, 这些人脸图像包含了不同表情即愤怒、厌恶、恐惧、喜悦、中性、悲哀和惊讶, 部分人脸图像如图4所示。

首先对训练样本图像进行归一化处理, 然后经过Gabor变换获得人脸信息特征向量, 并经过DCT离散小波变换对特征向量进行降维, 最后将其使用粒子群算法优化的BP神经网络进行训练, 在Matlab6.0环境下进行实验, 表1表示了BP神经网络[10]、支持向量基[11]以及文中的粒子群优化的BP神经网络对相同样本进行训练的识别正确率。

从表1和图5可看出, BP神经网络的识别率要明显低于支持向量机SVM和PSO+BP算法, 支持向量机SVM和PSO+BP算法识别率比较相近, 但是从直方图上可以看出, 由于使用支持向量机优化了BP神经网络的各参数, 因此降低了算法的训练时间。

5 结束语

本文提出了基于Gabor小波变换的人脸特征提取方法, 并采用DCT离散余弦变换对特征向量进行压缩, 在有效地保存了图像的低频部分重要信的同时降低了图像特征向量的维数, 并提出了采用粒子群算法优化BP神经网络, 使用其对人脸表情分类进行训练, 最终实现人脸表情识别, 为了说明本文算法的有效性, 还比较了仅使用BP神经网络或仅使用支持向量机SVM算法的识别率, 仿真实验表明本文算法的有效性以及优越性。

摘要:研究了使用二维Gabor小波变换和DCT离散余弦变换实现人脸特征提取并使用BP神经网络进行表情分类识别的方法。首先, 将人脸图像经过归一化预处理, 然后经过二维Gabor变换生成不同尺度和方向下的特征向量, 为了降低其维数, 使用DCT离散余弦变换对其进行压缩, 提取最终的表情特征向量。为了提高BP神经网络对表情的分类精度和减少训练时间, 使用改进的粒子群算法PSO来优化BP神经网络的各权值和阀值。仿真结果表明:使用Gabor小波变换并经DCT进行压缩后得到的特征向量, 在经过粒子群优化的BP神经网络进行训练后, 能有效地实现对其进行分类, 具有较其他方法较高的识别率。

关键词:Gabor,BP神经网络,粒子群优化,人脸表情识别

参考文献

[1]张翠平, 苏广大.人脸识别技术综述[J].中国图像图形学报, 2000, 5 (11) :885-894.

[2]刘晓, 章毓晋.基于Gabor直方图特征和MVBoost的人脸表情识别[J].计算机研究与发展, 2007, 44 (7) :1089-1096.

[3]R Brunell, T Poggio.Feature recognition:features versustemplates[J].IEEE Trans Pattern Analysis andMachineIntelligence, 1993, 15 (10) :1042-1052.

[4]M Turk, A Pentland.Eigenfaces for recognition[J].J CognitiveNeurosci, 1991, 3 (1) :71-86.

[5]T ENLLADO C, GOMEZ J I, SET OAIN J, et al.Improvingface recognition by combination of natural and Gabor faces[J].Patter n Recognition Letters, 2010, 31 (11) :1453-1460.

[6]Loris Nann, Dario Maio.Weighted sub-Gabor for facerecognition[J].Pattern Recognition Letters, 2007, 28 (4) :487-492.

[7]SHEN Lin-lin, Ji Zhen.Gabor wavelet selection and SVMclassification for object recognition[J].Acta AutomaticaSinica, 2009, 35 (4) :350-355.

[8]Liu D, Lam K, Shen L.Optimal sampling of gabor featurefor face recognition[J].Pattern Recogition Letters, 2004, 25 (2) :267-276.

[9]KAO Wen-chuang, Hsu Ming-chai, Yang yueh yiing.Localcontrast enhancement and adaptive feature extractionfor illumination-invariant face recognition[J].PatternRecognition, 2010, 43 (5) :1736-1747.

[10]黎奎, 宋宇, 邓建奇, 等.基于特征脸和BP神经网络的人脸识别[J].计算机应用研究, 2005, 22 (6) :236-237.

二维识别算法范文

二维识别算法范文(精选7篇)二维识别算法 第1篇1 二维图像的概述二维图像指的是在同一个平面中用点和线拼画出的一幅图像, 其具有平面性...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部