电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

二维码识别技术论文

来源:火烈鸟作者:开心麻花2025-09-181

二维码识别技术论文(精选8篇)

二维码识别技术论文 第1篇

关键词:二维码,识别技术,高校图书馆,图书借阅

二维码技术是伴随着科技进步出现的一种新鲜事物, 相比于简单的一维码技术而言, 二维码有着诸多优势:1.高密度编码, 信息容量大;2.编码范围广;3.容错能力强, 具有纠错功能;4.译码可靠性高;5.可引入加密措施;6.成本低、易制作、持久耐用[1]。二维码, 也称二维条码, 是用某种特定的几何图形按一定规律在二维平面上 (水平和垂直方向) 分布, 形成黑白相间的图案以记录数据信息的新型条码技术[2]。

通过使用图像输入设备或光电扫描设备, 即可完成对二维条码的自动识别和读取。因其具有的易用性和便捷性, 近年来, 二维码逐渐融入人们的生活, 从网络资源下载、网络购物到电子票务、会议签到、名片识别存储等等, 二维码的应用随处可见, 并逐渐为越来越多的行业接受, 现已广泛应用到商超、医药、海关、税务、邮政、公安、餐饮、交通运输、大型企业生产流水线等各个领域。

目前国内大多数高校图书馆都实现了图书借阅的计算机管理, 购买回来的纸质图书经过采编部门的加工, 均在图书正反扉页上贴有标识条码, 即一维条码, 图书馆员通过扫描枪对一维码进行手动识别, 同时再配合借书卡的读者信息进行图书借阅的操作。一维条码由于先天缺陷, 包含的信息容量非常低, 大致只有30个字符左右, 只能起到标识索引的作用, 不能对图书本身进行详细的描述。相反, 与一维条码相比, 二维码是一种多行组成的条形码, 自身信息储备量巨大, 不易受到外界影响, 准确度较高, 其最大数据含量为1850字符, 大约相当于500多个汉字[3]。另外, 它的容错与纠错能力强、译码正确率高及具有较好保密性等特性, 在提高现代高校图书馆工作效率方面展现出越来越强的力量。

随着数字时代的到来, 智能手机的拥有率越来越高。据近期对清华大学学生的一次问卷调查得知, 手机持有率为100%, 而使用智能手机的人占到75%[4]。笔者对唐山市某独立学院的医科大学生所做的调查问卷显示, 该群体中大学生对数字阅读的认可度达到33.2%, 而且即便对传统纸质阅读认可较高的医科大学生, 在进行电子阅读时选择使用手机作为阅读媒介的占比也达到57%, 远远高于电脑、平板、MP4等其它手持电子设备。

据了解, 唐山市某独立学院图书馆的图书借阅系统是采用与工商银行一卡通平台进行对接的方式进行运作的。在校大学学生使用工商银行提供的异形闪酷卡进行学生个人信息的读取, 然后再配合扫描图书扉页上的一维码信息来完成图书借阅的流程。卡片一旦丢失, 就会给学生入馆借阅图书造成麻烦。为了解决这种情况, 独立学院图书馆技术部联系相关技术人员开发出一套基于二维码识别技术的应用方案, 来简化学生借阅图书的流程并减少学生丢失闪酷卡造成的不便。

1.首先与馆藏图书管理系统——汇文文献信息服务系统的厂家进行技术合作, 厂家在汇文新版软件中引入二维码生成插件, 可以通过这个插件在管理模块中按需生成学生信息的二维码图片。学生可能通过登录汇文联机公共目录查询系统 (Online Public Access Catalogue, 简称OPAC) 中“我的图书馆”选项获得代表个人信息的二维码图片, 可以采用拍照或图片另存为了方式把图片保存到手机。在一卡通丢失或忘记携带的情况下, 展示手机上的二维码信息, 通过二维码激光扫描枪的扫描, 即可以完成汇文借阅模块对学生信息的识别, 既而代替一卡通的借阅功能完成借书流程。

2.引入超星公司的移动图书馆服务平台, 在馆内设置两套“歌德电子书借阅机”。歌德电子书借阅机内置2000余本正版授权电子图书, 而且每月会有100本左右新书更新。首先在智能手机上安装歌德客户端——超星移动图书馆, 然后利用客户端的二维码扫描功能对准歌德借阅机屏幕上的图书信息二维码进行扫描, 即可将图书信息导入手机内, 接下来就可能通过手机数量流量或WIFI网络将图书的数据内容通过网络下载到手机进行随时随地阅读, 方便快捷。

二维码作为数字时代和移动终端技术发展的重要产物, 其大容量、强容错和低成本的特点必然会使其成为极具潜力的信息传递与交流模式。而高校图书馆作为信息交流的一个重要交互中心, 灵活高效地将二维码识别技术运用到图书馆业务的各个流程中去, 不仅可以减轻工作人员的工作压力, 而且能够为图书馆用户提供更为便捷的信息获取渠道, 为他们提供形式多样、内容丰富的信息资源;与此同时, 二维码也加强了图书馆与用户之间的互动, 使图书馆能够更准确地获知用户需求, 也为用户随时随地获取图书馆资源提供了方便。因此, 独立高校图书馆应该大力拓展二维码识别技术的使用范围, 将其与图书馆的传统服务紧密结合, 为广大师生提供更加多样化、人性化的信息服务, 完善并提高他们的阅读体验[5]。

参考文献

[1]赵江鹏.二维码在线生成器的开发[D].保定:华北电力大学, 2014.

[2]周喆.物联网时代下的条码印刷[J].印刷质量与标准化, 2010 (3) .

[3]滕丽丽, 郑晓军.基于二维码的小型图书馆管理系统[J].价值工程, 2014 (27) .

[4]远红亮, 张成昱, 张蓓等.清华大学图书馆手机二维码创新服务[EB/OL].2012-09-20.

[5]http://tgw.lib.tsinghua.edu.cn/content/清华大学图书馆手机二维码创新服务, 2015-04-30.

二维码识别技术论文 第2篇

页面做出来后测试,发现在安卓版微信能正常识别,但iOS 版微信(iPhone 或 iPad)皆无法正常识别。出来问题一开头固然是怀疑自己的代码有问题,上网搜索相关资料,尝试以下方案均无法解决:

1、定位方式由absolute 改为传统的margin(据说绝对定位会导致这个问题);

2、修改viewport 上的maximum-scale大于1(网络上看到的解决方案);

3、网络上有说用position: fixed; 定位会导致这个问题,但这个页面css 文件完全无fixed 这个单词。

寻找原因

后来找有经验的同事帮忙看下,发现可识别区域恰巧比正常地方稍微往上一点,而“比正常地方稍微往上一点”是多少呢?经过多次人工检测,发现上文“比正常地方稍微往上一点”的高度正是微信标题栏+系统状态栏的高度(64px)。

做了一个问题重现的页面,地址如下(用iOS 微信6.2 扫描方可重现):

iOS 版微信6.2 中二维码实际可识别区域为蓝色框部分(请用第五个小指在边缘区细心长按)。本人测试设备为iPad mini2+ iOS8.1 +微信6.2.2.17,其他微信版本没有测试;

基本上可以确定是iOS 版微信的本身问题,原因应该是微信客户端在识别二维码的时候忽略了微信标题栏+系统状态栏的高度,而这种bug 的促发貌似也是需要CSS 进行特殊定位的情况下才产生的(特别是absolute 绝对定位)。因为在微信实习的缘故,跟同事了解了下情况,这个bug 早在6.1 版本就出现了,他们有反馈过但到了6.2 都没有修复。所以当前情况应该是先自行hack 下。

6月25日更新:经过与微信 iOS 开发人员的反馈沟通,确定是微信的 bug,据他们的说法目前已经修复,但能否在下一个版本中加入么,就不得而知了。

解决方案

个人在做这个页面时候采取的解决方案是通过将img 标签增大padding 的方式来增大可点击区域(为此padding-bottom 特长)来解决的。

6月25日更新:还有一种解决方法(如下图),即为二维码图片本身增加透明底部背景(前端上访客看不到),增加可接触面积。

二维码识别技术论文 第3篇

1 二维条码技术

二维码技术, 英文为2-dimensional bar code, 主要指的是借助相关的既定规则来进行不同图形、或者不同线条等等的几何排列, 从而形成具有独特属性的识别码信息。使用二维码, 只需要通过图象输入设备或光电扫描设备自动识读以实现信息自动处理, 所以二维码技术本身是在信息时代的必然产物, 其也是能够结合数据的写入、信息处理以及管理的一种新兴的科技。按照不同的编码原理, 可以将所有的二维码划分为以下几类:

第一类是线性堆叠式二维码, 主要是借助线条来进行二维码生成的方式。其原理是将不同的一维码进行有规律的堆叠, 从而形成二维码, 如Maxi Cod码制。

第二种是矩阵式二维码, 是在一个矩阵内容, 通过黑白色块的分布来进行二维码生成的模式, 如QRCode、Data Matrix等。

第三种是邮政码, 主要是借助不同长短的条形进行编码的写入。常见的编码包含了Maxi Code、Ultracode等多种码制。快递单的二维码就是这个类别。

2 基于二维码的车辆通行自动识别管理系统的构成

在进行基于二维码的车辆通行自动识别管理系统建设的过程中, 是通过不同的架构综合形成的, 包含了基本的二维码制作系统以及识别系统、数据信息处理及管理系统等。在进行单辆车的二维码制作的过程中, 其二维码中不仅包含了基本的品牌、车型等基础信息, 同时也包含了车辆的车牌等信息, 具体的关系构成如下图:

在系统运作的过程中, 要依据不同车辆的不同信息来进行二维码制作生成。每个二维码对应唯一的车辆。这个二维码标签是QR Code类别的, 是一种矩阵式的二维码, 具有许多独有的优势, 诸如较大的信息存储空间、较强的信息保密性等。此外, 其还具有超高速识读、全方位 (360°) 识读特点, 能在车辆通行时快速高效识读。

作为车辆的唯一信息载体, 借助二维码可以促使车辆在进入到相关区域过程中通过过道闸口摄像头监控设备自动解密后识别并与信息库数据检索比对予以放行。车辆信息管理系统可以对车辆信息数据库中信息添加、检索、删除、修改等操作, 对车辆出入记录存储管理等。

3 基于二维码的车辆通行自动识别管理系统的实现

基于二维码的车辆通行自动识别管理系统在实现方式上可采取独立一套装置或在现有道闸基础上改装升级。整个系统采用低成本方案, 系统实现框图如图2所示:

上位机系统管理软件采用微软MFC编译开发环境编写运行在PC机Windows平台上, 可直接安装在门卫室办公电脑上, 上位机系统管理软件集图像处理识别、二维码生成、车辆信息管理、人机接口界面等功能, 是整个基于二维码的车辆通行自动识别管理系统的中枢。

监控摄像头安装在道闸口, 除了本职监控功用还充当二维码识读传感器, 负责出入车辆图像信息采集, 经视频采集卡与PC机相连, 结合上位机软件对采集的车辆图像信息进行处理分析, 识读出车辆上的二维码标签, 对校验通过的车辆予放行。

下位机负责道闸驱动电机的控制及相关传感器的数据采集与处理, 通过RS232线缆与运行上位机软件的PC机相连相信。下位机MCU接收上位机下午的控制指令及上行下位机的相关状态信息, 在接收到指令解析之后进行解析并执行指令。

电机驱动电路是下位机MCU与道闸驱动电机之前的媒介, 下位机MCU的GPIO口输出经电机驱动电路控制驱动电机的运行, 电机带动道闸横杆等机械执行装置。

电源模块负责系统各路供电。

4 基于二维码的车辆通行自动识别管理系统的功能

基于二维码的车辆通行自动识别管理系统发挥的作用是以二维码标签作为车辆标识, 基于车辆信息数据库, 通过道闸口监控摄像头为图像采集传感器配合上位机软件, 对出入道闸的车辆进行自动识别, 控制道闸横杆自动放行与车辆记录管理的系统。

在识读车车辆二维码标签后, 可通过系统自动的进行车辆信息的查询与处理, 也可以借助系统来进行车辆新信息内容的重新编辑。而且借助该系统, 车辆于何时进入、何时离开都能够进行准确的穿查阅。此外, 依据系统的相关功能设置, 借助二维码还可以进行以下功能的兑现:

(1) 更便捷的实现外来车辆监管。借助系统模块写入, 可以对外来车辆的出入信息进行登记、拍照记录。由于外来车辆无本区车辆二维码标签, 对外来车辆采取人工录入通行记录, 并拍照留存证据。

(2) 信息联网共享功能。本功能模块主要实现多个区域系统信息联网共享, 联动管理, 当该系统应用达到一定规模, 再扩展设立服务器, 通过联网与服务器端信息共享。

5 软件及数据库设计

上位机软件使用VC开发环境, 图像处理上采用开源的Open CV库, 对采集的图像进行滤波、边缘检测, 再通过开源的Zbar库进行二维码识别。如图3所示:

数据库采用轻量化的SQLite3数据库, 建立车辆信息数据库、车辆通行记录数据库。车辆信息数据为每辆车分配一个ID号作为标识, 每辆车包括车辆相关信息、车主信息、单位信息等内容。车辆通行记录数据库记录存储车辆通行记录, 方便查询。

6 结语

基于二维码的车辆通行自动识别管理系统的建设是新兴科技发展下的产物。借助这种技术, 不仅可以更好的实现较大区域内的车辆自动监管, 同时借助该技术的实现, 可以实现对通行车辆的自动识别, 避免了以往门禁系统刷卡的麻烦, 提高车辆通行管理的效率。该系统实现成本低, 只须基本或很少的硬件设施投入, 可基于原有门禁系统改装升级, 且二维码标签成本比以原有车辆通行卡低许多, 是一种高效的低成本系统。基于二维码的车辆通行自动识别管理系统, 有着极其广阔的推广应用前景。

参考文献

[1]薛红, 薛军, 邹彦卿等.二维条码在车辆管理系统中的应用研究[J].计算机工程, 2002, 28 (6) :211-213.

[2]上海文基数码科技有限公司.二维码技术在车辆管理中的应用[J].交通与运输, 2003 (6) :42.

[3]胡平旺, 黄荣贵, 顾克庆等.二维码车辆信息管理系统应用研究[J].交通与计算机, 2002, 20 (6) :57-59.

二维码识别技术论文 第4篇

二维码有“移动互联网的最后一段距离”的美誉, 对移动互联网的发展起着不可估量的作用。用户只需用支持二维码功能的手机一扫激活二维码内所含的信息, 可以是一段文字、一个名片, 也可以是一个链接、一个页面, 内容非常丰富。正因为如此, 二维码近几年来在我国得到了飞跃式的发展, 海报、杂志、地铁、食品包装袋, 包括在火车票、演唱会门票上随处可以看见。然而大多数情况下, 人们看到的二维码都是黑白格子, 色彩单调、构图单一, 难以适应人们尤其是年轻消费受众求新求变的心理。所以, 企业在设计二维码时应尽量融入新鲜独特的设计感, 以提高品牌的辨识度, 增加消费者对于品牌的认知度和好感度。

1 发展有设计感二维码的必要性

二维码是利用特定的几何图形根据一定的规律在平面上分布的图形记录数据符号信息二维条形码, 最早发明于日本后因其便捷性迅速被其他国家效仿, 我国是在上世纪90年代引入的, 而广泛流行则是在最近几年手机网络的普及发展。二维条形码的原理是利用特定的几何图形根据一定规律在二维方向上分布的图形记录数据符号信息的, 通过图象输入设备或光电扫描设备自动识读来显示出某些隐藏信息。当前二维码已经逐步深入到人们的生活中, 手机二维码在报纸、图书、包装袋及名片等多种载体进行印刷, 用户只需用手机摄像头扫描二维码就能立刻实现手机上网, 下载图文、音乐、了解想要的信息, 真正实现一键上网。用手机识别名片、获取天气预报等、交通信息。随着3G网络的普及, 二维码在网络浏览、网上购物、网上支付等方面的运用会更加广泛。

一方面是二维码前景的一片光明, 另一方面确实二维码设计的单调枯燥性, 带有鲜明企业民牌特色的二维码仍然处于空白地带。所谓企业品牌二维码就是将带有特别设计的企业商标或任何文字或图形, 这个过程采用一种特殊的技术使图形成为二维码承载数据的一部分和标准的二维码兼容, 使客户的标示和行业特色的图形融入到标准的二维码中, 这种二维码对于提升企业的辨识度和对消费者的亲和度无疑具有重要作用。人们日常见到的大多数软件生成的二维码仍然以黑白格子为主, 颜色单一, 构图单调, 难以对消费者产生吸引力。尤其是在传播环境日益丰富的情况下, 人们对于色彩多样、构图丰富、有冲击力、创新性强的二维码需求更为强烈。国外以日本为首的国家已经展开了这一步伐, 比如日本的SET、美国的paperlinks等都以设计充满辨别力的二维码而闻名, 当前日本著名的品牌已经大都实现了二维码品牌的个性化、设计化, 甚至在普通的机场、地铁、披萨等普通品牌上也够印上了充满亲和力的二维码, 然而我国由于技术和观念的限制, 多数二维码仍然停留在黑白格子水平, 但不可否认的是, 充满设计感的二维码必定会是吸引公众眼球的有力手段, 也是品牌企业未来设计的目标。从二维码设计的原理来看, 它容错度较强, 具有纠错功能, 所以即使二维条码因穿孔、污损造成局部损坏时, 依然可以正确得到识读, 损毁面积达50%仍可恢复信息, 二维码生成时, 冗余代码最高可以高达30%, 所以在这个范围内设计师完全可以做一些其他的设计, 可以结合产品、公司的VI或者活动的氛围等, 改变颜色, 丰富配色效果。也可以采用一些更美观或更柔和的线条或者加入手绘POP字体等设计元素, 这些设计并不会妨碍二维码的正常扫描, 还可以起到品牌感立增, 吸引公众注意力的效果。专业的设计师在可扫描的范围内做出很多新奇的改变。

2 成功应用案例和效果

图1中所示是著名设计师Cliffano Subagio帮日本迪士尼设计的广告, 是一款充满了俏皮风格的作品, 被封为二维码的经典之作。这款二维码采用了环境嫁接法, 即把二维码与外界元素进行巧妙的融合。该款二维码不仅把米奇、唐老鸭和史迪奇的耳朵、头部等于二维码进行了简单的结合, 同时也把他们的鼻子和眼睛放进了二维码中, 用户在扫描时看到扫描出的鼻子和眼睛时会觉得新奇有趣, 亲切感大增。这款二维码发布出来时, 不仅是小孩子喜欢, 甚至大人也在拿手机不停的扫描, 二维码本身就已经完全成为一种乐趣。而这种设计风格无疑和迪士尼一直提倡的带给人们快乐、童真的经营理念相一致。设计的新鲜独特和品牌文化完全融合为一体, 带有强烈的迪士尼风格, 因此人们在看到这款广告时不仅不会产生抵触心理, 还会眼前一亮, 充满喜爱。

图2所示是日本SET帮日本红十字会设计的广告, 这是一部构思巧妙, 内涵丰富的二维码, 已经完全摆脱了二维码的功能作用, 可以单独作为一个设计品而存在。该图和上图的黑白格不同, 采用了红十字会通用的红色作为构图色, 而在这个大的十字下密密麻麻的布满了日本的交通机具、医药箱还有病人、护士等人物形象图案, 充分彰显了红十字会以救助生命为核心的宗旨。这款二维码是对传统二维码的完全颠覆, 不管是在颜色还是在图形、线条结构上, 而且红十字会的特色非常突出, 除了大大的十字外, 中间沟通的药物、病人等都让人自然的想象到红十字会。但是同时需要注意, 这款二维码因为对比标准的二维码改动太大, 需要的技术也比较复杂, 以我国目前的技术水平来说, 设计较为困难, 即使设计出来, 也难以保证大部分的手机识别器能立刻扫描出来。

图3是一个更为典型的二维码设计的案例, 1940年, Forrest E.Mars先生在新泽西州的纽华克成立一家糖果公司, 也就是巧克力界数十年屹立不摇的超级巨星-M&M's牛奶巧克力就是在那个时代诞生的。当时这家巧克力以“只融你口不融你手”的经典广告语而闻名世界, 而当上图这款二维码设计出来时, M&M's的知名度无疑再次大幅度提升。这款二维码的最突出之处在于巧妙的借用各种颜色的巧克力豆来组成各种图形, 这些颜色鲜亮的巧克力豆无疑会让人眼前一亮, 图形即使不够突出, 随意的组合也能让人眼前一亮。这些闪闪发亮的巧克力豆正是M&M's优良品质的保证, 顾客在扫描时会不自觉的想起他的产品产生购买欲望。而以产品的原材料直接作为二维码素材也是一次较大的突破, 宣传效果更为突出, 品牌产品更为明确, 这对其他企业的二维码设计有一定的借鉴意义。

3 发展趋势和注意事项

毫无疑问, 二维码在移动终端、网络购物等新兴事物的带动下未来会受到更广泛的应用。而计算机技术的普及也让普通人得以见识到更多的事物, 看到更多有趣的新闻, 铺天盖地的广告、宣传册让人们产生了严重的视觉疲劳。所以在未来创意、创新无疑是信息时代致胜的法宝。对于企业品牌来说, 要想在未来获得更多的关注力, 就必须用新鲜充满奇特的想法或设计让自身脱颖而出。而二维码设计无疑是一个重要途径, 企业在设计二维码中应以提升辨识度、吸引消费者为最终目的, 同时把自己的文化尽量和二维码设计的风格融为一体, 上述中的三个品牌都是这一点的极佳示范。而在设计中的要素, 无外乎是颜色、线条、图像等几点, 设计师在设计时不要被其他观念束缚, 应敢于打破规则, 创作出引领潮流的作品。

然而必须需要注意的是, 设计师在制作中不应该把完美的设计作为唯一标准, 应该注意平衡好二维码的设计感和能扫描的关系, 毕竟二维码是以商品为服务对象的。因为品牌Logo等元素, 会占用较多的冗余代码, 如果30%的冗余全部被占用, 那这枚二维码只有在100%完整无缺才能进行正常扫描。同时一个引人瞩目、设计感突出的二维码完成后, 必须先进行扫描测试, 如果不能被扫描, 再完美、效果再抢眼的二维码也只能放弃。毕竟二维码的设计感只是吸引消费者的一种手段, 真正的价值还是在于消费者对它进行使用, 如果一个代码需要用几秒钟的时间扫描甚至完全扫描不出来, 那它必须被重新设计, 毕竟, 消费者没有必要一定要等着它被扫描出来, 但是容易被扫描, 又充满设计感的二维码, 确实令人愉悦。另外, 国内目前解码器的发展水平也是必须考虑的, 国外的二维码技术相对来说发展较为快速, 而我国解码器还有很长的路要走, 当前一些国外设计精良的品牌二维码用国内手机扫描不出来或需要很长时间的事情已经屡见不鲜, 在设计中应该注意。

4 结束语

综上所述, 信息时代企业要想在铺天盖地的同类产品中脱颖而出, 增加企业的知名度和影响例, 就必须提高自己企业的辨识度, 提升企业的吸引力和亲和力。而充满设计感和创新感的二维码是帮助企业实现这一目标的有力手段。企业必须意识到二维码在未来品牌竞争中不容忽视的影响力, 尽快打造成独属于自己品牌的二维码。

摘要:随着无线通信技术、图像识别技术的不断发展, 二维码技术在手机等新媒体上的应用也更为广泛, 在品牌设计与传播中, 充满创意、辨识度较高的二维码对提升企业品牌形象, 增加消费者对于品牌的关注和喜爱具有重要意义。然而当前我国的二维码设计大多还停留在在简单的黑白格子上, 越来越难以满足消费者日益增大的求新求异需求, 难以让品牌在同一的二维码设计中脱颖而出, 因此本文提出在传统二维码中改变线条、颜色, 加入手绘、图形等元素, 增加二维码的设计感, 提升其辨别度和亲和度, 并对发展这种有设计感的二维码的必要性及其未来发展趋势做了阐述, 以期促进我国二维码设计的进步。

关键词:二维码,设计感,品牌识别

参考文献

[1]宋超英.手机图书馆对图书馆发展的影响[J].河北学刊, 2010 (04) .

[2]杨军, 刘艳, 杜彦蕊.关于二维码的研究和应用[J].应用科技, 2009 (11) .

[3]王毅.二维条码技术应用及标准化状况介绍[J].中国标准化, 2006 (05) .

[4]陈逸辰.二维码:“扫”出来的行业乱象[J].IT时代周刊, 2013 (06) .

二维码识别技术论文 第5篇

1 二维图像的概述

二维图像指的是在同一个平面中用点和线拼画出的一幅图像, 其具有平面性, 比如三角形、长方形等图形。二维图像与三维图像相比少了立体感, 但是可以更直观地表示出图像的表面特征。本章节对二维图像的特征进行了详细的介绍, 接着又对二维图像的研究意义方面进行分析, 最后对二维图像的应用范围进行了描述[1]。

1.1 二维图像的特征

现在大众的观点认为二维图像中物体的亮度、角点、梯度、边缘和轮廓线等是最为基础的特征信息;还包括一些经过特殊处理的特征信息, 例如像对称性、旋转不变性、经过多种变换后产生的新特征;由于这些特征信息的数量和种类过于大量化, 研究者常常要根据不同的情况来选择不同的特征[2]。研究工作中使用的二维图像就是图像中最具有特征性的部分, 这些具有特征性的部位就可以用来作为识别点。就像世界上没有两张完全相同的叶子, 也没有完全相同的二维图像, 正是因为每张二维图像都有自己的特征, 所以就可以根据这些特征来识别不同的事物。

1.2 二维图像研究的发展历程

人类认识世界的方式就是用自己的方式去理解这个世界, 当人类用自己的视觉观察世界, 就会有意或无意地用自己的方式来记录自己观察到的世界, 这样最原始的图像就出现了。最开始的记录内容可能有非常浓厚的艺术目的, 常常用带有浓重的原始宗教或图腾崇拜色彩来表示一件事物。随着科学知识的不断进步, 人们对世界的认识越来越深刻, 其记录方式往往会越来越简单, 简简单单的几笔, 就能勾画出一幅完整的画面, 这样的画面具有线条简洁、突出重点等特征。对现在的二维图像的研究而言, 研究学者追求的就是用最简单的结构来突出事物的独有特征, 以达到后期的识别目的。

1.3 二维图像的意义和应用范围

二维图像具有特征性是二维图像拥有相关高级应用的基础, 对于二维图像的研究有着非常广泛的应用。

提高机器的识别能力要根据二维图像的表示方法来改进, 可以对机器进行设置让其“看到”相应的二维图像。

在现代化农业生产中, 对农作物和动物进行编号和拍照可以用于对农作物的生产和畜牧动物养殖的高科技管理。拍到的图像就是一个二维图像, 代表着植株或动物的特征表达, 这样就可以对作物和动物的生长过程进行管理。

二维图像在医学中的应用相当频繁。医学的二维图像的数据量非常大, 比如CT或MIR等, 医生借助二维图像在计算机的帮助下完成初步的分析和诊断, 以获得有效的可靠信息。

在军事安全中, 二维图像在嫌疑犯的识别、出入管理、摄像头等方面都有使用。另外在娱乐行业、通讯业这些行业, 二维图像的特征表示也都有非常好的应用。

2 人脸识别算法

最早的人脸识别技术出现在20世纪60年代末, Capon教授[3]在Nature上发表了两篇论文, 其中就对最初的人脸识别技术进行了阐述。当今人脸二维图像库还未完全成型, 不利于人脸特性识别研究成果的共享和评价。本小节内容主要就当前的人脸识别技术作出了讨论分析, 讨论了几个主要人脸识别方法, 最后探讨了人脸识别技术的应用范围。

2.1 人脸识别概述

近几年来, 人脸识别技术在各种应用的推动下已经有非常大的发展了, 现在各个研究机构针对人脸识别技术已经有比较可观的成果了。人脸识别技术与指纹、虹膜、语音等其他人体生物特征相比更加直接、方便。人脸识别在访问控制、身份识别、档案管理、基于二维图像的识别和视频检索等方面有着非常广泛的应用, 现在国内很多机构都已经研制出一套比较好的人脸识别系统和技术方法, 一些成熟的商家机构也将人脸识别技术投入到实际应用。最早期的人脸识别技术就是应用最简单的集合特征识别, 例如像眉毛的弧度、眼中心到眉毛的位置、嘴的厚度、脸宽等特征;发展到现在是基于模板的整体匹配思想, 最近在这些新方法下人脸识别技术有了很大的进步。

2.2 当前的人脸识别技术

本章节主要介绍了现在世界上常用的3种人脸识别方法:基于几何特征的人脸识别方法、基于模板匹配的人脸识别方法和基于弹性图匹配的人脸识别方法[4]。

2.3 基于几何特征的人脸识别算法

基于几何特征下的人脸识别方法是最早的研究方法之一, 现在很多新的技术方法就是在此为基础上发展而来的。对于每个人来说, 人脸的轮廓、大小和各个器官的几何分布位置是不一样的, 几何特征就是提取人脸部特征区域的形状和对应的几何关系为基础来进行人脸识别的。这个方法就是提取眉毛、眼睛、鼻子和嘴巴这些特征点, 计算出这几个特征点的大小以及它们之间的几何关系来进行人脸识别。

2.4 基于模板匹配的识别算法

模板匹配识别方法属于模式识别中的一种较为传统的方法, 这个方法首先是用积分投影的方法确定出面部特征位置, 提取局部的特征的模板, 然后进行模板匹配, 利用计算机计算相应的关系系数, 并进行分类。有研究人员进行了模板匹配识别方法与几何特征识别方法两者的稳定性和优越性的比较试验, 结果显示模板匹配识别方法明显要优于几何特征识别方法。

2.5 基于弹性图匹配的识别算法

弹性图匹配是一种考虑到识别目标局部特点之间拓扑结构的, 具有适应性的局部特征的匹配方法, 基于弹性图匹配下的人脸识别方法的基本思想是动态链接结构。弹性图匹配的理论基础是图匹配, 它用图来描述人的脸部特征, 用图的顶点来表示人脸的局部特征点, 边表示面部特征之间的拓扑连接关系, 测匹配度时要同时考虑顶点和边的距离。

3 二维图像表示的人脸识别算法研究

在本小节中主要介绍了基于二维图像下表示的人脸识别算法的研究。

3.1 二维线性特征子空间特征提取方法主成分分析

Turk在发表的论文中首次提出了将主成分分析法 (2D Principal Component Analysis, 2DPCA) 作为人脸特征提取算法并应用, 并在人脸识别领域取得了较大成功。此后有人将这个算法与二维人脸图像结合来表示一个较长的一维向量形式后来计算协方差矩阵, 由于转换后协方差矩阵的维数过高, 容易超过样本数目, 出现奇异矩阵、运算复杂度高和对计算机硬件要求过高的缺陷, 从而导致人脸图像特征抽取困难。所以, 之后有学者提出了一种直接利用二维图像矩阵计算协方差矩阵的方法, 优点就是能够很好地保持人脸的结构关系, 并可以有效减少计算复杂度;将二维人脸图像矩阵直接映射到子空间, 称之为二维主成分分析法解决以上问题。

3.2 线性判别分析算法

线性判别分析算法 (2D Linear Discriminant Analysis, LDA, 2DLDA) 是人脸识别中重要的特征提取方法, 从一维加权LDA算法发展到二维形式技术, 完善了一维形式的不足之处。线性判别分析算法就是利用平衡子空间的类间距的方法, 提出一种新的能够克服当前不足之处的算法, 这样的算法理解起来更加直观, 应用起来更加简便;线性判别分析算法还具有收敛性, 在类间距差别较大时应用有很好的效果。有学者对线性判别分析算法的结果进行了检测, 结果表明此算法是可行的、有效的。

3.3 局部保距投影

局部保距投影 (2D Locality Preserving Projections, 2DLPP) 能够在子空间很好地保持人脸基本流行结构, 经常应用于人脸识别技术中, 随着科技的发展, 二维局部保距投影已经成为一种新的人脸识别技术中重要的特征提取方法[2]。局部保距投影方法可以很好地消除二维图像的部分冗余信息和噪音;在特征提取方面可以有很好的表现;并且它具有降维功能, 在一定程度上减少了很大一部分工作量, 显著地降低了计算的复杂程度。在多个人脸数据库中的人脸识别实验结果显示在频域中使用二维局部保距投影的识别率要明显高于其他的技术的识别率。

4 结语

本文主要对传统人脸识别算法的不足进行了分析, 然后指出基于二维图像表示的人脸识别算法的进步之处, 弥补了传统算法的不足, 但仍然指出二维算法仍有需要改进的地方。比如提高准确性以达到局部与整体的有效结合、满足实时要求等, 这些都是有待解决的问题。

参考文献

[1]路翀.基于二维图像表示的人脸识别算法研究[D].大连:大连理工大学, 2012.

[2]张正.直接基于二维图像表示的人脸识别技术研究[D].哈尔滨:哈尔滨工业大学, 2006.

[3]刘党辉, 沈兰荪.人脸识别研究进展[J].电路与系统学报, 2004 (1) :85-94.

二维码识别技术论文 第6篇

二维条码在各领域得到了广泛应用,快速、准确渗透到计算机管理领域的各个角落。这是因为二维条码能脱离数据库及时读取大容量、高可靠性信息,并且对身份进行准确描述,以防止各种证件、卡片及单证的伪造。本文探讨将二维条码PDF417技术运用到身份识别系统中,重点研究了二维条码的识别技术,包括数字图像处理中的图像灰度化、图像二值化、图像倾斜校正、图像边缘检测、条码解码算法技术等。

二维条码在发达国家很多领域都有应用,带来了巨大的经济利益。我国对人员的现代化管理需求日益剧增,需要在身份证件上对管理对象进行精确描述,未来的一段时间内,在身份识别技术上将有很大的发展空间。利用好二维码技术,必能提高生产力,提高工作效率。

本文介绍了二维条码的核心技术,运用图像处理方法和算法,准确识别那些污迹、破损、模糊的二维条码图,在二维条码识别技术上有新的进展。

1 系统分析

PDF417二维条码是一种高密度大容量的便携式数据文件,可实现证卡、报表等数据信息的自动录入、存储、携带,并可用机器自动快速识读。

条码图像预处理在整个系统中起着举足轻重的作用,直接影响着系统的性能指标,是整个系统的核心。条码识读框架如图1所示。

在复杂环境下获得的图像有许多不足,比如模糊、低对比度、高亮度等,只有经过图像的预处理才能正确解码。图像的二值化[6]是图像。

用灰度变换来研究灰度图像f(x,y)的方法称为图像的二值化。二值化处理就是求解阈值T,从而把灰度图像f(x,y)分为特征和背景两个部分。使用阈值是一种区域分割技术,用于物体和背景有较强对比的景物效果很好。它计算简单,能用封闭而连通的边界定义不交叠的区域。

本系统根据条码的结构组成和编码规则设计解码算法,实现PDF417条码图像的识别和解码,识别流程如图2所示。

2 开发平台

系统采用微软公司的Microsoft Visual Studio 2010.NET平台和C#语言。C#(音CSharp)是一种强大的、面向对象的开发语言,是微软专门用于.NET平台的编程语言。在当前的软件开发行业中,C#已经成为绝对的主流语言,可以和Java语言平分天下。C#作为一个全新的编程语言,可以实现大多数程序功能。包括Windows桌面应用程序、Windows服务程序、Web应用程序、WPF应用程序、WPF浏览器应用程序等。

3 系统实现

首先对图像进行灰度化和二值化识别处理,代码写在code类中。当打开条码图像时,把图片存在图片框中。断开与原图像的关联,以便原图像可以进行其它操作,方法名如下:

public Bitmap gray8_click(Bitmap curBitmap)

用加权平均值法对图像灰度处理后(之后是二值化过程),返回一个Bitmap对象复制到curBitmap2中,一般处理后的图片都放在curBitmap2中以便进行对比。

二值化图像时需要使用Otsu方法选取阈值,二值化后的图像同样保存在curBitmap2图像中,其方法名如下:

protected int GetOstuValue(Bitmap bitmap,byte[]bitmapBytes,int stride)//bitmap,求阈值图像,bitmapBytes是求阈值的图像像素信息,stride是求阈值的图像在内存中的扫描宽度,流程如图3所示。

程序设计有两个关键点:(1)图像的旋转过程;(2)图像的噪声去除。在图像旋转时确定角度有一个约定,就是条码有效部分外部不能有明显的直线污染,否则在检测条码边界时将不能检测到有效条码真正的边界,从而造成条码信息的完全错误。在去除噪声时,从中值滤波常用的窗口形状(见图4)可以看出,对类似水平直线的污染可以完全去除,但对垂直的直线污染却无能为力,没有在垂直方向上采用类似的模板窗口再次去除污染,是因为考虑到条码的一个条的宽度为1个像素,如果对单个像素宽度的垂直直线进行去除,就会把有效条码的条删除了。即如果在垂直方向有直线污染,对条码的识别将产生严重影响。

对大量条码图像测试后得知,污染如果是点,或者是类似单个像素的水平直线情况,都能有较高的识别率。但是下列情况将会对条码识别率有较大影响:(1)如果在条码的空白处有类似于直线的污染,将会严重降低条码的识别率,甚至不能对图片进行识别;(2)如果条码中在不是码字列开始的位置有垂直直线污染,将对识别率有严重影响;(3)如果类似水平直线高度的像素值大于1个像素,对条码识别率会有较大影响;(4)如果条码的行高太小,对条码会有很大影响。

实现的关键技术:

(1)图像旋转时角度的确定。利用Hough直线检测算法检测条码图片左边界,得到的左边界有可能是有效条码的上边界(向上偏斜较大角度)、左边界、下边界(向下偏斜较大角度)。因此还需组合各种情况,求出用来旋转时的角度。

(2)图像转换为二值化图像时,阈值的选取有多种方法,如:最大值法、平均值法、加权平均值法、Otsu最大类间方差法。综合分析后采用Otsu方法求阈值。

(3)用中值滤波方法去除噪声时,可以采用多种模板窗口。使用多种窗口比较后,最后采用效果最好的模板窗口,见图4。

(4)为求出条码图像包含有效行数目和每行有效码字列的数目,对图像进行带方向的边缘检测,使检测出的图像更有分析价值。

(5)解码算法的实现过程要根据标志值900、901、902、913、924分多种情况考虑,否则会有遗漏情况,造成解码出来的信息严重失真。

4 结语

本文依据GB/T 17172-1997标准,在VS.NET2010开发环境下用C#语言实现了从条码图像文件到文本信息的解码过程;采用有针对性的图像预处理方法,并充分利用条码图像的特点,达到提高PDF417条码识别率的目的。

首先对条码图像进行识别。识别图像前分析多种方法实现效果,选取一种较好的方法进行图像预处理。图像预处理过程为:图像二值化、条码部分图像旋转至水平、中值滤波去除噪声、水平和垂直方向边缘检测、水平和垂直方向投影、图像二值化,将图像从被识别物体和背景分离,实现图像分割的目的。对二值化后的图像去除噪声可使污染的点和类似水平的直线删除。通过对条码每一行采用垂直投影法,进一步减低噪声干扰,提高识别率。经图像预处理的图像,识别率有较大提高。实验表明,这种有针对性的图像处理方法是可行、有效的。为了进一步提高识别率,采用了相似边距离法,确定一个模块的基本宽度,求取满足这一宽度的模块,进一步提高了识别率。条码解码过程参照公开的算法解码,保证了可靠性和通用性。

摘要:二维条码已经运用到身份识别中。将个人信息和照片编在二维条码中,不但可以实现身份的自动识读,而且可以有效防止伪造和使用假冒证件。探讨了PDF417二维条码的识别与解码算法及在身份识别上的应用。分析了多种图像处理方法,针对条码图片的特点,采取特定的图像处理方法以得到最佳效果。在.Net平台开发环境下,用C#语言首先对各种图像预处理方法进行分析和对比,然后在图像识别时对图片进行预处理。对处理后的图像进行水平边缘检测和垂直边缘检测,得到条码行数和列数,最后依据PDF417公开解码算法进行解码,还原编码的文本信息。

关键词:身份识别,二维条码,图像预处理,解码算法

参考文献

[1]王小科.C#清华程序开发范例宝典[M].北京:人民邮电出版社,2015.

[2]李俊山,李旭辉.数字图像处理[M].北京:清华大学出版社,2013.

[3]李丽萍,周子尧,原坚威.PDF417二维条码的识别及应用[J].数字技术与应用,2014(6):141-145.

二维码识别技术论文 第7篇

人耳识别是近年来新兴的一种生物特征识别技术。人耳本身具有丰富的物理结构,具有普遍性、唯一性和持久性,已经证实其作为一种生物识别特征是切实可行的[1]。目前人耳识别的研究还处于起步阶段,也是模式识别领域一个新的课题。

在模式识别领域,特别是在图像识别中,有关特征抽取和维数压缩的理论及方法一直是人们研究的热点。到目前为止,多元统计分析中的诸多方法已被成功的应用到这一领域,其中最具代表性的有基于K-L变换的主分量分析(PCA)方法和Fisher线性判别分析(FLD)方法[2]。PCA方法提取的特征是最佳描述特征而不是最佳分类特征。FLD方法能提取最佳分类特征,但由于该方法在处理图像时要将二维图像矩阵转化成一维向量,一般情况下,图像向量的维数远多于样本数,造成样本的类内散布矩阵奇异,使得该方法的求解变的困难。

传统的解决方法是先利用PCA方法降维,获得原样本的特征子空间,这就可以保证在该空间中,类内散布矩阵是非奇异的。再对处理后的结果作FLD,即PCA+FLD[3]方法。然而由于PCA和FLD的投影标准本质上是不同的,在PCA降维的同时丢失了许多重要的判别信息。

处理上述问题的另一种方法就是直接进行图像矩阵投影,即二维Fisher线性判别[4](2DFLD)方法,该方法克服了将二维图像矩阵转换成一维图像向量后造成高维运算的缺点,解决了类内散布矩阵奇异的问题,但目前该方法只使用图像矩阵的行向量作为子模式进行训练[5,6,7,8],若以其他方式作为子模式,则该方法的识别效果与具体应用有关,以行向量为子模式时的识别效果不一定最优。针对此问题,本文在尝试将2DFLD方法应用在人耳识别领域中时,结合人耳图像的特点,提出以列向量作为子模式。针对影响2DFLD算法识别结果的两个主要因素样本在投影空间的离散程度和子模式之间的相似度,设计了一种评价子模式优劣的方法,用来比较两种子模式的性能。在北京科技大学人耳图库上进行实验:1)比较两种子模式的性能,选择较优的子模式应用到人耳识别中;2)通过与同样基于多元统计分析的PCA方法、2DPCA方法和PCA+FLD方法作比较,研究2DFLD方法在人耳识别领域中的性能。

1 以行向量为子模式的2DFLD方法(传统的2DFLD方法)

通过变换Y=AX,将mn维的图像矩阵A投影到n维特征空间X上,得到m维投影矢量Y。2DFLD方法的目标是寻找最佳投影方向X,使投影后的样本具有最佳可分离性。也就是要满足类间离散度和类内离散度的比值最大。

设Sb为样本类间散布矩阵,Sw为样本类内散布矩阵,定义为

其中:Aij(i=1,2,,M;j=1,2,ni;M为训练样本类数,ni为类内样本数,为训练样本总数)为mn维图像矩阵,Ai为第i类样本图像的均值,A为所有样本图像的均值。

当类内散布矩阵Sw非奇异时,对应矩阵Sw-1Sb的最大特征值对应的特征矢量即为最佳投影方向X。实际上一个最佳投影方向不能提取充足的判别信息,通常需要将图像数据投影到一组用来有效分类的鉴别矢量集上,使投影结果之间具有最大的分离度,即取矩阵Sw-1Sb的前d个最大特征值对应的特征矢量组成鉴别矢量集W。

则每幅图像提取的特征Pij为

2 以列向量为子模式的2DFLD方法

传统的2DFLD方法将一个mn维的图像矩阵看作由m个n维的行向量构成,但它同样可以看作由n个m维的列向量构成。人耳图像的长宽比较大,其每一个列向量含有更多的耳轮廓象素,如图1。故本文在将2DFLD方法应用到人耳识别领域中时,尝试以列向量作为子模式。

重新定义类间散布矩阵SB和类内散布矩阵SW分别为

依据准则函数式(3),取SW-1SB的前L个最大特征值对应的特征向量构成变换矩阵W。

则图像矩阵Aij在鉴别矢量集上的投影特征Yij为

3 子模式优劣的评价方法

由于影响2DFLD算法识别结果的主要因素是样本在投影空间的离散程度和子模式之间的相似度,故本文从两方面设计子模式优劣的评价方法:1)2DFLD寻找的是最有效分类的方向,即样本在该方向投影后,具有最大的类间离散度和最小的类内离散度。结合样本离散程度的计算公式,给出在不同子模式情况下样本离散度的度量方法。2)2DFLD中每幅图像都看作由一组子模式构成,子模式聚类的好坏影响算法的识别效果,由于子模式的相似度越大,聚类越好,故本文用矩阵的相似度函数来计算子模式的相似度。

3.1 样本的离散度

从正态分布中抽取的样本点趋向于落在一个单一的云团或聚类中[9],聚类的中心由均值向量决定,聚类的形状由协方差矩阵决定。从一般的d维多元正态密度形式可知,等密度点的轨迹为一超椭球体。该超椭球体的主轴由协方差矩阵的特征向量给出,特征值决定了这些轴的长度,且均值附近的样本的离散程度决定于超椭球体的体积:

其中:为一样本向量x到样本均值向量u的马氏距离,|Σ|为正态分布向量的协方差矩阵的行列式,Vd是一个d维单位超椭球体的体积:

根据2DFLD方法的原理,其寻找的最佳投影方向,需使投影后样本满足类间离散程度和类内离散程度的比值最大,依据式(8),设计不同子模式下样本离散度的度量函数为

其中:SB为样本类间协方差矩阵(类间散布矩阵),SW为样本类内协方差矩阵(类内散布矩阵),RB为类间超椭球体的边界点到中心点的马氏距离,RW为类内超椭球体的边界点到中心点的马氏距离。

p越大,说明在该子模式下样本的离散度越大,故使p较大的子模式较优。

3.2 子模式的相似度

图像的代数特征反映了其内在的、本质的属性。每一幅图像都可以看作一个灰度矩阵,各种变换和矩阵分解都可以用来提取图像的代数特征。2DFLD方法是基于统计学原理提取图像代数特征的方法,其基于图像矩阵直接投影,是用训练样本图像矩阵的行向量作为子模式进行训练,即每幅图像都分解为一组子模式。由2DFLD方法的原理知,子模式之间的相似度越大,其在原空间分布的熵越小,故样本在鉴别矢量集张成的空间越能更好的聚类,识别效果也就越理想。由此,为了提高算法的识别效果,选择相似度大的子模式进行训练。本文对子模式相似度的计算依据下列相似度函数[10]:

设I1,I2,,Is(s≥2)为s个mn矩阵,若实数C(I1,I2,,Is)定义为

则C(I1,I2,,Is)称为矩阵I1,I2,,Is的相似度。由此定义可知若C(I1,I2,,Is)=1,则Ii=Ij(i,j=1,2,,s)。因此C(I1,I2,,Is)反映了矩阵I1,I2,,Is之间的一种关系。C(I1,I2,,Is)越接近于1,矩阵I1,I2,,Is之间的相似性就越大;反之,差异越大。故以使C(I1,I2,,Is)较大的子模式为优。

3.3 子模式性能的比较方法

若子模式A与子模式B根据上述3.1、3.2分别计算其结果,进行比较后,都以子模式A为较优,则认为子模式A在识别中的性能优于子模式B。

3.4 人耳识别中子模式的选择

依据该评价方法,对以列向量作子模式及行向量作子模式分别计算其离散度和相似度,将得到的离散度和相似度结果依据3.3中所述的子模式性能的比较方法进行比较,结果表明列向量作子模式在人耳识别中的性能优于行向量作子模式,故在将2DFLD方法引入到人耳识别领域中时选择以列向量作为子模式。

4 实验及实验结果

4.1 人耳图库介绍

目前国内外还没有统一供研究使用的标准人耳图库,本实验采用北京科技大学建立的图库,该图库包括60个人,每人3幅,共180幅人耳图像。图像包含拍摄角度和光照的变化,比较接近实际应用环境,图像的分辨率为15080(部分人耳图像如图1)。

4.2 实验及结果

取图库60个类中每一个类的前两幅图像,共120幅图像作为训练集,再取每个类的剩余图像作为测试集,根据抽取的特征矩阵,计算测试集图像与训练集图像间的欧式距离,然后采用最近邻分类器进行分类。

特征空间中样本的欧式距离为

其中:p、q为特征矩阵的行数和列数。

设训练样本的特征为Yij,每一个样本都属于一个类别ωi,测试样本的特征矩阵为Y,如果满足:

则得到分类结果Y∈ωi。

表1给出了使用两种子模式性能的比较结果和识别结果。由性能比较结果知,列向量的离散度与相似度均优于行向量。根据3.3中子模式的比较方法可以判定:人耳图像的子模式按列向量构成优于按行向量构成。从识别效果上看,当列向量作为子模式时,识别率为98.333%;行向量作为子模式时,识别率为95.000%,列向量作为子模式优于行向量作为子模式。性能比较结果与识别结果相吻合,故将2DFLD方法应用到人耳识别中时,以选择列向量作为子模式为佳。

由表2知,从识别率来看,基于Fisher判别分析思想的2DFLD方法和PCA+FLD方法的识别率分别为98.333%和95.000%,而基于K-L变换的PCA和2DPCA方法的识别率分别为83.333%和85.000%。可以看出基于Fisher判别分析思想的方法识别效果显著优于基于K-L变换思想的方法,这是因为PCA变换保留的是原样本中方差最大的数据分量,即PCA方法得到的只是最佳描述特征而非最佳分类特征。由于人耳图像中的皮肤颜色分布比较一致,PCA变换在降维的同时丢失了很多有用的分类信息,这也是2DFLD方法比PCA+FLD方法识别率高的原因。从识别时间上看,2DFLD方法与其他三种方法十分接近。综上,2DFLD方法在人耳识别应用中的识别效果是四种方法中最好的,是一种有效的人耳识别方法。

5 结论

2DFLD方法是一种常用的生物特征识别方法,但目前只以行向量作为子模式。由于构成图像的子模式不同,会导致样本在投影空间的离散度及子模式之间的相似度不同,从而识别效果也不同。本文将该方法应用于人耳识别领域中时,结合人耳图像的特点,提出以列向量作为子模式。实验结果表明,使用列向量作为子模式的识别率比使用行向量作为子模式时提高了3.333%,与同样基于多元统计分析的PCA方法、2DPCA方法和PCA+FLD方法的性能相比,该方法的识别率最高,达98.333%,识别速度与其他三种方法也十分接近。一次完整的特征提取与匹配过程耗时仅0.035 5 s,可以满足实时应用的需要,是一种有效的人耳识别方法。

摘要:针对传统二维Fisher线性判别(2DFLD)方法只使用图像矩阵的行向量作子模式的局限性,结合人耳图像的特点,提出了一种基于列向量作子模式的2DFLD的人耳识别方法。首先利用训练样本图像矩阵的列向量作子模式进行训练以提取特征人耳子空间,再将测试图像投影到该子空间上,最后用最近邻欧式距离方法进行匹配。实验结果表明,以列向量作子模式时的识别率达98.333%,比行向量作子模式时提高了3.333%,与同样基于多元统计分析的PCA、2DPCA和PCA+FLD方法相比,识别效果最优,是一种有效的人耳识别方法。

关键词:2DFLD,列向量,子模式,人耳识别

参考文献

[1]Burge M,Burger W.Ear Biometrics[M].Boston:Kluwer Academic Publishers,1999:273-286.

[2]Fukunaga K.Introduction to Statistical Pattern Recognition:2nd ed[M].New York:Academic Press,Inc,1990:94-102.

[3]JIANG Wei,TAO Jun-wei,WANG Li-li.A Novel Palmprint Recognition Algorithm Based on PCA&FLD[C]//International Conference on Digital Telecommunications,Cote d'Azur,Aug29-31,2006.Washington D C,USA:IEEE,2006:28-31.

[4]Xiong Huilin,Swamy M N S.Ahmad M O.Two-dimensional FLD for Face Recognition[J].Pattern Recognition(S0031-3203),2005,38(7):1121-1124.

[5]Yang J,Zhang D,Frangi A F,et al.Two-Dimensional PCA:A New Approach to Appearance-Based Face Representation and Recogntion[J].IEEE Transactions on Pattern Analysis and Machine Intelligence(S0162-8828),2004,26(1):131-137,

[6]Yu H,Yang J.A direct LDA algorithm for high dimensional data-with application to face recognition[J].Pattern Recognition(S0031-3203),2001,34(10):2067-2070.

[7]李道红,陈松灿.线性判别分析新方法研究及其应用[D].南京:南京航空航天大学,2003:18-21.LI Dao-hong,CHEN Song-can.Research on New Methods of Linear Discriminant Analysis and their Applications[D].Nanjing:Nanjing University of Aeronautics and Astronautics,2003:18-21.

[8]钟子晶,陈绵书,石宇.基于矩阵行矢量鉴别矢量集的人脸识别[J].计算机工程与应用,2007,43(18):205-210.ZHONG Zi-jing,CHEN Mian-shu,SHI Yu.Face recognition based on discriminant vectors derived from row vestors of matrix[J].Computer Engineering and Applications,2007,43(18):205-206.

[9]Duda Richard O,Hart Peter E,Stork David G.模式分类[M].北京:中信出版社&机械工业出版社,2006:24-28.Duda Richard O,Hart Peter E,Stork David G.Pattern Classification[M].Beijing:Citic Publishing House&China Machine Press,2006:24-28.

二维码识别技术论文 第8篇

近年来, 随着人脸识别技术的发展和研究的深入, 提出了很多成熟的识别算法, 如基于人工神经网络算法、基于模板匹配的算法、基于隐马尔科夫模型的算法等, 各种算法都有各自的优缺点。目前, 人脸识别方法正朝整体识别和部件分析相结合的趋势发展。多种算法结合是目前人脸识别领域最受关注的方法, 其优势在于综合利用了人脸面部的各种特征信息, 将各种成熟算法的优势相结合, 与单一算法相比, 大大提高了人脸识别的效率和准确率。

人脸识别的两个重要部分是特征提取和特征分类识别。本文采用二维主成分分析方法进行特征的提取, 充分利用其特征提取能力强的特点, 再利用神经网络进行特征分类和识别, 充分利用其分类能力强的特点, 将二者相结合来提高识别率。但是神经网络需要大量的样本进行训练, 一张11292的图像就超过万维, 如果直接送入神经网络进行识别会消耗大量计算时间, 因此在特征识别前对图像进行预处理和特征提取, 将提取的特征量送入神经网络进行分类识别, 这大大降低了计算量, 提高了识别的效率和准确率。

1 图像预处理

人脸图像存在多种影响识别效果的因素: (1) 采集环境光照; (2) 采集设备噪声; (3) 图像背景、服饰、发型; (4) 图像高维度。在识别前, 需要对图像进行预处理。

1.1 图像归一化处理

归一化处理包括图像几何归一化和图像灰度归一化。

图像几何归一化可以将采集的不同尺寸图像统一为同一尺寸, 去除姿态、服饰、环境背景的影响, 使人脸图像关键特征保持清晰一致。几何归一化主要包括图像旋转、图形缩放、图像剪切等, 实例如图1所示。图像的平面旋转可以在一定程度上将不同姿态的图像姿势调整一致, 旋转后图像的两眼连线保持水平, 获得图像的正面人脸。图像剪切可以降低图像的维度, 同时可以在一定程度上克服服饰、发型和背景的影响。

灰度归一化对图像进行灰度调整, 调整图像的对比度, 扩展图像的动态范围, 使图像的灰度分布在较大的范围内, 也可以去除一定的环境光照影响。直方图均衡化是常用的灰度归一化方法, 该方法简单有效。例如图1剪切后图像的直方图分布如图2所示, 直方图均衡化后直方图分布如图3所示。均衡化前图像灰度分布在一个较小范围, 均衡化后图像灰度范围变大, 各个灰度级像素出现的比例接近, 分布概率更接近, 此时的图像包含的信息量最大, 冗余信息最少, 更易于识别。

1.2 小波变换

小波变换可以降低图像维度, 去除冗余信息, 降低图像噪声, 具有良好的多尺度特征表征能力, 因此在图像处理中应用广泛。小波变换是基于多层次函数的数学工具, 在时域和频域都具有良好的局部化特性, 而且变换速度更快。

Daubechies紧支撑小波是由世界著名小波分析学者Inrid Daubechies构造的小波函数, 其对应的尺度函数核小波函数分别为:

φ (t) =2n=02Ν-1hφ (n) φ (2t-n) (1)

ϕ (t) =2n=02Ν-1hϕ (n) φ (2t-n) (2)

其中, hφhϕ是展开系数, 分别成为R度和小波。Daubechies小波函数具有正交、时频紧支撑、高正规性等优点, 它提供了比Haar小波更有效的分析和设计能力, 本文选用Daubechies小波函数对人脸图像进行变换。

选取db4小波, 经二维小波变换后的图像由一系列的不同分辨率的子图像组成, 图像特征的主要信息保存在低频子图中, 冗余信息和噪声信息一般保存在高频子图中。变换后的低频子图保留了原始图像的主要信息并且维度降低, 以变换后的低频子图作为识别对象, 不但降低了图像的维度, 而且去除了噪声和冗余信息。以图1直方图均衡化后的图像为例, 二层小波变换示意如图4所示, 一层二维小波变换后的图像分解为四个子图, 这四个子图从不同的角度描述了原图的信息, LL是低频子图, 保留了原始图像的大部分特征信息。LH、HL是水平和垂直方向变化子图, HH是高频子图。LH、HL、HH子图包含大部分原始图像的噪声, 因此可以直接去除。二层小波变换与一层小波变换类似, 在一次变换的LL子图上进行。本文采用二层小波变换后的低频子图作为后续特征提取的对象。

2 基于2DPCA的人脸特征提取

二维主成分分析2DPCA (two-dimensional principal component analysis) 是图像特征提取的一个向前图像处理技术, 其直接利用二维图像数据作为分析对象构建协方差矩阵, 计算容易, 特征抽取时间短, 特别适合人脸图像的像特征提取, 2DPCA算法如下:

假设训练样本集合T={A1, , AN}, N为训练样本总数, Ai (i=1, , N) 是mn维图像矩阵, 为训练样本集中的任意一个样本, 则有 (平均样本A¯;图像协方差矩阵G) :

A¯=1Νi=1ΝAi (3)

G=1Νi=1Ν (Ai-A¯) Τ (Ai-A¯) (4)

根据协方差矩阵提取特征的方法如下:

获取最优投影轴:令A (mn) 为给定的人脸图像样本, Xn维列向量, Y为样本图像AX方向的投影后的特征向量 :

Y=AX (5)

为获取最优投影方向X, 定义最优化准则函数:

J (x) =tr (Sx) (6)

其中SxY的协方差矩阵, tr (Sx) 是Sx的迹, 求最优化准则函数的最大值即可得到最优投影方向X

Sx=E (Y-EY) (Y-EY) T

=E[ (A-EA) X][ (A-EA) X]T (7)

tr (Sx) =XT[E (A-EA) T (A-EA) ]X (8)

令样本图像A的协方差矩阵:

G=E[ (A-EA) T (A-EA) ] (9)

可知G为非负定nn矩阵, 由式 (4) 、式 (6) 、式 (8) 、式 (9) 可知:J (x) =XTGX, 其中X是一维列向量, J (x) 取最大值时对应的XG最大特征值对应的特征向量, 称为最优投影轴, 由此得到满足条件① {X1, , Xd}=argmaxJ (X) , d<n;② XiΤXj=0, ij, j=1, , d。前d个较大特征值对应的特征向量X1, , Xd

特征提取 对于给定样本图像A可得:Yk=AXk, k=1, , d, 相应的Y1, , Yd即为样本图像A的主成分向量, 组成了样本图像A的特征矩阵, 完成了样本图像A特征提取。

3 神经网络分类器

3.1 神经网络分类器设计

神经网络由许多并行运算的功能单元组成, 具有很强的容错性和鲁棒性, 可以将其看作是一个函数映射, 是一个多层前馈型网络, 适用于有明确的输入和输出的对应关系。本文采用标准的三层神经网络作为分类器, 结构如图5所示, 包括输入层、隐含层和输出层, 其中输入层有M个节点, 对应提取的人脸特征维数, 隐含层有N个节点, 输出层有L个节点, 对应识别出的人脸类别数, 且N>M>L

输入层到隐含层的激活函数采用Sigmoid函数, 隐含层到输出层的激活函数采用线性函数purelin函数, 可得网络输出与输入的关系如下:

y^k=j=1rvj.f[i=1mωijpi+θj]k=1, , Ν (10)

其中ωij为连接权值, θj为阈值, y^k为网络实际输出, y^为期望输出。

设网络的总误差小于ε, 最小均方函数为误差函数, 可得:

E=1Νk=1Ν[yk-y^k]2ε (11)

3.2 神经网络分类器的训练

设人脸图像有M类, 选取任意人脸图像A的特征向量为网络输入, 设样本图像A为人脸图像的第i类, 目标输出为[0, 00, 1, 00], 即输出层的第i节点输出为1, 其他节点输出为0。将网络权值初始化为 (-1, 1) 之间的随机数, 采用批处理的方式, 有动量的梯度下降训练函数对训练样本进行训练, 当误差函数没有达到设定的最小误差ε时, 转入误差后向传播, 将误差值沿连接通路逐层向后传送。并修正各层的连接权值, 如此循环, 直至达到期望的最小误差值, 完成网络训练。

4 算法流程

(1) 读入人脸图像数据。

(2) 归一化预处理。

(3) 小波变换预处理。

(4) 从预处理过的图像中选取10人的图像, 根据不同的实验方案选取训练样本和测试样本, 分别计算训练样本和测试样本的主成分向量。

(5) 将步 (4) 中得到的训练样本的主成分向量输入神经网络进行训练, 并保存网络。

(6) 将步 (4) 中得到的测试样本的主成分向量输入神经网络进行测试, 根据输出层节点的输出进行分类识别。

5 实验仿真与结果分析

5.1 实验设计

实验人脸样本图像采用英国剑桥大学的ORL人脸数据库, 该数据库由40个人的400张图像组成, 每人10幅不同的图像, 每幅图像为11292像素, 256灰度级, 它们是在不同时间, 光照略有变化, 不同面部表情 (眼睛张开或闭合、笑或不笑) 以及不同脸部细节 (有眼镜或没眼镜) 下获得的。

ORL原始图像的维数为11292, 图像归一化预处理后的图像为8080维, 经过二维二层小波变换后的低频子图像为2020维。实验采用Matlab进行仿真, 共设计了三种实验方案, 其中方案1与方案2的训练集相同, 但方案2的测试集数量有所减少。方案2与方案3的测试集相同, 但方案3的训练集有所增加。利用这三种方案可以检测出训练集变化对识别准确率的影响, 不但可以确定影响本方案识别效果的因素, 还可以比较出本方案与常规方法的识别效果, 具体方案如下:

方案1

训练集 选取10个人的图像, 每人随机选取5幅, 共50幅作为训练集。

测试集1 采用训练集作为测试集。

测试集2 将训练集外的50幅图像作为测试集。

方案2

训练集 选取10个人的图像, 每人随机选取5幅, 共50幅作为训练集。

测试集1 在训练集中选取每人2幅, 共20幅图像作为测试集。

测试集2 在训练集外中选取每人2幅, 共20幅图像作为测试集。

方案3

训练集 选取10个人的图像, 每人随机选取8幅, 共80幅作为训练集。

测试集1 在训练集中选取每人2幅, 共20幅图像作为测试集。

测试集2 在训练集外中选取每人2幅, 共20幅图像作为测试集。

5.2 实验结果分析

采用上述实验方案, 分别使用本方法和只用神经网络的传统方法进行仿真实验, 得到的实验结果如表1所示。由表1可以看出, 在相同的测试集合情况下, 随着训练样本数量的增加, 两种方法的人脸识别准确率都有所提高, 这说明采用神经网络作为分类器的方法, 对训练样本数量是非常敏感的。另外, 本方法的识别率明显高于将原始图像未经2DPCA特征提取, 而是直接输入神经网络进行识别的常规方法, 这说明通过2DPCA方法提取特征, 再送入神经网络进行分类, 可以明显提高人脸识别的准确率, 因此, 证明了本方法的优越性。

6 总 结

本文通过改进神经网络的输入, 采用综合图像预处理方法, 在保留图像基本特征信息的前提下, 去除了图像的冗余信息, 降低了图像的噪声和维度, 从而大大降低了计算量, 提高了计算速度。然后再应用二维主成分分析方法提取人脸特征向量, 作为神经网络的输入, 进行分类与识别, 有效提高了识别准确率, 并缩短了计算时间。但本方法也存在神经网络训练速度慢, 特征提取计算量仍较大, 没有进行最优特征选取和验证的缺点。随着多信息融合技术的发展, 下一步的工作将进行虹膜信息与人脸信息融合算法的研究, 将虹膜特征作为分类器输入的一部分, 选取并验证最优特征, 在进一步提高识别准确率的同时大大降低计算量。

摘要:提出基于神经网络的二维主成分分析人脸识别算法。通过图像的预处理改善了图像的质量, 提高了图像的亮度和对比度, 降低了图像的维度, 然后利用二维主成分分析方法进行人脸关键特征的提取, 并将该特征作为神经网络的输入, 用改进的神经网络作为分类器, 并通过实验证明了算法的有效性和可行性。

关键词:人脸识别,神经网络,二维主成分分析,小波变换

参考文献

[1]Brunell R, Poggio T.Feature recognition:features versus templates[J].IEEE Trans Pattern Analysis and Machine Intelligence, 2008, 15 (10) :1042-1052.

[2]Jian Yang, David Zhang.Two-Dimensional PCA:A New Approach toAppearance-Based Face Representation and Recognition.

[3]曹林, 王东峰, 邹谋炎.基于小波变换和隐马尔可夫模型的人脸识别方法[J].计算机工程与应用, 2005, 41 (7) :18-23.

[4]姜文翰, 周晓飞, 杨静宇.基于小波和最近邻凸包分类器的人脸识别.微计算机信息, 2008, 2 (1) :212-214.

[5]Rafael C Gonzalez, Richar E Woods, Steven LEddins.数字图像处理[M].电子工业出版社, 2005.

[6]徐倩, 邓伟.融合类别信息的二维主成分分析人脸识别算法.计算机工程与设计, 2008, 29 (22) :5792-5794.

二维码识别技术论文

二维码识别技术论文(精选8篇)二维码识别技术论文 第1篇关键词:二维码,识别技术,高校图书馆,图书借阅二维码技术是伴随着科技进步出现的...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部