模式识别专家系统范文
模式识别专家系统范文第1篇
人脸识别是指利用计算机分析人脸图像, 进而从中提取出有效的识别信息, 用来辨认身份的一门技术。人脸作为人类最重要的表达器官, 可以向我们提供重要的信息, 如性别、种族、情绪、年龄和性格等等, 因此人脸识别技术也就必然成为人机交互的重要手段。
在现代科学中, 人脸识别的研究已经成为众多学科中的热点问题, 计算机技术的发展为人脸识别技术的研究提供了高效的工具。使用计算机模拟人类大脑的认知过程和相关算法使得人脸识别技术才得以飞速发展, 并产生了一系列卓著的成果, 在社会各个方面得到了广泛应用, 如银行和军事重地的自动门禁系统和监视系统、用于公共安全的嫌疑人识别系统、以及电子商务的网络在线验证、计算机安全防护以及三维动画技术等等。
1 人脸识别在门禁系统应用的基本原理
作为生物特征识别技术的一个分支, 人脸识别技术在智能门禁系统中, 有着重要的应用。通过人脸识别系统的验证, 可以判断用户是否是可以进入, 大大增加重要场所的安全性。以2008年北京奥运会入场时采用的人脸识别系统为例。该系统事先获取入场券持有者的人脸照片, 并提取人脸特征, 然后将这些特征输入数据库。在入场券持有人进入现场时, 摄像头会对入场券持有者进行人脸图像采集, 并与数据库中的数据进行对比, 从而实现人脸身份识别。以保证场馆的安全。
人脸识别属于生物认证方式。人脸识别的优势在于其自然性和不被检测个体察觉的特点, 这是其他认证方法所无法比拟的。目前一个完整的人脸识别系统大体应该包括以下3个部分。
1.1 人脸检测 (Face detection)
人脸检测的主要任务是判断输入图像或视频序列中是否含有人脸。如果有, 则确定人脸的位置及大小。人脸检测是人脸识别系统实现自动化最为关键的一步。经过几十年的发展和研究, 人脸检测已经基本满足了系统要求。
1.2 特征提取 (Feature extraction)
特征提取是指从人脸图像中提取出用于区分不同个体的判别特征。要求提取的特征对于相同的人具有稳定性, 对于不同的人具有差异性。特征提取是人脸识别中最为重要的一个部分, 它的好坏直接决定最终的识别性能。
1.3 人脸分类 (Face classification)
人脸分类的主要任务是根据提取的待识别人脸的特征, 将其和数据库中的人脸图像进行比对, 确定其身份。该过程强烈依赖特征提取的性能。本文所提及的人脸识别主要包括) 人脸检测 (Face detection) , 特征提取 (Feature extraction) 及人脸分类 (Face classification) 。
2 人脸识别的主要技术
2.1 特征提取
人脸图像包含有极其丰富的模式特征, 包括轮廓特征 (椭圆轮廓) 、颜色特征 (发色、肤色等) 、直方图特征 (距离、分布等) 、结构特征 (对称性) 、投影特征、镶嵌图特征 (Mosaic规则) 等, 要对所有的这些人脸特征进行有效的筛选, 所选用的模式识别的依据的特征要最具有代表性和最有效的。人脸识别所要研究的关键问题就是选择出一种人脸特征用来做为人脸识别的依据, 然后利用所选定的人脸特征进行人脸识别。
总的来说, 我们可以将人脸特征划分为基于灰度特征的方法和基于肤色特征的方法两大类:前者利用的是人脸是与其它物体存在着本质区别的特征, 在人脸识别的领域是人们研究的重点;对于后者则比较适用于构造出快速的人脸检测与跟踪的算法。
2.2 灰度特征
灰度特征主要包括人脸灰度分布特征 (直方图特征、镶嵌图特征等) 、人脸轮廓特征、模板特征、器官特征 (对称性等) 等。嘴、鼻子、眼睛的区域作为人脸的主要核心区域, 其灰度分布特征是非常独特的;人脸的轮廓是头部的比较重要的特征;人脸的区域其自身灰度就可以做为一个模板特征, 一般采取只包含有嘴、鼻子和双眼的脸部的中心区域来做为人脸模板的共性特征, 将变化比较大的区域, 如脸颊两侧、头发等排除掉, 这种方法被广泛的用到了基于统计学的人脸识别的方法中。
2.3 肤色特征
人的肤色是人脸面部特征的重要信息, 它是一个独立的信息不依赖于脸部的其他细节特征, 在表情、旋转等不确定因素下都能适用, 相对来说稳定性比较高并且也可以区别于大部分背景物体的颜色, 所以在人脸的检测过程中肤色特征是最常用到的一种特征。利用肤色特征进行人脸识别主要对由肤色模型的描述, 哪一种形式的肤色模型的使用都紧密关联着选择何种色度空间, 所以影响测试性能的因素就是在不同的色度空间中“非肤色”与“肤色”区域相重叠的程度。
2.4 人脸识别算法
目前人脸识别的算法有很多不同的分类, 如果根据综合人脸特征时所采用的不同模型可以分为基于统计的方法和基于知识的方法;又从方法论的角度讲可以分为基于模板的方法、基于特征的方法和基于表象的方法。对于各种分类而言并没有绝对的界限, 并且在使用识别方法时将几种思想结合在一起的方法也是普遍存在的。
一些有代表性的人脸识别的方法主要有如下。
(1) 基于人工神经网络的方法。
基于人工神经网络的方法是仿效生物的处理模式, 也一种基于样本的学习方法, 这种方法着眼于脑部微观的网络结构, 是通过这些大量的神经元之间复杂的连接, 采取了由底到顶的方法, 是通过由非线性动力学、自组织和自学习所形成的并行分布的方式, 去处理一些难于语言化的人脸特征的模式信息, 然后去进行背景与人脸的分类从而得出人脸识别结果的一种智能化的信息处理方式。Rowley等人把神经网络的方法应用到了人脸识别的技术中并取得了非常大的进展和收获, 他们所采用学习的原理是自调整 (Bootstrap) 的方法, 对于分类器是一边测试, 一边训练, 并且把出现在测试过程中的错误进行分类而后将结果做为反例样本再加入到学习过程中, 这样就大大的减少了样本集的规模, 并且也逐渐的提高了神经网络方法的分类性能。基于人工神经网络的方法针对难以显式的描述和比较复杂的的模式, 有着其独特的优势, 不足之处就是计算量非常的大, 实现实时处理有些困难。
(2) 基于支持向量机 (SVM) 的方法。
由Vapnik等人提出的基于支持向量机 (SVM) 的方法就是基于结构的风险最小化原理 (SRM) 的一种统计学习理论, 主要是用来分类和回归问题, 这种方法的核心思想实际就是将有限的训练样本与学习机器相适应。基于支持向量机的方法是在线性可分的情况下从最优的分类面出发, 要使所得到的分类面不但分类间隔最大, 而且能使各类子样本正确的分开即训练的错误率为零, 使得VC (Vapnik Cherovnenkis) 维数的上限达到最小化, 这样的话, 与基于经验风险的最小化 (ERM) 的人工神经网的方法相比, SVM方法就会具有更好的推广性和泛化能力。支持向量基已经建立了一套很好的有限样本下的机器学习理论框架以及通用的方法, 既订立了严格的理论基础, 又可以很好的解决非线性、小样本、局部极小点和高维数等一些实际问题。
(3) 基于肤色特征的方法。
在颜色空间的分布中人脸的肤色分布相对来说是比较集中的, 采用这样的特点就可以检测出彩色图像中的人脸部分。基于肤色特征的方法其最大的优点就是对表情和姿态变化不是非常敏感, 相对的具有一定稳定性。
Rowley等使用高斯混合模型 (GMM, G aussianMixture Model) 来表示人脸肤色中R、G、B三个分量的统计分布, 通过对阈值的比较来判断所输入像素是否属于人脸的像素。Viola Paul设计出用肤色模型来表征人脸的颜色, 是利用感光模型对所输入图像进行修正和补偿, 且建立起人脸颜色的分类器, 并将其输出端做为神经网络的输入端来进行识别。
3 系统的软硬件实现
本文设计将前端视频采集和人脸检测功能在ARM上实现, 之后将图片发送到后台PC机中完成人脸识别过程。前端ARM板实现视频采集及人脸检测, 之后将归一化的人脸图片传入后台数据库进行人脸识别, 而人脸识别的核心部分, 如人脸识别分类器的训练、从海量人脸数据中进行人脸图片的检索、识别等均在后台完成。
图像采集设备采用网眼V2000, 具有CMOS感光元件, 640 (水平) *480 (垂直) 高分辨率, 35万万像素, USB接口, 它的特点是价格低, 体积小, 适于捕获近距离图像。硬件方面目前普遍认同的ARM920T核, 32位微处理器, 软件方面选择嵌入式Linux。
4 结语
本文介绍了介绍了人脸识别技术在智能门禁系统中的应用原理和主要技术特点, 并在这基础上搭建了一套能够满足要求的人脸辨识平台设备, 为进一步研究和实现做出了坚实的应用基础。
摘要:人脸识别技术作为模式识别技术之一, 在现代自动智能门禁控制系统中应用广泛。本文主要介绍了人脸识别技术的发展现状, 主要原理和技术特征, 并搭建了一套基于ARM处理器的人脸识别平台设备。
关键词:人脸识别,模式识别,门禁系统
参考文献
[1] 周杰, 卢春雨, 张长水, 等.人脸自动识别方法综述[J].电子学报, 2000, 28 (4) :102~106.
[2] 徐伟丹, 李宏汀, 葛列众.人脸认知研究综述[J].人类工效学, 2003, 9 (2) :33~3 6.
模式识别专家系统范文第2篇
一,文献综述报告
阅读至少5篇论文(最好包含1篇英文论文;自己去学校电子图书馆下载,考虑中国知网;IEEE,Elsevier等数据库),写一篇文献综述报告。
1. 选题不限,可以是任何一种模式识别算法(例如k-means,kNN,bayes,SVM,PCA,LDA等),阅读所选题方面的相关文献(论文都是关于一个主题的,例如都是svm算法方面的)。
2. 写一份文献综述报告,包括:每篇论文主要使用什么算法实现什么,论文有没有对算法做出改进(为什么改进,原算法存在什么问题,改进方法是什么),论文中做了什么对比试验,实验结论是什么?注意,尽量用自己的话总结,不要照抄原文。可以加入自己的分析和想法,例如这篇论文还存在什么问题或者缺点,这篇论文所作出的改进策略是否好,你自己对算法有没有什么改进的想法?
3. 把阅读的参考文献写在报告后面。(包括:作者;论文名称;期刊名称;出版年,卷号(期号),页码。例如:[1] 赵银娣,张良培,李平湘,一种纹理特征融合分类算法,武汉大学学报,信息科学版,2006,31(3):278-281. )
二、写一下学习这门课的心得体会(占分数)。
模式识别专家系统范文第3篇
一,文献综述报告
阅读至少5篇论文(最好包含1篇英文论文;自己去学校电子图书馆下载,考虑中国知网;IEEE,Elsevier等数据库),写一篇文献综述报告。
1. 选题不限,可以是任何一种模式识别算法(例如k-means,kNN,bayes,SVM,PCA,LDA等),阅读所选题方面的相关文献(论文都是关于一个主题的,例如都是svm算法方面的)。
2. 写一份文献综述报告,包括:每篇论文主要使用什么算法实现什么,论文有没有对算法做出改进(为什么改进,原算法存在什么问题,改进方法是什么),论文中做了什么对比试验,实验结论是什么?注意,尽量用自己的话总结,不要照抄原文。可以加入自己的分析和想法,例如这篇论文还存在什么问题或者缺点,这篇论文所作出的改进策略是否好,你自己对算法有没有什么改进的想法?
3. 把阅读的参考文献写在报告后面。(包括:作者;论文名称;期刊名称;出版年,卷号(期号),页码。例如:[1] 赵银娣,张良培,李平湘,一种纹理特征融合分类算法,武汉大学学报,信息科学版,2006,31(3):278-281. )
二、写一下学习这门课的心得体会(占分数)。
模式识别专家系统范文第4篇
谈起模式识别,我们首先想到的是人工智能。模式识别是人工智能的一个分支,是计算机应用内容的一部分。要想了解学习模式识别,首先要懂得人工智能。
第一篇 人工智能
什么是人工智能呢?人工智能主要用人工的方法和技术,模仿,延伸和扩展人的智能,实现机器智能。人工智能的长期目标是实现达到人类智力水平的人工智能。(摘自《人工智能》史忠植编著,第一章 绪论)
简单来说就是使机器拥有类人行为方法,类人思维方法和理性行为方法。让机器像人一样拥有自主思维的能力,拥有人的生存技能,甚至在某方面超过人类,用所拥有的技能,更好的为人类服务,解放人类的双手。
简单了解了人工智能的概念,接下来将介绍人工智能的起源与发展历史。说到历史,很多人可能有点不大相信。人类对智能机器的梦想和追求可以追溯到三千多年前。也许你会有疑问,三千多年前,人类文明发展都不算成熟,怎么可能会有人对机器有概念。当然,那时候的机器并非现在的机器概念。在我国,早在西周时代(公元前1066~公元前771年),就流传有关巧匠偃师献给周穆王艺伎的故事。东汉(公元25~公元220年)张衡发明的指南车是世界上最早的机器人雏形。(摘自《人工智能》史忠植编著,第一章 绪论)现在你也许已经笑掉大牙了。那样一个简易工具竟然说是机器人雏形。但是事实就是这样,现在对机器人的概念依旧模糊,有些人觉得机器人必须先有像人一样的外形。其次是有人一样的思维。这个描述是没有错的,但是有点片面了,只顾及到字面意思了。机器人的概念是自动执行工作的机器装置。所以机器可以自动执行工作都叫机器人。在国外也有案例:古希腊斯吉塔拉人亚里士多德(公元前384年~公元前322年)的《工具论》,为形式逻辑奠定了基础。布尔创立的逻辑代数系统,用符号语言描述了思维活动中推理的基本法则,被后世称为“布尔代数”。这些理论基础对人工智能的创立发挥了重要作用。(摘自《人工智能》史忠植编著,第一章 绪论)人工智能的发展历史,可大致分为孕育期,形成期,基于知识的系统,神经网络的复兴和智能体的兴起。具体时期的主要内容在此不必赘述。
人工智能究竟是研究什么的呢?知道了概念,起源,我想更想知道的应该是它对我们自己究竟有什么用。
人工智能是一门新兴的边缘科学,是自然科学和社会科学的交叉学科,它吸取了自然科学和社会科学的最新成果,以只能为核心,形成了具有自身研究特点的新的体系。人工智能的研究涉及广泛的领域,包括知识表示,搜索技术,机器学习,求解数据和知识不确定问题的各种方法等。人工智能的应用领域包括专家系统,博弈,定理证明,自然语言理解,图像理解和机器人等。人工智能也是一门综合性的学科,它是在控制论,信息论和系统论的基础上诞生的,涉及哲学,心理学,认知科学,计算机科学,数学以及各种工程学方法,这些学科为人工智能的研究提供了丰富的知识和研究方法。(摘自《人工智能》史忠植编著,第一章 绪论)具体内容为: 1.认知建模,人类的认知过程是非常复杂的,建立认知模型和技术常称为认知建模,目的是为了从某些方面探索和研究人的思维机制,特别是人的信息处理机制,同时也为设计相应的人工智能系统提供新的体系结构和技术方法;
2.知识表示,人类的智能活动过程主要是一个获得并运用知识的过程,知识是智能的基础。人们通过实践,认识到客观世界的规律性,经过加工整理,解释,挑选和改造而形成知识。为了使计算机具有智能功能,使它能模拟人类的智能行为,就必须使他具有适当形式表示的知识。知识表示是人工智能中一个十分重要的研究领域。
3.自动推理,从一个或几个已知的判断(前提)逻辑地推论出一个新的判断(结论)的思维形式称为推理,这是事物的客观联系在意识中的反映。自动推理是知识的使用过程,人解决问题就是利用以往的知识,通过推理得出结论。自动推理是人工智能研究的核心问题之一。
4.机器学习,机器学习是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。只有让计算机系统具有类似人的学习能力,才有可能实现人类水平的人工智能。机器学习是人工智能研究的核心问题之一,是当前人工智能理论研究和实际应用非常活跃的研究领域。
在人工智能研究方面,不仅仅有众多的类别,同时有不同的研究学派。其中有:符号主义学派,连接主义学派,行为主义学派。
符号主义学派,亦称为功能模拟学派。主要观点认为智能活动的基础是物理符号系统,思维过程是符号模式的处理过程。该学派指出:展现一般智能行为的物理系统其充要条件是它是一个物理符号系统。充分性表明智能可以通过任意合理组织的物理符号系统来得到。必要性表明一个由一般智能的主体必须是一个物理符号系统的一个实例。物理符号系统假设的必要性要求一个智能体,不管它是人,外星人还是计算机,都必须通过在符号结构上操作的物理实现来获得智能。
连接主义学派,亦称为结构模拟学派,基于神经元和神经网络的连接机制和学习算法。这种研究方法能够进行非程序的,可适应环境变化的,类似人类大脑风格的信息处理方法的本质和能力,这种学派的主要观点认为,大脑是一切智能活动的基础,因而从大脑神经元及其连接机制出发进行研究,搞清楚大脑的结构以及它进行信息处理的过程和机理,渴望揭示人类智能的奥秘,从而真正实现人类智能在机器上的模拟。
行为主义学派,亦称为模拟学派,认为智能行为的基础是“感知-行动”的反应机制。基于智能控制系统的理论,方法和技术,研究拟人的智能控制行为。
上述三种研究方法从不同的侧面研究了人的自然智能,与人脑的思维模型有着对应的关系。粗略额的划分,可以认为符号主义研究抽象思维,连接主义研究形象思维,而行为主义研究感知思维。研究人工智能的三大学派,三条途径各有所长,要取长补短,综合集成。
最为重要的莫过于人工智能的应用,当前,几乎所有的科学与技术的分支都在共享着人工智能领域所提供的理论和技术。在这里将列举一些人工智能经典的,有代表性和有重要影响的应用领域。
1.专家系统
专家系统是一类具有专门知识和经验的计算机智能程序系统通过对人类专家的问题求解能力的建模,采用人工智能中的知识表示和知识推理技术来模拟通常有专家才能解决的复杂问题,达到具有与专家同等解决问题能力的水平。(摘自《人工智能》史忠植编著,第一章 绪论)
2.数据挖掘
数据挖掘是人工智能领域中一个令人激动的成功应用它能够满足人们从大量数据中挖掘出隐含的,未知的,有潜在价值的信息和知识的要求。对数据而言,在他的特定工作或生活环境里,自动发现隐藏在数据内部的,可被利用的信息和知识。要实现这些目标,需要有大量的原始数据,明确的挖掘目标,相应的领域知识,友善的人-机界面,以及寻找合适的开发方式。挖掘结果共数据拥有者决策使用,必须得到拥有者的支持,认可和参与。(摘自《人工智能》史忠植编著,第一章
绪论)
3.自然语言处理
自然语言处理研究计算机通过人类熟悉的自然语言与用户进行听,说,读,写,等交流技术,是一门与语言学,计算机科学,数学,心理学和声学等学科相联系的交叉性学科。自然语言处理研究内容主要包括:语言计算(语音与音位,词法,句法,语义和语用等各个层面上的计算),语言资源建设(计算机词汇学,术语学,电子词典,语料库和知识本体等),机器翻译或机器辅助翻译,汉语和少数民族语言文字输入输出及其只能处理,中文手写和印刷体识别,中文语音识别及文语转换,信息检索,信息抽取与过滤,文本分类,中文搜索引擎和以自然语言为枢纽的多媒体检索等。
4.智能机器人
智能机器人是一种自动化时代的机器,具有相当大的“大脑”,具备一些人或生物相似的智能能力,如感知能力,规划能力,动作能力和协同能力,是一种具有高度灵活性的自动化机器。随着人们对机器人技术智能化本质的认识的加深,机器人技术开始向人类活动的各个领域渗透。结合这些领域的应用特点,人们发展了各式各样的具有感知,决策,行动和交互能力的特种机器人和各种智能机器。(摘自《人工智能》史忠植编著,第一章 绪论)
5.模式识别
模式识别是指对表征事物或现象的各种形式的信息进行处理和分析,以便对事物或现象进行描述,辨认,分类和解释过程。模式是信息赖以存在和传递形式,诸如波普信号,图形,文字,物体的形状,行为的方式和过程的状态等都属于模式的范畴。人们通过模式感知外部世界的各种事物或现象,这是获取知识,形成概念和作出反应的基础。(摘自《人工智能》史忠植编著,第一章 绪论)
6.分布式人工智能
分布式人工智能研究一组分布的,松散耦合的智能体如何运用他们的知识,技能和信息,为实现各自的或全局的目标协同工作。20世纪90年代以来,互联网的迅速发展为新的信息系统,决策系统和知识系统的发展提供了极好的条件,它们在规模,范围和复杂程度上增加极快,分布式人工智能技术的开发与应用越来越成为这些系统成功的关键。(摘自《人工智能》史忠植编著,第一章 绪论)
7.互联网智能
如果说计算机的出现为人工智能的实现提供了物质基础,那么互联网的产生和发展则成为人工智能提供了更加广阔的空间,成为当今人类社会信息化的标志。互联网已经成为越来越多的“数字图书馆”,人们普遍使用Google,百度等搜索引擎,为自己的日常工作和生活服务。(摘自《人工智能》史忠植编著,第一章 绪论)
8.博弈
博弈是人类社会和自然界中普遍存在的一种现象,如下棋,打牌,战争等。博弈的双方可以是个人,群体,也可以是生物群或智能机器,各方都力图用自己的智慧获取成功或击败对方。博弈过程可能产生惊人庞大的搜索空间。要搜索这些庞大而且复杂的空间需要使用强大的技术来判断备择状态,探索问题空间,这些技术被称为启发式搜索。博弈为人工智能提供了一个很好的实验场所,可以对人工智能的技术进行检验,以促进这些技术的发展。(摘自《人工智能》史忠植编著,第一章 绪论)
人工智能大的方面介绍暂且到此为止。接下来重点介绍模式识别技术。
第二篇 模式识别
模式识别已经成为当代高科技研究的重要领域之一,它已发展成为一门独立的新科学。模式识别技术迅速扩展,已经应用在人工智能,机器人,系统控制,遥感数据分析,生物医学工程,军事目标识别等领域,几乎遍及各个学科领域,在国民经济,国防建设,社会发展的各个方面得到广泛应用,产生了深远的影响。像前一篇一样我们先来介绍模式识别的概念。
模式识别就是机器识别,计算机识别或机器自动识别,目的在于让机器自动识别事物。(摘自《模式识别与智能计算MATLAB著 第1章 模式识别概述 )
技术实现》杨淑莹识别是对各种事物或现象的分析,描述,判断。模式识别是指在某些一定量度或观测基础上,把待识别模式划分到各自的模式中去,即根据模式的特性,将其判断为某一类。(摘自《模式识别技术及其应用》杨帮华著 第1章 模式识别简介 )
例如手写数字的识别,结果就是将手写的数字分到具体的数字类别中;智能交通管理系统的识别,就是判断是否有汽车闯红灯,闯红灯的汽车车牌号码;还有文字识别,语音识别,图像中物体识别,等等。该学科研究的内容是使机器能做以前只能由人类才能做的事,具备人所具有对各种事物与现象进行分析,描述与判断的部分能力。模式识别是直观的,无所不在的,实际上人类在日常生活的每个环节,都从事着模式识别的活动。人和动物较用意做到的模式识别,但对计算机来说确实非常困难的。让机器能识别,分类,就需要研究识别的方法,这就是这门科学的任务。
模式识别的基本组成: (1)数据获取;
用计算机可以运算的符号来表示所研究的对象,这些可表示的符号包括:二维图像,如文字,指纹,地图,照片等;一维波形,如脑电图,心电图,机械振动波形等;物理参量和逻辑值,如体温,化验数据,参量正常与否的描述。
(2)预处理;
去除信号中噪声,提取有用信息,使信息纯化,或者是对输入测量仪器或其他因素所造成的退化现象进行复原。预处理这个环节内容很广泛,与要解决的具体问题有关,例如,从图像中汽车车牌的号码识别出来,就需要先将车牌从图像中找出来,再对车牌进行划分,将每个数字分别划分开。
(3)特征提取和选择;
要对预处理信号进行交换,得到最能反映分类本质的特征。同时,对特征进行必要的降维处理,将维数较高的测量空间转换到维数较低的特征空间,对所获取的信息实现从测量空间到特征空间的转换。
(4)分类器设计和决策。
分类器设计是指依据特定空间分布,设计及决定分类器的具体参数。主要是指对输入的训练样本,进行预处理,特征提取及选择,在样本训练基础上,确定某判决规划规则或判决函数,使得按这种规则对被识别对象进行分类,所造成的错误识别率最小或引起的损失最小,在设计阶段判决函数需要多次反复进行,直到误差达到一定条件。分类决策是指依据分类器设计阶段建立的预处理,特征提取与选择及判决函数模型,对获取的未知样本数据进行分类识别,把被识别对象归为某一类,输出分类结果
模式识别的特点:
(1)模式识别是用机器模仿大脑的识别过程,设计很大的数据集合,并自动地以高速度做出决策。
(2)模式识别不像纯数学,而是抽象加上实验的一个领域。他的这个性质常常导致不平凡的和比较成效的应用,而应用又促进进一步的研究和发展。由于它和应用的关系密切,因此它又被认为是一门工程学科。
(3)学习(自适应性)是模式识别的一个重要的过程和标志。但是,编制学习程序比较困难,而有效地消除这种程度中的错误更难,因为这种程序是有智能的。
(4)同人的能力相比,现有的模式识别能力仍然是相当薄弱的(对图案和颜色的识别除外),机器通常不能应付大多数困难问题。采用交互式别法可以在较大程度上克服这一困难,当机器不能做出一个可靠的决策时,它可以求助于操作人。(摘自《模式识别技术及其应用》杨帮华著 第1章 模式识别简介 )
模式识别的主要方法: 1.统计决策法
(1)参数方法。主要以贝叶斯决策准则为指导。其中最小错误率和最小风险贝叶斯决策是最常用的两种方法。
(2)非参数方法。沿参数方法这条路走就要设法获取样本统计分布的资料,要知道先验概率,类分布概率密度函数等。然而在样本数目不足条件下要获取准确的统计也是困难的。这样一来人们考虑走另一条道路,即根据训练样本集提供的信息,直接进行分类器设计。这种方法绕过统计分布状况的分析和参数估计,而企图对特征空间实行划分,称为非参数判别分类法,即不依赖统计参数的分类法。这是当前模式识别中主要使用的方法,并且涉及人工神经元网络与统计学习理论等多方面。 2.结构模式识别
结构模式识别是利用模式的结构描述与句法描述之间的相似性对模式进行分类。每个模式由它的各个子部分(称为子模式或模式基元)的组合来表示。对模式的识别常以句法分析的方式进行,即依据给定的一组句法规则来剖析模式的结构。当模式中每一个基元被辨认后,识别过程就可通过执行语法分析来实现。选择合适的基元是结构模式识别的关键。 3.模糊模式识别
所谓的模糊模式识别就是解决模式识别问题时引入模糊逻辑的方法或思想。同一般的模式识别方法相比较,模糊模式识别具有客体信息表达更加合理,信息利用充分,各种算法简单灵巧,识别稳定性好,推理能力强的特点。 4.人工神经网络模式识别
模拟动物神经系统的某些功能,采用软件或硬件的办法,建立了许多以大量处理单元为结点,处理单元间实现(加权值的)互联的拓扑网络,进行模拟,称之为人工神经网络。这种方法可以看作是对原始特征空间进行非线性变换,产生一个新的样本空间,使得变换后的特征线性可分。同传统统计方法相比,其分类器是与概率分布无关的。人工神经网络的主要特点在于其具有信息处理的并行性,自组织和自适应性,具有很强的学习能力和联想功能以及容错性能等,在解决一些复杂的模式识别问题中显示出其独特的优势。 模式识别的典型应用和发展: 1.文字识别
目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种。其中人工键入速度慢而且劳动强度大;自动输入又分为汉字识别输入及语音识别输入。从识别技术的难度来说,手写识别的难度高于印刷体识别,而在手写识别中,脱机手写体的难度又远远超过了联机手写识别。到目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。 2.语音识别
语音识别技术所涉及的领域包括信号处理,模式识别,概率论和信息论,发声机理和听觉机理,人工智能等。 3.指纹识别
指纹识别的方法有很多,大致可以分为四类:基于神经网路地方法,基于奇异点的方法,语法分析地方法和其他方法。 4.细胞识别
基于图像区域特征,利用计算机技术对显微细胞图像进行自动识别越来越受到大家的关注,并且现在也获得了不错的效果。 5.医学诊断
在癌细胞检测,X射线照片分析,血液化验,血液分析,染色体分析,心电图诊断和脑电图诊断等方面,模式识别已取得了成效。 6.军用目的的自动识别 如雷达探测目标的自动识别,自动跟踪,卫星照片的自动识别等。 7.生物认证技术
生物认证技术是21世纪最受关注的安全认证技术之一,它的发展是大势所趋。人们愿意忘掉所有的密码,扔掉所有的磁卡, 凭借自身的唯一性标识身份与保密。 8.数字水印技术
IDC预测,数字水印技术在未来的5年内全球市场规模超过80亿美元.
模式识别的发展,模式识别是一个交叉,综合的科学技术领域,不仅与其他信息学科而且还包括数理科学,生命科学,地球科学,工程与材料科学,管理科学,环境科学的相互作用和渗透越来越高,其科学界限很可能随着发展而逐渐模糊。其发展离不开应用和工程,离不开国家目标。因此,其科学技术内涵与外延应该与时俱进,更新和扩展,研究的方向与内容应该更具有综合性,交叉性,更强调国家目标的实现,解决国家急需的重大问题,重大关键技术攻关和社会发展中的科学技术难题和基础理论问题。
模式识别从20世纪20年代发展至今,人们的一种普遍看法是不存在对所有模式识别问题都适用的单一模型和解决问题的单一技术,我们现在拥有的只是一个工具袋,所要做的是结合具体问题把统计的和句法的识别结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把人工神经网络与各种已有技术以及人工智能中的专家系统,不确定推理方法结合起来,深入掌握各种工具的效能和应有的可能性,互相取长补短,开创模式识别应用的新局面。
模式识别专家系统范文第5篇
模式识别与智能系统是二十世纪八十年代发展起来的新型交叉学科,该学科包含自动控制、模式识别、人工智能、模糊逻辑、仿生学和计算机科学等多种学科。该学科以信息处理与模式识别的理论技术为核心,探索对各种信息进行处理、分类、理解,并在此基础上构造出具有某些智能特性的系统或装置的方法、途径与实现。该学科在经济建设和国防建设具有广泛的实际背景,二十多年来,已引起了国内外有关学者的极大重视,被称其为面向二十一世纪的控制科学。
本学科点开始于我校省级重点学科计算机应用学科,从该学科人工智能方向发展而来。最早的团队可以追溯到二十世纪八十年初,从承担航空基金立体仓库机器人开始。经过近三十年的发展,该学科逐步形成了稳定的研究方向,于2003年从计算机应用学科独立出来,成为独立的学科,2005年获得“模式识别与智能系统”硕士学位授予权。主要研究方向包括:神经网络与模式识别、图象处理与模式识别、智能机器人与人工智能和智能检测与智能控制等。当前正在筹建“自主武器技术平台研究中心”,这是目前我省唯一一所高等院校首次建立的平台研究中心,中心下设6个实验室分别为飞行器仿真与模拟技术实验室、智能机器人与目标探测技术实验室、综合健康管理技术实验室、任务设备检测技术实验室、武器应用环境仿真实验室和导弹实验室,其中,导弹实验室近2-3年内投资200万多万元,购置了3枚导弹等,实验室已初具规模。本学科主要关注与武器平台自主运行有关的技术,即主要关注:自主控制、环境感知、导航制导、保障与健康管理、电源、部分任务的关键技术研究和工程验证研究,逐步发展对平台总体设计、搭载任务武器等技术研究和工程验证。本学科具有一定师资力量基础,现拥有双聘院士1人,博士生导师5人(外校兼职,本学科点没有博士授予权),硕士生导师9人,教授12人,副教授16名,其中,具有博士学位的教师有20名。目前本学科点已培养硕士研究生10多名,学科梯队结构合理,整体实力强。
模式识别专家系统范文第6篇
监督学习方法用来对数据实现分类,分类规则通过训练获得。该训练集由带分类号的数据集组成,因此监督学习方法的训练过程是离线的。
非监督学习方法不需要单独的离线训练过程,也没有带分类号(标号)的训练数据集,一般用来对数据集进行分析,如聚类,确定其分布的主分量等。
(实例:道路图)就道路图像的分割而言,监督学习方法则先在训练用图像中获取道路象素与非道路象素集,进行分类器设计,然后用所设计的分类器对道路图像进行分割。
使用非监督学习方法,则依据道路路面象素与非道路象素之间的聚类分析进行聚类运算,以实现道路图像的分割。
1、写出K-均值聚类算法的基本步骤, 算法:
第一步:选K个初始聚类中心,z1(1),z2(1),,zK(1),其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定,例如可选开始的K个模式样本的向量值作为初始聚类中心。 第二步:逐个将需分类的模式样本{x}按最小距离准则分配给K个聚类中心中的某一个zj(1)。 假设i=j时,Dj(k)min{xzi(k),i1,2,K},则xSj(k),其中k为迭代运算的次序号,第一次迭代k=1,Sj表示第j个聚类,其聚类中心为zj。 第三步:计算各个聚类中心的新的向量值,zj(k+1),j=1,2,,K zj(k1)1NjxSj(k)x,j1,2,,K 求各聚类域中所包含样本的均值向量:
其中Nj为第j个聚类域Sj中所包含的样本个数。以均值向量作为新的聚类中心,
JjxSj(k)xzj(k1),2j1,2,,K可使如下聚类准则函数最小:
在这一步中要分别计算K个聚类中的样本均值向量,所以称之为K-均值算法。 第四步:若zj(k若zj(k 1)zj(k),j=1,2,,K,则返回第二步,将模式样本逐个重新分类,重复迭代运算;
1)zj(k),j=1,2,,K,则算法收敛,计算结束。
T线性分类器三种最优准则:
wSFisher准则:maxJ(w)wSwFTbwww根据两类样本一般类内密集, 类间分离的特点,寻找线性分类器最佳的法线向量方向,使两类样本在该方向上的投影满足类内尽可能密集,类间尽可能分开。该种度量通过类内离散矩阵Sw和类间离散矩阵Sb实现。感知准则函数:准则函数以使错分类样本到分界面距离之和最小为原则。其优点是通过错分类样本提供的信息对分类器函数进行修正,这种准则是人工神经元网络多层感知器的基础。支持向量机:基本思想是在两类线性可分条件下,所设计的分类器界面使两类之间的间隔为最大, 它的基本出发点是使期望泛化风险尽可能小。
写出两类和多类情况下最小风险贝叶斯决策判别函数和决策面方程。
什么是特征选择?. 什么是Fisher线性判别?
答:1. 特征选择就是从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的。
2. Fisher线性判别:可以考虑把d维空间的样本投影到一条直线上,形成一维空间,即把维数压缩到一维,这在数学上容易办到,然而,即使样本在d维空间里形成若干紧凑的互相分得开的集群,如果把它们投影到一条任意的直线上,也可能使得几类样本混在一起而变得无法识别。但是在一般情况下,总可以找到某个方向,使得在这个方向的直线上,样本的投影能分开得最好。问题是如何根据实际情况找到这条最好的、最易于分类的投影线,这就是Fisher算法所要解决的基本问题。
请论述模式识别系统的主要组成部分及其设计流程,并简述各组成部分中常用方法的主要思想。 信息获取:通过测量、采样和量化,可以用矩阵或向量表示二维图像或以为波形。预处理:去除噪声,加强有用的信息,并对输入测量仪器或其他因素造成的退化现象进行复原。特征选择和提取:为了有效地实现分类识别,就要对原始数据进行变换,得到最能反映分类本质的特征。分类决策:在特征空间中用统计方法把识别对象归为某一类。
定性说明基于参数方法和非参数方法的概率密度估计有什么区别?
答:基于参数方法:是由已知类别的样本集对总体分布的某些参数进行统计推断 非参数方法:已知样本所属类别,但未知总体概率密度函数形式 简述支持向量机的基本思想。
答:SVM从线性可分情况下的最优分类面发展而来。最优分类面就是要求分类线不但能将两类正确分开(训练错误率为0),且使分类间隔最大。SVM考虑寻找一个满足分类要求的超平面,并且使训练集中的点距离分类面尽可能的远,也就是寻找一个分类面使它两侧的空白区域(margin)最大。过两类样本中离分类面最近的点,且平行于最优分类面的超平面上H1,H2的训练样本就叫支持向量。
(1)贝叶斯估计算法思想:准则,求解过程
(A)准则:通过对第i类学习样本X的观察,使概率密度分布P(X/θ)转化为 后验概率P(θ/X) ,再求贝叶斯估计;
(B)求解过程: ① 确定θ的先验分布P(θ),待估参数为随机变量。
② 用第i类样本x=(x1, x2,. xN)求出样本的联合概率密度分布P(x|θ),它是θ的函数。
i
T
ii
i
i
P(|X) ③ 利用贝叶斯公式,求θ的后验概率
iP(Xi|).P()
P(Xi|)P()d ④ 求贝叶斯估计P(|Xi)d
2、模式识别系统的基本构成单元包括: 模式采集 、 特征提取与选择 和 模式分类 。
3、统计模式识别中描述模式的方法一般使用 特真矢量 ;句法模式识别中模式描述方法一般有 串 、
树 、 网 。
4、聚类分析算法属于 无监督分类
;判别域代数界面方程法属于统计模式识别方法 。
5、若描述模式的特征量为0-1二值特征量,则一般采用 匹配测度 进行相似性度量。
6、下列函数可以作为聚类分析中的准则函数的有
、、、、、、
7、Fisher线性判别函数的求解过程是将N维特征矢量投影在 一维空间 中进行 。
8、下列判别域界面方程法中只适用于线性可分情况的算法有 感知器算法 ;线性可分、不可分都适用的有
积累位势函数法 。
9、影响层次聚类算法结果的主要因素有( 计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数目))。
10、欧式距离具有(平移不变性、旋转不变性);马式距离具有(平移不变性、旋转不变性尺度缩放不变性、不受量纲影响的特性)。
11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距离。)
12、积累势函数法较之于H-K算法的优点是(该方法可用于非线性可分情况(也可用于线性可分情况)
K(x)位势函数K(x,xk)与积累位势函数K(x)的
~xkXkK(x,xk)
13、在统计模式分类问题中,聂曼-皮尔逊判决准则主要用于( 某一种判决错误较另一种判决错误更为重要)情况;最小最大判决准则主要用于( 先验概率未知的)情况。
14、特征选择的主要目的是(从n个特征中选出最有利于分类的的m个特征(m>n )的条件下,可以使用分支定界法以减少计
m算量。
15、散度Jij越大,说明i类模式与j类模式的分布(差别越大);当i类模式与j类模式的分布相同时,Jij=(0)。
16、影响聚类算法结果的主要因素有(②分类准则 ③特征选取 ④模式相似性测度。)。
19、模式识别中,马式距离较之于欧式距离的优点是(③尺度不变性 ④考虑了模式的分布)。 20、基于二次准则函数的H-K算法较之于感知器算法的优点是(①可以判别问题是否线性可分 ③其解的适应性更好)。
21、影响基本C均值算法的主要因素有(④初始类心的选取 ①样本输入顺序 ②模式相似性测度)。
22、位势函数法的积累势函数K(x)的作用相当于Bayes判决中的(②后验概率 ④类概率密度与先验概率的乘积)。
23、统计模式分类问题中,当先验概率未知时,可使用(②最小最大损失准则 ④N-P判决)
24、在(①Cn>>n,(n为原特征个数,d为要选出的特征个数)③选用的可分性判据J对特征数目单调不减)情况下,用分支定界法做特征选择计算量相对较少。
25、 散度JD是根据(③类概率密度)构造的可分性判据。
26、似然函数的概型已知且为单峰,则可用(①矩估计②最大似然估计③Bayes估计 ④Bayes学习⑤Parzen窗法)估计该似然函数。
27、Kn近邻元法较之Parzen窗法的优点是(②稳定性较好)。
28、从分类的角度讲,用DKLT做特征提取主要利用了DKLT的性质:(①变换产生的新分量正交或不相关③使变换后的矢量能量更趋集中)。
29、一般,剪辑k-NN最近邻方法在(①样本数较大)的情况下效果较好。 d
29、如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主要因素有(②分类准则 ③特征选取)。 30、假设在某个地区细胞识别中正常(w1)和异常(w2)两类先验概率分别为 P(w1)=0.9,P(w2)=0.1,现有一待识别的细胞,其观察值为x,从类条件概率密度分布曲线上查得P(xw1)0.2,P(xw2)0.4,并且已知110,126,211,220
模式识别专家系统范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。