LM算法论文范文
LM算法论文范文(精选7篇)
LM算法论文 第1篇
众所周知, 在遥感影像成像的过程中由于受到诸多因素的影响, 使得获取影像产生不同程度的几何变形而与真实地面情况失真, 因此几何校正是遥感影像应用的必要流程。目前几何校正的方法, 可分为传感器严格物理模型和通用成像模型两类。基于共线方程的传感器严格物理模型考虑了成像时造成影像变形的物理意义, 模型的定位精度较高[1,2]。
在严格物理模型中, 由于旋转矩阵的存在, 造成共线方程非线性。非线性方程的解法是先进行线性化, 然后通过迭代求解。LM (Levenberg-Marquardt) 算法是目前应用最广泛的解非线性方程的迭代算法, 由于它结合了梯度下降法和高斯牛顿法的优点, 迭代速度快而且能够克服模型求解过程中的病态性, 得到模型的最优解。然而LM算法由于采用最小二乘估计作为收敛条件从而不能抵御观测数据中粗差的干扰, 在遥感影像校正控制点选取 (尤其是控制点的自动识别) 的过程中难免出现粗差, 若直接应用LM算法解算, 则会使得求解出的模型偏离其真实值, 造成校正后的影像局部或者是整体出现变形。
1 严密传感器模型
严密传感器模型的基础是共线方程, 其建立实质上是通过一系列的坐标变换确定像点的像空间辅助坐标, 从而建立起点的影像坐标与大地坐标的数学关系。尽管各种影像采用的坐标系定义及其相关转换参数各不相同, 但基本原理是相近的[3]。一般情况下, 以扫描行方向为x方向, 飞行方向为y方向, 设第i扫描行的外方位元素为XSi, YSi, ZSi, φi, ωi, кi, 则瞬时构像方程为[2]:
式 (1) 中, X, Y, Z为地面点的空间坐标, λ为比例因子, 是由第i扫描行外方位角元素φi, ωi, кi构成的旋转矩阵, 可以表示为 (2) 式。正是由于旋转矩阵Mi的存在, 造成了严格物理模型的非线性。
由于卫星平台的轨道运动相对平稳, 投影中心的空间位置和传感器姿态角在成像周期内保持稳定的变化, 可以近似认为外方位元素随时间成线性变化, 设其一阶变化率为V=[vxvyvzvφvωvк]T, 则各扫描行的外方位元素可表示为:
(3) 式中, L0=[X0Y0Z0φ0ω0к0]T为中心扫描行的外方位元素常量, t为第i行的星历时间。严格物理模型校正的待求参数即是L0和V0的改正数, 对于不同的传感器可以选用不同的参数进行校正。
2 Levenberg-Marquardt (LM) 算法
Levenberg-Marquardt算法是应用最广泛的优化算法之一, 由Levenberg (1944) 提出, 并由Marquardt (1963) 重新发现的[4]。它继承了梯度下降法的全局搜索特性, 同时具有高斯牛顿法的局部快速收敛的特性, 并克服了牛顿法不能有效处理奇异和非正定矩阵的弱点。由于LM算法利用了近似的二阶导数信息, 它比梯度法快得多[4,5]。
若有非线性误差方程:
V=f (X) -L。
设X (k) 表示第k次迭代的解向量, 则迭代求解的规则如下[4]:
(4) 式中S (k) 表示误差指标函数, 其Hessian矩阵为梯度向量为
高斯-牛顿法采用最小二乘估计, 其误差指标函数为[6]:
(5) 式中V为误差向量。第k次计算的ΔX为:
J为S的Jacobian矩阵。
LM算法是一种改进的高斯-牛顿法, 它的形式为[7]:
(7) 式中阻尼系数μ>0, 为适当选取的常数, I是单位矩阵。
从 (4) 式可看出, LM算法实际上是梯度下降法和高斯-牛顿法的结合。当阻尼系数μ=0时, 为高斯-牛顿法;当μ取值很大, 则LM算法接近梯度下降法。当μ足够大时, 总可以保证[JT (x) J (x) +μI]-1是正定的, 从而保证其可逆, 因此LM算法求解病态的模型有着很好的稳健性[4]。对于LM算法的阻尼系数μ, 本文试验选用文献[8]中给出的μ=JT (x) V (x) , 文献[8]已经证明了其收敛性。
3 抗差LM算法
3.1 LM算法中添加权
从严密传感器模型的建立可以看出, 其模型求解实际上是一个非线性拟合同时推求参数的过程。由式 (5) 、式 (7) 可知, 由于采用最小二乘估计, 当残差向量V含有粗差时, S (k) 和ΔX将偏离其真实值。由此可见, LM算法不具有抗差能力。为了抵消观测值粗差对模型解的影响, 本文尝试参照等价权原理, 在 (6) 式中加入权P, 得到LM算法的抗差解。即将其误差指标函数修改为:
得到相应的抗差解:
(9) 式中P为残差V的等价权。
3.2权函数的选定
权P是残差V的函数, 可由V适当的近似值确定。一般采用抗差能力强的模型进行前期平差得到V的初始值, 必要时可进行几步迭代[9]。由于采用迭代求解, LM算法本身具有一定的稳健性, 当模型待求参数初值与真值差距不大时, 可以采用其前期计算一次残差, 然后利用该残差定权。现代抗差估计的原则, 是将随机误差的分布分为保权区、降权区和淘汰区三个部分。在保权区, 观测值的权为1, 保持不变;在降权区, 使观测值的权以误差递增的斜率的倒数作为新的权值;在淘汰区, 观测值的权值修正为0。常见的权函数有绝对和极小法、Tukey双权法、Huber法和Hampel法等几种。本文采用抗差性相对较好而且算法简单的Hampel法, 其权函数如下:
(10) 式中:, MAD为残差中位数。对于 (10) 式中分段函数边界值, 本文参考文献[10]选取a=2, b=3.6, c=8。
4 试验及结果分析
4.1试验一:抗差LM算法应用于Landsat5影像严格物理模型
试验一选用福建地区一景30米分辨率的Landsat5多光谱数据, 采用TM地图投影。参考影像为相同地区不同时相的一景经过正射校正的Landsat5影像, 分辨率为30m。
实验中使用ERDAS 9.0中的AutoSync模块自动搜索控制点。AutoSync是ERDASIMAGINE 9.0一个新增加的模块, 其第一个工作流程是导入潜在差异的两张或更多的影像, 在重叠的影像上自动地产生若干个同名点, 所匹配的控制点几何精度非常高[11]。在匹配成功的数百个控制点中, 选择在图像上均匀分布的30个控制点用于校正, 另外选择了20个检查点以检验模型的可靠性。分别采用了商业遥感软件PCI和本文所介绍的抗差LM算法进行了正射校正, 表1给出了PCI和抗差LM算法校正的精度。
可以明显看出, 应用抗差的LM算法计算出的Landsat5物理模型, 其在各个方向的RMS均小于1个像素的距离, 达到了正射校正的精度要求。当向控制点集合中添加一个粗差点 (差值为1010pixel) 时, 所得结果如表2所示。当存在粗差时, PCI的残差中误差比较大, 这时候需要对控制点进行人工剔除, 而抗差LM算法无需人工干预, 仍能保持结果的精度。
4.2试验二:抗差LM算法应用于SPOT 5影像严格物理模型
4.2.1实验方法及步骤
为了进一步验证抗差LM算法的抗差性, 需要将LM算法得到的模型参数与真值进行比较。然而从统计学的角度讲, 带有随机误差的样本无法得到所要估计的模型参数的真值。因此本试验采用这样的方法:首先以真实选取的控制点组G0 (实际控制点) 用LM方法计算出一组参数X0;假定X0是真值, 利用这个真值模型生成一组新的控制点G1 (模拟控制点) , 对于真值X0来说, G1可以认为没有残差;在G1中人为添加粗差, 再以G1重新求算参数, 得到新的参数解X;将得到的X与X0相比较。
实验采用北京地区一景10m分辨率的SPOT5影像, 采用UTM地图投影, 参考影像为相同地区TM影像。在metadata.dim文件中, 包含了卫星摄影站中心在WGS84下的外方位元素及其变化率等初值信息。利用初值信息可以获取相当于地面上50米的定位精度。但这显然不能满足正射校正的需要, 需要利用控制点进行模型的优化。SPOT5官方指出, 外方位角元素的不精确是造成定位误差的主要原因[12]。因此我们选取的未知数为:影像中心点外方位角元素改正数Δφ、Δω、Δκ, 外方位角元素一阶变化率改正数Δvφ、Δvω、Δvκ, 以及焦距Δf。10m SPOT5影像行列数均为6 000, 实验中利用由实测控制点计算出的模型正向计算了36 (66) 个模拟的控制点。控制点间的间距为1 000个像素, 以保证其均匀分布。
4.2.2实验结果及分析
(1) 模拟控制点中不添加粗差
模拟控制点中不添加粗差, 主要是为了验证LM算法其本身的回归能力
由表3和图1可以看出, 在控制点充足的情况下, 无论是普通的LM算法还是抗差LM算法, 所获取的参数与参数真值非常接近, 能够很好的拟合出原有的模型, 具有很强的非线性拟合能力。
(2) 向模拟控制点中添加粗差
在1号模拟控制点的图上坐标中添加大小为 (5, 0) 的粗差, 对比普通的LM算法与抗差LM算法所获参数之间的差别。
由表4和图2可以明显的看出, 当控制点集合中存在粗差时, 抗差LM算法得出的解要优于普通LM算法。当控制点集合中存在粗差的情况下, 即便粗差的量并不是很大 (5pixel) , 它对普通LM算法的拟合都会产生剧烈的影响, 所得到的模型偏离真实模型。而抗差LM算法能够抑制粗差点对模型的影响, 得到更接近真值的解。
由表5可以看到, 粗差点1号点的权被降为0, 同时部分精确控制点的权也被降低了。这说明使用抗差LM算法会损失部分的控制点信息。因此抗差LM算法适用于控制点 (多余观测量) 比较多的情况。
LM算法应用于遥感影像的严格物理模型校正过程中能够得到非常精确的正射产品。抗差LM算法能够有效的消除粗差点对模型的影响, 使得在一定精度要求下, 控制点的自动匹配及区域平差中同名点的自动选取等技术可以应用于校正过程中, 对遥感影像的自动快速处理的实现有重要的意义。
参考文献
[1]梅安新, 彭望琭, 秦其明, 等.遥感导论.北京:高等教育出版社.2001
[2]张永生, 巩丹超.高分辨率遥感卫星应用.北京:科学出版社.2004
[3]袁修孝, 余俊鹏.高分辨率卫星遥感影像的姿态角常差检校.测绘学报, 2008;37 (1) :36—41
[4]伏燕军, 杨坤涛, 邹文栋, 等.基于Levenberg—Marquardt算法的图像拼接.激光杂志.2007;28 (5) :46—48
[5]赵弘, 周瑞祥, 林廷圻.基于Levenberg-Marquardt算法的神经网络监督控制.西安交通大学学报, 2002;36 (5) :523—527
[6]Teukolsky S A, Vetterling W T, Flannery B P.Numerical recipes in C.Cambridge University Press, 1992
[7]Marquardt D W.An algorithm for least-squares estimation of nonlin-ear in equalities.SIAMJ Appl Math, 1963;11 (2) :431—441
[8]杨柳, 陈艳萍.一种新的Levenberg-Marquardt算法的收敛性.计算数学, 2005;27 (1) :56—62
[9]周江文, 黄幼才, 杨元喜, 等.抗差最小二乘法.武汉:华中理工大学出版社, 1997
[10]李浩军, 唐诗华, 黄杰.抗差估计中几种选权迭代法常数选取的探讨.测绘科学.2006;31 (6) :70—72
[11]http://gi.leica-geosystems.com/LGISub1x260x0.aspx
LM公司内控机制完善的论文 第2篇
全球经济一体化对企业而言既有机遇也有挑战,特别是对于我国成长型的中小企业,生存与发展的不确定性大大提升。至于机遇,主要是国家陆续出台了很多针对中小企业的优惠政策以及扶持计划,同时在税收、技术开发等方面也给予了一定的补贴;另外,政府为中小企业也提供了一定的资金融通绿色通道,为符合条件的中小企业提供发展基金以及资助。在挑战方面,主要是全球金融危机爆发以来,世界经济一直处于非常不稳定的状态,而且总体上呈现出下滑的态势。另外,国内消费价格指数一直居高不下,导致通货膨胀率随之提高,使中小企业的成本负担越来越重。因此,我国成长型的中小企业应该怎样克服市场环境中的风险、提升内控有效性成为亟待解决的问题。
―、LM公司内部控制机制简介
第一,LM公司为其发展设定了愿景,即发展成为中国饼业的明星品牌,打造流传百年的老字号。同时,企业还以愿景为基础,设定了不同阶段的发展目标。当前的主要目标就是要提升销售量与销售额;同时提高市场覆盖率,提升顾客满意度等。如果从战略管理层面分析的话,那么LM公司当前的主要发展目标就是成长,也就意味着该公司是一间成长型的中小企业。第二,LM公司借助SWOT分析法综合分析了当前的环境,并评估了各类运营风险。具体分析与评估内容见表1。第三,LM公司制定了一系列的财务以及会计内控制度,从而有效提升财务工作的有效性。第四,LM公司为了提升信息的互换与共享效率,使用了电子信息系统,对公司各项业务进行网络化管理。同时,公司还计划随着业务范围的扩大,建立基于ERP的信息管理系统,从而实现公司内部信息的即及时共享,提升公司的内控水平。
此外,笔者也发现了该公司内控存在的问题,具体表现在:公司内部环境、公司内控机制、内控监管三方面,为了提升内控的有效性,LM公司必须对这三方面进行整改。
二、LM公司内部控制制度的完善建议
(一)LM公司内部环境急待改善
对于任何一家公司来说,良好的内部环境都是成功实现内控目标的先决条件。通过调研,本文认为LM公司主要需要从组织结构、岗位职责以及人事管理方面进行完善。当前LM公司的组织结构见图1。通过图1可知,LM公司组建了专门的专家委员会,这样能够有效提升决策的科学性与合理性;同时公司还设置了战略管理部,对各类战略进行统一管理。其中不合理的地方就是将连锁经销部、市场部以及早餐公司并列起来进行管理,尽管这样可以显示出LM公司当前进行的是以市场为导向的经营活动,可并列管理的方式过于模糊,很容易造成管理混乱以及责权不清。
图1LIM公司组织结构示意图本文在详细分析了LM公司的业务特点后,认为其可以实行品牌与产品双线管理的模式,首先,各部门将主要精力都投入所负责的品牌或者产品上,从而提升公司对市场环境变化的适应性,进而推动公司快速成长;其次,明确各部门负责的产品或者品牌,从而确保责权清晰。
人事管理对于公司的内控来说,虽然并没有直接的推动作用,但却是内控执行的重要保障。实际情况是,成长型中小企业既需要大量的关键人才补充,又因为没有合理的人才培育体系以及考评、激励体系,导致人才流失情况非常严重。所以,为了提升LM公司的人力资源管理效率,建议做好以下几项工作。首先,完善职位体系,明确公司所有岗位的工作职责与工作内容,同时将内控措施融进工作内容里;其次,人事部门需要制定规范的人力资源评估流程,并根据绩效评估结果制定相关岗位员工的薪资待遇水平。特别是为了提升内控的有效性,应该量化内控工作从而实现对员工全方位的工作评估。这样不但能够提升员工对内控工作的重视程度,还能提升他们的工作责任心;最后,做好了上面两项工作之后,LM公司需要建立完善的内部培训体系。内部培训体系不但包括专业知识以及职业技能的提升,还包括职业生涯发展以及职业道德提升等方面。这样可以显著提升员工对公司的认同感。
(二)内控机制方面
通过调研之后将LM公司当前已经建立起来的内控制度总结为表2。表2的这些制度虽然能够对这些业务起到一定的规范作用,但是过于宏观,LM公司可以针对上述业务环节再进行内控管理制度的细化,从而提升内控效率。具体的细化过程为首先,对采购以及付款业务环节,应进行如表3所示的控制。其次,对生产以及储存环节,应进行如表4所示的控制。最后,对销售以及回款环节应进行如表5所示的控制。
表2LM公司已经建立起来的内控制度
(三)内控监管方面
通过实地调研了LM公司审计部的工作之后,认为要配合公司的发展战略,最好保持内审部门的独立性。当前内审部门的.工作明显会受到公司个别高级管理层的影响,实际上这对公司内控质量的提升是有百害而无一利的,应该改变这种局面。LM公司进行内控监管完善的时候,可以从以下几方面入手。首先,理顺工作流程。LM公司应该结合自身的经营情况与发展战略理顺内控监管工作流程,因为只有这样才可以科学制定内控考评的范围以及标准,从而确定考评样本,进行相关检验,并根据检验结果对公司内控进行总体评估,再将评估结果汇总为内控分析报告下发给责任部门进行相应的改进与完善。其次,完善内控检验流程。下面以销售合同以及回款这两个子环节为例进行说明。分别见表6和表7。借助表6、表7,可以得出检验结果,也就是究竟是哪个具体的业务环节存在问题,导致内控有效性处于较低水平。不过,做完了检验工作并不代表评估工作就全部完成了,实际上,还必须对存在问题的业务环节进行分析,进而找出导致问题的原因,
并根据原因的具体特性,制定针对性的改进建议;然后将评估结果以及改进建议一并下发至责任部门,要求他们结合自身的实际情况进行整改;责任部门整改之后,内审部门还要检查整改结果,从而保证检验过程中的问题已经被解决或者得到了很大程度的缓解。
基于LM393的寻光智能车 第3篇
关键词:LM393比较器;单片机
中图分类号:TP18文献标识码:A文章编号:1007-9599 (2010) 06-0000-01
Light-feel Smart Car Based on LM393
Gao Jiuchun,Wang Di,Yao Pei
(Southwest Transportation University,Chengdu611756,China)
Abstract:In this paper,hands to improve the capacity of the students designed and produced "National Undergraduate Electronic Design Contest,"the subject,and propose optimization.
Keywords:LM393 comparator;SCM
2003年大学生电子设计竞赛有一智能电动车题目,以单片机为控制中心对小车进行实时的控制,使其沿着跑道上的黑线行驶,实现铁片检测,红外避障功能,在光源的指引下,寻光进入车库。实质是设计制作一个架构于模型车上的集光机电于一体的简易智能控制系统。
对于该系统,我们可以将其分为几个子控制模块,即单片机控制模块,光电传感器循迹模块,铁片检测计数模块,红外避障模块,寻光模块,电机驱动模块和电源模块。该设计中我们采用Atmel公司的AT89S52单片机,通过光电发射接收对管,集成铁片金属传感器,光敏二极管等对小车的位置和状态进行检测,实现题目的要求。
经过对部分参赛选手作品所选元器件,算法的分析和筛选,可总结以下几点:
一、选手大多采用ST178或ST188等红外接收对管对路面的黑线进行检测,由于跑道底色是白色,中间有一条约1.5cm的黑带,白黑对光的反射率不同,所以接收管在黑色和白色上会接收到不同强度的反射光,从而转化成不同的电信号,将该信号进行放大整形后输入到单片机,由单片机控制电机转速转向。一般采用两个或三个接收对管就能满足比赛的要求,但经过实验发现,如果只用两三个传感器在小车速度稍快时会有“出轨”的现象发生。对此,不妨参考飞思卡尔智能车的方案,多配置几个红外发射接收对管,确保小车不脱离跑道。
二、对于避障模块,我们是用超声波传感器进行检测,实践过程中发现市场上集成红外线传感器即光电开关稳定性更好,外围电路更简单,灵敏度更高。铁片检测也可以使用市售的金属接近开关,如LJ12A3-4-Z/BY。
三、相对来说寻光环节最易出现问题,其模块设计也是有很多种,主流思路是通过ADC0809将模拟信号转为数字信号处理。我们发现通过模数转换后的信号仍然需要进行比较后才能让单片机发出相应的控制信号,如果将光敏二极管反馈回的模拟信号直接进行比较后产生的高低电平输入到单片机可以更方便达到目的。对于比较器的选择,我们选用LM393芯片,即寻光模块的核心。
对于光信号采集,我们有较多选择,如光敏二极管,光敏三极管等。光敏三极管反应更灵敏,但价格稍高,我们采用光敏二极管在有无光照的情况下电阻大幅变化的特性来完成采集。我们可能会忽略了自然光对其的影响导致怎么调试都不能稳定工作,如果给光敏二极管套上黑色的热缩管,该情况便可得到改善。
我们采用将二极管和一定阻值的电阻串联分压的简单电路,在有无光照的情况下输出不同的电压值到比较器进行分析处理,称其为输入电压。将输入电压输入至比较器后,需要产生一个与之进行比较的电压,称为基准电压。LM393是单电源设计的双电压比较器,有八个引脚,采用双列直插式封装的LM393P。其中8脚接电源正,4脚接电源负,1脚2脚3脚分别为比较器A的输出,反向输入和正向输入,5脚6脚7脚为比较器B的正向输入,反向输入和输出。LM393P适用电压范围广,也可用分离式电源,不受电源电压值影响。LM393P的应用范围很广,可用于构建基本比较器电路,还可用LM393驱动CMOS的电路驱动和TTL的电路,低频运算放大器等。寻光模块是基本比较器电路的简单应用,即如果其正向输入电压值比反向输入的电压值大,输出VCC,正向输入电压值比反向输入的电压值小,输出0。
虽然是基本比较器电路的应用,但仍有多种构架方案。而如何搭建电路决定于如何配置其正向反向输入。我们将正向输入定义为输入电压,通过电位器产生介入VCC与零之间的电压,在调试前预先设置成2.5V即基准电压,在光敏二极管没有感受到光的情况下,输入电压小于基准电压,比较器输出为零。而一旦有二极管感受到光,输入电压高于2.5V,比较器输出高电平。这个方案可以采用一个光敏二极管搭配一个比较器。为了保证任何时间位置都有二极管检测到光信号,我们用五个光敏二极管分布呈180°的圆弧型进行寻光,五个二极管中,无论哪个检测到光信号都会通过比较器给单片机发出高电平,单片机经过分析便可调整小车的转向和速度。这种方案需要五个比较器,即三片LM393P。还有一方案,我们只要四个比较器即两片393,让五个二极管进行两两比较。先将二极管和比较器从左至右依次排开标号分别为1,2,3,4,5和a,b,c,d。设置中间的那个二极管即3的输入为中间两个比较器即b和c的基准电压,而2和3的输入则为b和c输入电压,实质即两边的和中间的比较,如果b和c都是低电平,则是3检测到,b为高电平则2检测到,c为高电平则4检测到。同样,我们再以2和4的输入作为a和d基准电压,1和5的输入作为a和d的输入电压。当然a为高电平即1检测到,d为高电平即5检测到。故a,b,c,d分别对应1,2,4,5检测到光信号,当a,b,c,d均为低电平是我们认为是3检测到。显然,这种比较方案较先前的那种更易出现不定状态,就需要程序更好的判断处理。实践证明,在传感器角度和程序算法均较合适的条件下,该方案还是相当稳定的。需注意的是393是集电极输出,输出端需要加一个上拉电阻,否则会没有高电平输出。
当然,比较器不只是LM393,还有LM339,但393的速度更快。LM393不仅可用于构建基本比较器,还有驱动CMOS的电路驱动等用法,是一款不错的芯片。在我们的智能车中LM393基本比较电路的使用很好的解决了寻光的问题,是该试验成功不可或缺的重要元器件。
LM算法在火灾早期探测中的应用 第4篇
火灾是一个复杂的非平稳随机过程, 选择合适的火灾过程特征参量进行早期火灾探测是火灾科学的重要研究方向。CO是火灾热解过程的特有产物, CO2是火灾局部完全燃烧的明显标志, 利用这两种特征气体有助于实现火灾的早期探测。但仅靠在某个具体时刻单一气体的体积分数值, 与前后时刻的值没有联系, 不能客观反映火灾的过程趋势, 在设备时效、环境因素干扰下, 火灾探测系统极易发生误报或漏报, 而气体体积分数的上升速率和加速度体现其变化的物理特征, 真实反映了火灾的过程特征。笔者综合CO和CO2气体在火灾发展过程中的变化规律, 选用CO和CO2气体的体积分数比值、比值变化速率和加速度作为火灾过程特征参数, 在提高灵敏度、降低误报率前提下实现了火灾的早期预警。
1 人工神经网络的模型
1.1 火灾探测BP神经网络原理
目前, BP神经网络算法因其简单易行、计算量小、并行性强等优点, 是神经网络训练中采用最多的也是最为成熟的训练算法之一。据统计, 在工程应用中有80%~90%采用的是BP神经网络模型, 尤其是处理非结构性问题。
图1为火灾探测3层BP神经网络结构, 该网络的输入层有3个输入神经元, 为P1、P2、P3, 分别对应于CO和CO2体积分数比值、比值变化的速度和加速度。BP网络的输出层有2个神经元, 对应于非结构性问题的分类, 输出神经元须能代表神经网络要实现的功能目标。因此, 采用“假火灾隶属度”T1和“真火灾隶属度”T2作为输出神经元。神经网络隐层数目为1, 隐层的神经元数为n。输入层神经元i和隐层神经元j之间的权值为W1ij, 隐层神经元j和输出层神经元之间的权值为W2jk。
根据Kolmogorov定理和BP定理可知, 任何有理函数都可以由一个具有偏差和Sigmoid转移函数的三层BP网络进行逼近。在BP 网络中, 隐层节点数的选择非常重要, 它不仅对建立的神经网络模型的性能影响很大, 而且是训练时出现“过拟合”的直接原因。根据前人经验, 参照经验公式undefined为隐层节点数;ni为输入节点数;nk为输出节点数;a为1~10之间的数) 来确定隐层节点数。笔者设定输入节点数ni=3, 输出节点数nk=2, 因此n可选择8~12之间的数。
BP神经网络是一种单向传播的多层神经网络, 可以实现从输入到输出的任意非线性映射。BP网络的非线性逼近能力是通过Sigmoid转移函数体现出来的, 因此, 隐层一般采用 Sigmoid转移函数。火灾探测的BP网络的输出范围为0~1, 正好也符合Sigmoid函数的输出范围, 因此输出层也采用Sigmoid转移函数, 且其非线性逼近速度快于线性的转移函数, 减少了网络训练时间, Sigmoid转移函数如式 (1) 所示。
undefined (1)
1.2 改进BP算法LM算法
由于BP网络采用误差反传算法, 其实质是一个无约束的非线性最优化计算过程, 在网络结构较大时不仅计算时间长, 而且很容易陷入局部极小点而得不到最优结果。针对标准BP算法存在的一些不足, 出现了几种基于标准BP算法的改进算法, 如弹性BP算法 (RPPOP) 、变梯度算法 (CGBP) 、拟牛顿算法、学习率可变的BP算法 (VLBP) 、LM算法等。将RPROP算法的训练函数trainrp应用于模式识别时, 其速度是最快的, 但对于函数逼近问题该算法却不是最好的, 其性能同样会随着目标误差的减小而变差, 该算法所需的存储空间较其他算法相对要小一些。变梯度算法, 特别是SCG算法, 在更广泛的问题中, 尤其在网络规模较大的场合, 性能都很好。SCG算法应用于函数逼近问题时, 几乎与LM算法一样快 (网络规模较大时比LM算法更快) ;而应用于模式识别时几乎与RPROP算法一样快, 其性能不像RPROP算法随着目标误差的减小而下降得那么快。变梯度算法对存储空间的要求相对也低一些, 但其进行稳定学习要求的学习率较小, 所以通常学习过程的收敛速度由于迭代次数更多而变得很慢。拟牛顿算法中的BFGS算法类似于LM算法, 其所需的存储空间比LM算法的小, 但因为对每次迭代过程都必须计算相应矩阵的逆矩阵, 其运算量却随网络的大小成几何级数增长。变学习率算法通常比其他算法的速度要慢很多, 而其存储空间与RPROP算法一样, 在应用于某些问题时该算法仍然很有用。通常, 对于包含数百个权值的函数逼近网络, LM算法的收敛速度最快, 如果要求的精度比较高, 则该算法的优点尤其突出, 在许多情况下采用LM算法的训练函数trainlm可以获得比其他任何一种算法更小的均方误差。
LM (Levenberg-Marquardt) 算法与拟牛顿法一样, 是为了在以二阶训练速率进行修正时避免计算Hessian矩阵而设计的, 当误差性能函数具有平方和误差 (训练前馈网络的典型误差函数) 的形式时, Hessian矩阵可以近似表示为式 (2) :
H= JTJ (2)
梯度的计算表达式为式 (3) :
g= JTe (3)
式中:H为包含网络误差函数对权值和阈值一阶导数的雅克比矩阵;J为雅克比矩阵, 是权值和阈值的函数;e为网络的误差向量。雅克比矩阵可以通过标准的前馈网络技术进行计算, 比Hessian矩阵的计算要简单得多。
LM算法用上述近似Hessian矩阵按如式 (4) 所示的修正公式修正。
x ( k+1 ) = x ( k ) - [ JTJ + μ I]-1JTe (4)
式中:x (k) 为当前的权值和阈值矩阵。当系数μ为0时,
上式即为牛顿法;当系数μ的值很大时, 上式变为步长较小的梯度下降法。牛顿法逼近最小误差的速度更快, 更精确, 因此应尽可能使算法接近于牛顿法, 在每一步成功的迭代后 (误差性能减小) , 使μ减小;仅在进行尝试性迭代后的误差性能增加的情况下, 才使μ增加, 这样, 该算法每一步迭代的误差性能总是减小的。
LM算法是为了训练中等规模的前馈神经网络 (多达数百个连接权) 而提出的最快速算法, 它对MATLAB实现也是相当有效的, 因为其矩阵的计算在MATLAB中是以函数实现的, 其属性在设置时变得非常明确。
2 BP神经网络及LM算法的火灾探测实验
采用BP神经网络方法建模的首要和前提条件是有足够多的、高精度典型样本。按国家标准《点型感烟火灾探测器》 (GB 4715-93) 中试验火的要求, 对常见几种材料进行小功率加热实验, 模仿火灾阴燃的初期, 并进行大量的有限空间火灾模拟实验, 采集到CO和CO2标准光谱, 通过对其进行非线性校正, 应用基于傅里叶变换的红外光谱技术, 使用满足早期火灾探测要求的CO和CO2定量方法, 测量实验燃烧室的CO和CO2的体积分数。实验中光谱仪探测器为MCT-A, 分辨率4 cm-1, 每次测量的扫描次数64, 采样周期60 s;CO的定量分析光谱波段为2 165~2 183 cm-1及2 188~2 203 cm-1, CO2的定量分析光谱波段为772~746 cm-1和739~722 cm-1。
实验材料分别为胶合板、榉木块、毛巾、棉绳、纸张、废纸篓等6种真实火灾源材料, 以及蜡烛、香烟、液化气等3种虚假火灾源材料。BP网络输入数据样本是基于过程特征信息的火灾早期探测数据融合方法, 利用加窗函数的外推算法和最小二乘法提取的CO和CO2体积分数比值、比值变化的速度和加速度, 图2为9种实验材料热解时过程特征的提取结果。在材料加热开始不久, 真实火灾源的3个过程特征分量都大幅度增加;而虚假火灾源的过程特征没有明显的变化、量值极小。根据过程特征的这一特点有望在较小的误报率和漏报率的前提下, 实现火灾的早期探测。
BP网络输出数据样本是输入样本所对应的真假火灾的隶属度, 当火灾为真时, 真火灾隶属度为1, 假火灾隶属度为0;当火灾为假时, 真火灾隶属度为0, 假火灾隶属度为1。火灾的发生和发展通常是一个漫长的过程, 如果火灾发生, 其输出真火灾隶属度值由0逐渐趋近于1。因此, 火灾探测系统输出值总是介于0和1之间。在实测的各组数据中选取223组包含有代表性火灾状况特征信息的数据样本, 按图1所示的火灾探测BP神经网络, 分别遵循标准的BP算法和改进的BP算法LM算法, 组织其进行训练, 利用MATLAB的神经网络工具箱对BP网络进行训练和验证, 设定最大训练次数为10 000, 期望的目标误差值为0.000 1, 分别采用标准的BP算法训练函数traingd和LM算法的训练函数trainlm进行训练, 部分训练样本数据见表1。标准BP算法及LM算法训练的误差曲线见图3、图4。从图3、图4可以看出, 标准的BP算法经过10 000次训练后误差值为0.104 77, 仍未达到训练目标要求, 而LM算法经过10次训练后误差值为2.611 4210-5达到训练目标, 后者速度要远远比前者快。在训练过程中, 根据经验公式确定隐层神经元数目范围为8~12。经训练发现, 当隐层的神经元数目为10时, 网络经过10次训练达到目标误差, 收敛速度最快, 且震荡毛刺相对少。
利用训练好的神经网络对九种材料的整个火灾发生过程进行预测, 以此验证网络的适应性, 其结果如图5所示, 可见6种真实火灾源在实验开始的一段时间内, 由于还没有产生或产生很少的特征气体, 火灾过程特征还未有充分反映出来, 因而对于“火灾”的隶属度为0, 6~7 min时隶属度开始逐渐增加, 约10 min以后隶属度陆续接近1;3种虚假火灾源的隶属度在整个实验过程中一直保持为0。由此可见, 利用基于过程特征的神经网络LM算法, 能够在没有误报和漏报的前提下将真实火灾源从虚假火灾源中鉴别出来。
3 结 论
笔者采用基于过程特征信息的三层BP人工神经网络进行火灾探测, 利用神经网络的自学习和自适应性能, 选用CO和CO2气体的体积分数比值, 比值上升速率和加速度作为火灾过程特征参数, 使用改进的BP神经网络算法LM算法, 对所设计的火灾识别BP网络进行训练, 使该网络对不同参数下的真假火灾有较强的适应性。实验证明, 基于过程特征与BP人工神经网络的早期火灾探测方法是可行的, 能够从虚假火灾源中可靠地鉴别出真实火灾源, 提高了探测的可靠性以及防误报警的能力。
参考文献
[1]李岩.神经网络的应用及其发展[J].商情 (教育经济研究) , 2008, (5) :30.
[2]杜建华, 张认成.CO-CO2红外光谱技术在火灾早探测中的应用研究[J].光谱学与光谱分析, 2007, 27 (5) :899-903.
[3]龚雪.模糊聚类分析在火灾早期探测系统中的应用[J].消防科学与技术, 2008, 27 (1) :52-54.
[4]周开利, 康耀红.神经网络模型及其MATLAB仿真程序设计[M].北京:清华大学出版社, 2005.
[5]飞思科技产品研发中心.MATLAB6.5辅助神经网络分析与设计[M].北京:电子工业出版社, 2003.
[6]吴受章, 宋辛科.BP网络与指数型非线性逼近[C].1994中国控制与决策学术年会论文集, 1994.
LM算法论文 第5篇
2012年全国各地高考语文作文题目
2012新课标高考材料作文:举手之劳
材料:船长和油漆工有个船主,让漆工给船涂漆。漆工涂好船后,顺便将船上的漏洞补好了。过了不久,船主给漆工送了一大笔钱.漆工说:“工钱已经给过了”。船主说:“这是感谢补船漏洞的钱。”漆工说:“那是顺便补的。”船主说:“当得知我的孩子们驾船出海,我就知道他们回不来了。因为船上有漏洞,现在他们却平安归来,所以我感谢你!
2012年全国卷高考作文:放下顾虑
材料:周末,我从学校回家帮着干农活。今春雨多,道路泥泞,我挑着一担秧苗,在溜滑的田埂上走了没几步,就心跳加速,双腿发抖,担子直晃,只好放下,不知所措地站在那里。
妈妈在田里插秧,看到我的窘态,大声地喊:“孩子,外衣脱了,鞋子脱了,再试试!”
我脱了外衣和鞋袜,卷起裤脚,重新挑起担子。咦,一下子就觉得脚底下稳当了,担子轻了,很快就把秧苗挑到妈妈跟前。
妈妈说:“你不是没能力挑这个担子,你是担心摔倒,弄脏衣服,注意力不集中。脱掉外衣和鞋袜,就甩掉了多余的顾虑。
要求选好角度,确定立意,明确文体,自拟标题:不要脱离材料内容及含意的范围作文,不要套作,不得抄袭。2012北京高考作文:火车巡逻员老计的故事
材料:老计每天在深山里走几十里路守护铁路,清理碎石,防止巨石滑落,每有火车经过都会敬礼,火车都会鸣笛回应。请自拟题目写篇不少于八百字的文章。
2012年上海高考作文:曾被舍弃的微光
跟据以下材料,选取一个角度,自拟题目,写一篇不少于800字的文章(不要写成诗歌):材料:人们对自己心灵中闪过的微光,往往会将它舍存,只因为这是自己的东西。而从天才的作品中,人们却认出了曾被自己舍弃的微光。
2012高考天津卷作文:清水还是浊水
材料:两条小鱼一起游泳,遇到一条老鱼从另一方向游来,老鱼向他们点点头,说:“早上好,孩子们,水怎么样?”两条小鱼一怔,接着往前游。游了一会儿,其中一条小鱼看了另一条小鱼一眼,忍不住说:“水到底是什么东西?”看来,有些最常见而又不可或缺的东西,恰恰最容易被我们忽视;有些看似简单的事情,却能够引发我们深入思考„„请根据以上材料,自选角度,自拟题目,自选文体(诗歌除外),写一篇不少于800字的文章。不得套作,不得抄袭。
2012年重庆高考作文:拯救冷库工人
材料:人被关一个冷库里,一个门卫来解救被困人员,事后有人来问门卫,这不是你的本职工作为何你要解救他?门卫说:因为只有这个人,每天早上和我说,早上好,以及晚上对我说再见,而今天他只对我说了早上好,还没有对我说再见,所以我判断他在冷库里被困了。
2012广东高考作文:生活时代的材料作文
材料:醉心于古文化研究的英国历史学家汤因比曾经说过,如果可以选择出生的时代与地点,他愿意出生在公元一世纪的中国新疆、因为当时那里处于佛教文化、印度文化、希腊文化、波斯文化和中国文化等多种文化的交汇地带。居里夫人在写给外甥女涵娜的信上:“你写信对我说,你愿意生在一世纪以前....。伊雷娜则对我肯定地说过,她宁可生得晚些,生在未来的世纪里。我以为,人们在每一个时期都可以过有趣而有用的生活。”
2012年湖北高考作文题目:科技的利与弊
作文自选角度,一个话题引起讨论:科技的利与弊。书信可不可以替代?是改变还是不改变。
2012江西高考作文:你拥有什么
围绕“你不要想着你没有拥有什么,而要想着你拥有什么”、“你不要想着你现在拥有什么,而要想着你没有拥有什么”两个主题,选择展开议论,写一篇700字左右的议论文;小作文主题跟音乐有关,200字左右。
LM2012年全国各地高考语文作文题目
2012辽宁高考作文发布:大隐隐于“乐”
一个音乐家登台穿的非常朴素,有人问他为什么不穿的华丽些,他说人要隐没于音乐之后。据材料写一篇作文。
2012福建高考作文:根据冯骥才的一段话:“运动中的赛跑,是在有限的路程内看你使用了多少时间;人生中的赛跑,是在有限的时间内看你跑了多少路程。”根据以上材料写一篇800字的作文。
2012四川高考作文:手握一滴水
一幅双手的图片:伸开手温暖服务,摊开手放飞想象,合拢手收获快乐。以此写篇文章,题目自拟。
2012安徽高考作文题:梯子不用时请横着放
材料:某公司车间角落放置了一架工作使用的梯子。为了防止梯子倒下伤着人,工作人员特意在旁边写了条幅“注意安全”。这事谁也没有放在心上,几年过去了,也没发生梯子倒下伤人的事件。有一次,一位客户来洽谈合作事宜,他留意到条幅并驻足很久,最后建议将条幅改成“不用时请将梯子横放”。要求选好角度,确定立意,明确文体(诗歌除外),自拟标题;不要脱离材料内容及含意的范围作文;不要套作,不得抄袭,不得透露个人相关信息;书写规范,正确使用标点符号。
2012江苏高考作文:《忧与爱》
2012北京高考作文发布:《火车巡逻员的故事》
北京2012高考作文题:材料作文:火车巡逻员老计的故事,老计每天在深山里走几十里路守护铁路,清理碎石,防止巨石滑落,每有火车经过都会敬礼,火车都会鸣笛回应。请自拟题目写篇不少于八百字的文章。
2012湖南高考作文发布:一幅双手的图片。
伸开手温暖服务,摊开手放飞想象,合拢手收获快乐。以此写篇文章,题目自拟。
2012山东高考作文发布:以孙中山箴言自拟题目
山东卷材料作文,引用孙中山的一句话,跟革命有关。题目自拟,大致的主题是有目标之后奋勇拼搏,失败不要灰心,要克服失败。
2012陕西高考材料作文题目发布
阅读下面材料,根据要求写一遍不少于800字的文章。船主请一位修船工给自己的小船刷油漆。修船工刷漆的时候,发现船底有一个小洞,就顺手给补了。过了些日子,船主来到他家道谢,送上了一个大红包。修船工奇怪,说:“您已经付给我工钱了。”船主说:“那是刷油漆的钱,这是补洞的报酬。”修船工说:“那只是顺手做的一件小事”船主感激 说:“当得知孩子们划船去海上后,我才想起船底有洞这件事,绝望极了,觉得他们肯定回不来了。等到他们平安归来,我才明白是您救了他们。” 要求选好角度,确定立意,明确文体,自拟标题;不要脱离材料内容及含义的范围作文,不要套作,不得抄袭。
2012吉林高考作文发布:《船主和漆工的故事》
材料:有个船主,让漆工给船涂漆。漆工涂好船后,顺便将船上的漏洞补好了。过了不久,船主给漆工送了一大笔钱.漆工说:“工钱已经给过了”。船主说:“这是感谢补船漏洞的钱。”漆工说:“那是顺便补的。”船主说:“当得知我的孩子们驾船出海,我就知道他们回不来了。因为船上有漏洞,现在他们却平安归来,所以我感谢你!”
2012年海南高考作文题目发布:《举手之劳》
材料大意为:一个船主叫修船工给船上漆,修船工顺便把船底的洞补上,这一小小举动,竟然意外救了船主的孩子。船主拿钱表示感谢,但修船工没有收下,称此为举手之劳。以此为话题,写一篇作文,题目自拟。
LM算法论文 第6篇
随着人工智能的快速发展,使得神经网络方法在模拟电路故障诊断方面的应用变得越为普及,其中有近90% 的神经网络是基于BP算法的[2]。但BP神经网络由于结构难以确定、输入数目多以及训练时间长等缺陷,导致诊断效率较低。在实际应用中原始的BP算法难以胜任,为了克服上述缺陷,提出了基于Levenberg Marquardt算法的神经网络来进行模拟电路的故障诊断分析。通过仿真实验分析,LM算法不但有效提高了诊断效率,而且在局部搜索能力上比BP网络强[3]。
1PSpice电路仿真
本文以图1的Sallen—Key二阶带通滤波器[4]为例,在PSpice中进行电路原理图的绘制、模拟和蒙特卡洛仿真。表1为各元器件的标称值及其故障值,其中电容容差为10% ,电阻容差为5% ,并设其分别偏离标称值的50% 为故障状态,故障为单软状态。经灵敏度测试,当C1、C2、R2、R3发生变化时,对输出点的波形影响最大,其他元器件参数值的变化对输出影响较小, 故可认定为无故障状态。
利用PSpice中的交流分析结合蒙特卡罗分析可以获得表1列出各类故障类型的输出脉冲响应,其中R2偏大时的30次蒙特卡罗分析输出响应如图2所示。
2BP神经网络与LM算法
2.1BP神经网络
目前,在众多神经网络中,由于BP网络具有成熟的训练方法和良好的逼近能力而得到广泛应用。BP神经网络拓扑结构的模型主要包括隐含层( Hide Layer) 、 输入层( Input Layer) 和输出层( Output Layer) 。BP作为一种多层前馈神经网络,仿真成败的关键主要取决于隐层节点的个数。由于隐层节点数的确立相对比较复杂,一般的选择原则是: 应使网络结构尽量简单,在有效反映输入输出层关系的基础上,隐层节点数越少越好[5]。
Sigmoid为BP网络隐层中的神经元所采用的传递函数,而输出层的神经元则由Logsig传递函数担当,整个网络的输出则任意。
2.2Levenberg-Marquardt算法
标准BP的期望输出与实际输出的误差沿后向传递,作为一种按梯度下降的算法需要逐渐减小其误差函数,直到最后的误差取得最小值,因此BP作为一种按梯度下降的算法,收敛速度比较缓慢。LM作为一种快速算法不但能有效地结合高斯—牛顿法和梯度下降法的优点[6],而且折中了梯度下降法的全局特性和高斯—牛顿法的局部收敛性。
设第x次迭代的网络权值向量用w( x) 表示,新的权值向量为w( x + 1) ,维数为M,则其公式为
设误差指标函数为
式( 2) 中,为期望输出与实际输出; N为输出向量的维数,若设E( w) =[E1( w) E2( w) …EN( w) ]T,则有
对于牛顿法则有
当接近一个解时,通常有S( w) 0,这是得到高斯—牛顿法的计算规则
而LM算法是一种改进的高斯—牛顿法,它的形式为
其中,比例系数 μ 为 > 0的常数且单位矩阵为I。
由上式可看出,当 μ 逐渐减小时,权值调整近似于高斯—牛顿法,此时接近一个解; 当 μ 逐渐增大时,权值调整近似于梯度下降法,此时远离一个解。由于近似二阶导的LM算法比梯度下降法快,因此在具体操作中,μ 成了一个试探性参数,若 μ 已给定,求得的 Δw能够使误差指示函数E( w) 降低,则 μ 减小; 反之,μ 增加。仿真实验表明,LM算法可以在原梯度下降算法的基础上有效地改善网络性能。
3小波分析及其特征提取
3.1小波变换
小波变换于1974年由J. Morlet提出,小波变换在信号处理等领域的广泛应用主要取决于其在时、频域都具有多分辨率分析的特点和表征信号局部特征的能力。小波变换的基本思想是将原始信号通过伸缩和平移后分解成一系列具有良好的时域、频域等局部特征的子带信号,从而实现对信号时间、频率的局部化分析以克服傅里叶分析所存在的局限性[7]。
小波分解就是在分解原始信号时,保留每一层的高频部分,对低频信号进一步分解。离散序列信号的二进小波变换可表示为
式中,Am0是信号f( k) 在m0尺度下的低频部分; Dm是信号f( k) 在m0尺度下的高频部分; Cam0和Cdm分别表示m尺度下的低频系数和细节系数; gm0( k - 2m0n) 为合成尺度函数,相当于一个低通滤波器,而hm( k 2mn) 为一个高通滤波器。
3.2故障特征提取和结构确定
为了对电路的输出信号进行采样,需将被测电路和激励信号同时作为激励。对该冲激信号可采用Haar进行5层小波分解,其特征向量为各层小波系数的最大值[8]。
若故障类型有n种,对采样信号进行m层小波分解,由于神经网络的输入个数为所提取特征向量的维数,而输出个数则与故障类型有关。因此( m + 1) 与log2n就为神经网络的输入和输出数目。隐层数目为槡M +N + a,其中,M为输入数目,N为输出数目,a取1 ~ 10间的自然数。因此在本文中,当输入层为6,输出层为4,隐层神经元数目为10时最合适。
若要存储神经网络的权值、阈值和误差,则需利用测得的样本对神经网络进行训练,直到误差小于期望误差即可[9]。本文将每种故障模式对应的30次样本输入BP神经网络进行训练,网络经过851次训练达到目标要求,如图3所示。
3.3小波故障诊断原理
小波神经网络故障诊断的步骤: 首先对电路的输出响应进行小波变换,然后将故障特征量作为神经网络的输入,通过对神经网络的不断训练,最后达到模式识别和故障分类的目的,从而实现模拟电路的故障诊断[10]。其故障诊断原理如图4所示。
4神经网络的训练分析
网络训练样本的输出回归直线如图5所示,其中网络输出Y是网络模型经训练后计算所要得到的输出值,T是网络训练所要达到的目标值。由图可知,其相关系数为0. 964 07。可见,相关系数接近于1,回归直线与斜率为1的直线几乎重合,说明网络的输出能逼近目标值,网络是有效的。
5结束语
LM算法论文 第7篇
机器人逆运动学问题就是已知位姿求解关节角变量。在RoboCup仿真3D比赛中, 逆运动学求解占有重要地位, 它直接关系到机器人的动作生成、步态规划以及高层决策。传统的解析法和数值法需要大量计算, 这很难满足实时性要求, 而神经网络可以很好解决这个问题。
BP神经网络是目前应用最为广泛和成功的神经网络之一。它是一种多层前馈型网络, 可以实现从输入到输出的任意非线性映射, 权值的调节采用反向传播算法, 简称BP算法。
然而BP算法的主要缺点是:收敛速度慢, 局部极值、难以确定隐层节点的个数。BP算法的改进可采用有效的优化算法。其中LM算法是高斯牛顿法的改进形式, 既具有高斯牛顿法的全局特性又具有梯度法的局部特性。实验表明该方法在NAO模型求逆解中具有可行性。
1 基本概念
1.1 NAO简介
NAO是AldebaranRobotics公司研制的双足仿人机器人, 身高57cm, 体重约4.5kg, 具有22个自由度。仿真3D环境下的NAO机器人和实物机器人略有区别, 比如手臂上的关节数目, 实物有6个, 而仿真的目前只有4个。NAO的右腿模型如图1所示。
其中hip1、hip2、thigh关节交与一点, ankle和foot关节交与一点。以torso质心为原点建立一个3D坐标系。
1.2 逆运动学
逆运动学即根据髋关节和踝关节的位姿T求解各关节的关节角。T可拆分为T和R。其中P=[Px, Py, Pz]为关节的位置向量, R=[a1, a2, a3;b1, b2, b3;c1, c2, c3]为关节的旋转矩阵, 设在局部坐标系上的旋转角分别为θx, θy, θz, 则
undefined
此时逆运动学问题转化为从位置向量和旋转角度到关节角的映射。
1.3 BP神经网络
BP算法的思想是, 样本的输入值从输入层传入, 经隐层逐层处理后传向输出层。当输出与期望存在误差时, 将误差以某种形式反向传递给各层, 各层将此作为权值调节的依据。权值调节的过程就是学习的过程, 此过程一直持续到网络的误差减小到可以接受的程度或者是达到了预先设定的迭代训练的次数。一个三层的BP神经网络可逼近任意非线性函数, 因而可用BP网络来建立NAO机器人逆运动学模型, 网络结构如图2所示。图中N、H、M表示三层的节点个数, vij表示输入层第i个节点与隐层第j个节点的连接权值, wjk表示隐层第j个节点与输出层第k个节点的连接权值。bH (j) 表示隐层各节点的阈值, bM (k) 表示输出层各节点的阈值。
2 Levenberg-Marquardt训练算法
2.1 算法原理
Levenberg-Marquardt算法, 是一种基于数值最优化理论的训练算法。具体描述如下。
设X表示迭代训练时各层权值和阈值组成的向量, X的调节量为△X。调节X, 即调节网络的权值和阈值, 从而达到训练学习的目的。
设表现函数
undefined
式中eundefined (X) (i=1~N) 表示误差的平方, 那么
式中E (X) 表示ei (X) (i=1~N) 组成的向量, J (X) 是雅克比矩阵, S (X) 是误差函数, 即
undefined
由于LM算法是高斯-牛顿法的改进形式, 那么
式中, I是单位矩阵, μ>0是常数。μ=0时, LM算法转化为具有近似Hessian阵的高斯-牛顿法。μ较大时, LM算法接近小步长的梯度法。在训练过程中, μ的修改系数设为β。如果训练成功, 减小μ的值;如果训练失败, 增加μ的值, 这样表现函数最终会减小到一定值, 达到学习的目的。
2.2 算法步骤
①初始化:给出μ=0.01, β=10, 误差允许值ε以及权值和阈值, 令迭代次数k=0;②计算网络的输出及表现函数P (X) ;③计算雅克比矩阵J (X) ;④计算△X;⑤若P (X) <ε, 转到步骤⑥。否则, 用X+△X重新计算表现函数P (X) , 此时P (X) 如果小于②中算出的P (X) 值, 则令k=k+1, μ=μ/β, 且X=X+△X, 回步骤②;若不小于则令μ=μ*β, 回步骤④;⑥结束。
3 实验验证
由于图1所示模型中有6个关节, 故网络的输出节点有6个。全局坐标系建立在torso质心处, 可视机器人torso固定, 腿脚可以自由活动, 这样网络的输入节点就减少为6个。
隐层节点的个数可通过黄金分割优化算法来确定, 也可先选取较少的节点, 然后逐渐增加节点数, 看是否达到给定精度, 达到就停止, 此时节点数就是满足精度要求的最少节点数目。在实验中选取8个隐层节点。
训练需要大量样本, 样本的获取需要利用正运动学, 即从关节角到位姿的映射。在实验中用正运动学采集了2000个样本, 每个样本经过约200多次的训练, 可以将网络的误差控制在10-2以内, 这已经达到RoboCup仿真3D的比赛要求。
测试时选取了训练集外的100组数据。这100组数据的期望输出值与实际输出值的均方差如图3所示, 这100组数据中对应foot关节的期望输出值与实际输出值的误差如图4所示。从实验的结果可以看出100组数据的误差都控制在理想的范围内, 达到了比赛的要求, 从而验证了方法的有效性。
4 结束语
将基于LM算法的BP神经网络用于NAO机器人逆运动学, 实现了NAO机器人从位姿到关节角的非线性映射, 为逆运动学求解提供了一种思路。实验表明, 该方法实用有效, 符合实时比赛的需求。
摘要:提出一种基于BP神经网络改进算法的NAO机器人逆运动学求解方法。在讨论NAO模型逆运动学的求解问题以及BP神经网络基本原理的基础上, 将LM训练方法运用到BP神经网络中。实验结果表明该方法具有可行性和有效性。
关键词:逆运动学,NAO,RoboCup,BP神经网络,LM算法
参考文献
[1]梶田秀司.仿人机器人[M].北京:清华大学出版社, 2007.
[2]熊有伦.机器人技术基础[M].武汉:华中科技大学出版社, 1996.
[3]韩力群.人工神经网络理论设计及应用[M].北京:化学工业出版社, 2002.
[4]HAGAN M T, MENHAJ M B.Training feedforward networkswith the marquardt algorithm[J].IEEE Trans Neural Net, 1994 (6) .
[5]赵弘, 周瑞祥, 林廷圻.基于Levenberg-Marquardt算法的神经网络监督控制[J].西安交通大学学报, 2002 (5) .
LM算法论文范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。