电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

贝叶斯判别分析

来源:莲生三十二作者:开心麻花2025-11-191

贝叶斯判别分析(精选9篇)

贝叶斯判别分析 第1篇

在日益激烈的市场竞争中, 我国的企业不确定因素日益增大, 上市公司因财务危机陷入困境、甚至宣布破产的例子已经屡见不鲜。截至2007年6月30日, 我国境内上市公司的数量已达到1 460家。面对这样一个规模日益庞大的市场, 如果能客观评价上市公司的财务状况, 尤其是预测未来可能出现财务危机的公司, 对于投资者及时调整投资决策、监管层准确识别盲目融资公司以及上市公司及时发现问题、解决问题, 防患于未然都具有极其重要意义。财务困境的预警是以企业的财务资料为依据, 利用统计、计量方法进行判别, 以识别企业在经营管理活动中存在的财务风险, 向投资人、企业管理者、债权人等发出预警信号, 以便其采取有效措施, 对风险的识别, 起到预警作用。

财务困境预警的实证研究方法, 一般是首先选取一些被认定为发生财务困境和未发生财务困境的公司作为研究样本, 采用一定的统计方法对样本数据进行分析, 确定判别财务困境的关键财务指标, 然后利用财务指标构造判别财务困境的模型。本文采用的是贝叶斯判别方法。

2 贝叶斯判别模型的基本原理

判别分析方法由来己久。第一次提出这种统计方法是用在种族的判别, Pearson (1921) 称之为种族相似系数法。Fisher (1963) 第一次提出了一个表示不同特征变量的线性函数, 而称之为线性判别函数, 并形成把一个个体归类到两个总体之一的判别法, 从而促成了线性判别函数在多元统计分析中的广泛应用。它是根据观测得到的一些数量特征, 对客观事物进行分类, 分辨事物的种属。这一统计方法有着广泛的应用。它是在己知要判别的类型和数目并己取得各种类型的一批己知样本的情况下, 从这个已知的判别总体找出判别规则, 用于判断一个未知变量应属于哪一个总体。以及检验两个或者多个总体在所测量的变量上是否显著差异。

贝叶斯统计的思想是:假定对研究对象已有一定的认识, 常用先验概率分布来描述这种认识, 然后再取得一组样本, 用样本来修正已有的认识, 即先验概率分布, 从而得到后验概率分布, 各种统计推断都通过后验概率分布来进行。将贝叶斯统计思想用于判别分布, 就得到贝叶斯判别方法。

3 样本和数据选取

本文所涉及的财务危机公司是指被特殊处理的 (ST) 上市公司, 非财务危机公司是指未被特殊处理的上市公司。从2006年1月1日~2007年12月31日止, 深沪两市A股中共出现154家被ST的上市公司。本文在选取样本时剔除了由于以下几种原因而被ST的上市公司: (1) 上市两年内被特别处理的公司。原因是财务数据过少和存在严重的包装上市的嫌疑, 因此与样本中的其他公司不具有同质性。 (2) 因自然灾害、重大事故等意外事件而被特别处理的公司。这样属于“出现其他异常状况”原因。

经过剔除后, 本文选取的有效样本变为80家。我们根据研究期间一致、行业相同或相近、规模相当的原则按1:1的比例选择没有被ST的上市公司作为配对样本。因此, 本文确定了160个研究样本来进行贝叶斯判别分析。随机抽取80家作为估计样本来建立财务危机预警模型, 剩余的80家作为预测样本用于检验模型预测的精确程度。

4 研究指标的选取

研究指标的选取会影响财务预警模型的预测能力, 本文选取财务指标的原则是造成财务危机的各种可能性, 本文中共选取了五大类20个研究指标进行分析, 包括经营能力指标、成长能力指标、获利能力指标、偿债能力指标和现金流量指标。本文中选取的度量获利能力的指标包括:资产利润率、净资产收益率 (股东权益净利润率) 、资产净利率、经营毛利率和营业收入净利润率;有关短期偿债能力的指标包括:流动比率、速动比率和营运资金比率;长期偿债能力指标包括:股东权益比率 (所有者权益比率) 、流动负债率和资产负债率;用来度量公司经营能力的指标包括:应收账款周转率、存货周转率和总资产周转率;度量成长能力的指标包括:主营业务收入增长率、总资产增长率和净利润增长率;度量现金流量能力的指标包括:现金比率、主营收入现金含量和净利润现金含量。

为了确定上述财务比率能否有效区别ST公司和非ST公司, 对160家企业的上述20个财务比率进行单变量T检验和相关系数的分析。首先对数据进行T值检验, 有15个指标通过了T检验, 说明正常公司和危机公司对于这15个指标均存在着显著性差异。本文对通过T检验的15个指标进行逐步选择法, 即每一步都把模型外的对模型的判别能力最大 (Wilks'lambda值最小) 的变量加入到模型中的同时, 也考虑将已经在模型中但又不符合留在模型中的条件的变量剔除。最终反映获利能力的净资产收益率、资产净利率和经营毛利率三个指标和反映经营能力的总资产周转率和反映成长能力的总资产增长率指标对财务危机的预测起到了比较重要的作用。将样本组的80个样本的5个指标的财务数据代入, 并用剩余的80家上市公司的数据 (预测数据) 进行预测, 利用R软件进行贝叶斯判别分析。

5 实证结果与分析

分别以1、2代表被有危机的公司和正常的公司, 用R运行得到贝叶斯判别分析法对企业发生财务危机的预测结果 (见下页图表) 。

估计样本80家, 危机公司和正常公司各40家;预测样本80家, 危机公司和正常公司各40家。将财务危机公司 (1) 误判为正常公司 (2) 的比例用Ⅰ类错误率表示, 将正常公司 (2) 误判为财务危机公司 (1) 的比例用Ⅱ类错误率表示。贝叶斯判别分析估计样本的Ⅰ类错误率为7.5%, Ⅱ类错误率为15%, 综合准确率为88.75%;而预测样本的Ⅰ类错误率为10%, Ⅱ类错误率为15%, 综合准确率为87.5%。

依据通用的“20%/25%”法则, 该模型的准确率至少应达到 (100%/2) * (1.2或1.25) =60%或者62.5%的准确率才是可以接受的。回代法检验的综合准确率88.75%, 高于衡量标准62.5%。尤其是对危机公司的识别率达到了92.5%, 高出衡量标准三十个百分点, 该财务危机预警模型的预测效果较好。

此实证结果说明虽然中国上市公司的财务危机较为复杂, 但是通过分析其财务报表数据的一些典型指标, 运用贝叶斯判别构建财务预警模型这一研究思路具有一定的科学性和可信度。

参考文献

[1]李延喜, 高锐, 包世泽, 姚宏.基于贝叶斯判别的中国上市公司利润操纵识别模型研究.预测.2007, 3.

[2]温小郑, 高春艳.基于因子和判别分析的上市公司财务危机预警研究.商场现代化, 2008, 4 (下旬刊) .

贝叶斯判别分析 第2篇

【摘要】为能及时准确地掌握学校教学上的信息,提高学校教学质量,提高学生综合能力,各高等学校相继实行学生教学信息员制度,让学生参与到学校的教学管理中来。针对当前只能定性描述评价学生教学信息员综合能力的提高和经典统计方法定量化评价存在的缺陷,本文提出基于贝叶斯MCMC分析方法来实现对这类问题的定量化评价,并实证分析了用该方法取得的良好效果。

【关键词】参与教学管理学生教学信息员贝叶斯MCMC方法t检验方法

一引言

为进一步完善本科教学质量保障体系,准确掌握本科教学实际状态,广泛听取学生对本科教学的意见,及时解决教学中存在的问题,提高教学水平和质量,自20世纪90年代初起,国内许多高校开始陆续设立学生教学信息员,大学生教学信息员、助理教务员等参与教学管理,作为高校施行教学质量监控的重要途径,在高校教学管理工作中得到了广泛的应用和实践。已有文献主要是对如何实施学生教学信息员制度,学生信息员制度对学校教学管理水平提高所起的作用、意义等进行研究,在涉及参与教学管理、学生自身方面的提高和收获等都还是只能在理论上的定性研究。实际上,这个行之有效的方法对学校教学管理水平提高到底多大、对学生在各方面的能力上提高到底有多大等都没有定量化的回答。本文提出基于贝叶斯分析方法来对参与教学管理的学生教学信息员个人能力的提高进行分析,实现对学生个人能力提高分析的定量化。文章接下来将要分析经典的t检验方法在分析这类问题时的缺陷;贝叶斯MCMC分析方法;实际数据的分析;最后得到结论。

二数学模型

要判别学生教学信息员的个人能力是否提高,就是要对学生参与教学管理之前与之后的能力差异加以检验。设前后两组数据分别来自均值为θ1,θ2的方差相等的两个总体,样本容量为n1,n2,样本均值为.

1.t检验法

通常临界值的p取0.05,这样检验实际上会导致,要么认为数据来自一个总体,要么就不是来自一个总体。实际计算中有时p值接近0.05,譬如0.056、0.04、0.06等,那么按照t检验法则结论非常明确,但如果仔细观察数据就会发现有欠妥之处,譬如,p=0.045时就认为来自均值不同的总体,p=0.055就认为来自均值相同的总体,即在数据非常相近时而做出截然不同的结论,导致这个问题的关键是按照上述的方法处理数据时只用了y1的信息估计θ1,只用了y2的信息估计θ2,没有联合他们的信息,估计量自然就不尽合理。

2.贝叶斯MCMC方法

三贝叶斯MCMC方法和t检验方法对学生教学信息员能力数据的分析应用

作为学生教学信息员,首要的事情还是学习,教学管理者一直强调要求参与教学管理的学生教学信息员要在认真搞好自己学习的基础上,积极热心为同学服务,客观公正、认真负责地评价每位老师的教学,广泛听取同学的`意见与建议,积极主动与学校相关教学部门取得联系。担任了学生教学信息员,投入到学习上的时间受到一定的影响,此时学生的成绩好坏更加可说明学生的综合能力。因此,我们选择学生的综合成绩作为反映学生个人素质的综合指标。根据加入学生教学信息员的时间,收集某校信息学院的31名学生教学信息员的总评成绩,按各科成绩与学分加权平均后得到每位学生的综合成绩。记y1表示成为学生信息员后的综合成绩数据集,y2表示成为学生信息员之前的综合成绩数据集。前后的成绩箱图如图1所示,根据y1和y2算到,,由前面所介绍的t检验法得到p值为0.0502,根据通常0.05显著水平,此时应该认为这两组数据的总体均值没有差异,得到结论是总体均值为81.274。但是,如果仔细观察数据以及从数据的箱图上看,两组数据还是存在较大的差异。现在如果用贝叶斯MCMC来对两组数据的均值差异、总数据集的均值参数模拟迭代5000次,可以得到表示两总体均值差异量2δ(=θ1-θ2)的95%置信区间值为[-0.096,9.55],两总体均值差异的一半大于0的概率达到97.3%,这表明均值差异大于0概率非常大,明确支持两组数据来自两个不同的总体。结合数据本身含义我们可看出,尽管有个别学生在担任学生教学信息员后,综合成绩有所下降,但作为群体来看,学生在参加学生教学信息员后,综合成绩有很明显的提高。这充分说明担任了学生教学信息员后,不但不会影响他们的成绩,更加有利于这些学生以担任学生教学信息员为动力把学习搞得更好。我们利用第4001次至5000次的1000个抽样数据得到数据的两总体均值估计量分别为,。这不但实现了对学生教学信息员能力提高上的数量化评价而且也解决了经典t检验对这类数据估计的缺陷。

四结语

随着高等教育办学规模的不断扩大,社会、学生对学校培养人才要求的不断提高,培养高素质、高质量的个性化人才已经刻不容缓。特别是在高校实行学分制、弹性学制之后,学生的自我管理、自我服务意识明显增强,并对学校教学管理提出了许多新的问题和更高的要求。建立、完善学生教学信息员制度,既可以帮助学校更好地了解与掌握学校当前教学实际状态,广泛听取学生建议和意见,及时解决本科教学中存在的问题,提高教学管理水平和质量,又可以充分发挥学生主体的作用,让参与的学生得到锻炼,提高组织能力、思维能力和表达能力等综合能力。这样一个很好的培养锻炼学生综合能力的量化评价一直困扰着各个高等学校的管理者,本文利用统计中的贝叶斯MCMC方法对学生教学信息员综合能力提高上给出了量化的评价。这一研究对进一步数量化评价大学生能力提高进行了有意义的尝试,丰富了科学量化评价的方法,弥补了经典t检验方法的不足。

参考文献

[1]约翰布鲁贝克.高等教育哲学(王承绪、徐小洲译)[M].杭州:浙江教育出版社,.12:41~45.

[2]王学文、许晓哥.论走向高等教育大众化时代的教育管理[J].扬州大学学报,(4):79~81

[3]茆诗松、王静龙、璞晓龙编著.高等数理统计(2版)[M].北京:高等教育出版社,.5:440~452

[4]龚光鲁、钱敏平著.应用随机过程教程及在智能计算中的随机模型[M].北京:清华大学出版社,2004.3:186~201

贝叶斯判别分析 第3篇

从实质上说,贝叶斯网络是一种概率网络,是在概率推理的基础上建立起来的图形化的网络系统。在这个系统中,贝叶斯公式发挥着十分重要的作用。概率推理则是为了解决各种不定性和不完整性问题而提出的,非常有效地解决了各种复杂设备中由于不确定性、不完整性或者关联性等引起的故障。因此,概率推理在贝叶斯网络中得到了广泛的应用。一般来说,贝叶斯网络是一种带有方向的无环网络,主要由各种节点及有向边组成。其中,节点代表的是各种随机的变量,而各个有向边则代表着节点之间的相互关系,其中有向边的方向是由总节点指向各个分支节点,关系强度大小用条件概率来表示。在整个概率推理过程中,节点可以表示任何形式的变量,如各种现象、意见等。因此,贝尔斯网络中可以一些从不完全或者不确定的信息中进行相应的推理。贝尔斯网络具有以下特点:第一,它是一种不定性的因果关联的模型,表示着各种变量之间的因果关系。第二,贝叶斯网络能够处理各种不确定性的问题,能够在条件有限的情况下解决各种问题。第三,贝叶斯网络将多种信息充分融合起来,同时还包括各种故障诊断和维修决策等。作为不确定信息处理的重要工具,贝叶斯网络已经在智能化的信息系统中得到了重要的应用,其应用的行业范围也在不断地扩大,涉及到各种医疗诊断、统计决策或者各种学习预测等领域。

2、基于贝叶斯网络的架空输电线路隐形故障诊断系统关键技术分析

由于贝叶斯网络系统优良的性能及功用,其被应用于社会生活的各个行业之中,其中在架空输电线路隐形故障诊断系统中应用的更为广泛。下面,笔者将对贝叶斯网络架空输电线路隐形故障诊断系统的关键技术进行深入地分析。

2.1架空输电线路预测数学模型分析

经过多年以来的发展和提升,输电线路的故障定位技术也在不断地完善。但就目前情况来看,由于电力系统的复杂性,加之影响系统故障定位的各种因素的多样性,故障定位技术的应用过程中还存在着一些问题。同时,我们必须意识到故障定位技术的应用基础就是输电线路数学模型。因此,要提高故障定位的精度,必须选择正确的输电线路模型。作为一种重要的电力元件,输电线路在电力系统的计算过程、电磁分析以及故障测距等工作领域发挥着十分重要的作用。就目前来说,输电线路的数学模型有很多种,包括各种简单的集中参数式的竖向模型,也包括各种复杂的分布性参数模型。具体来说,前者主要包括π型模型、多级π型模型以及R-L模型等。后者则主要包括各种无损模型、频率相关的模型以及无畸变的模型等。输电线路模型选择十分重要,将会对计算结果的精确性产生十分重要的影响。就我司来说,主要采用了IEC-61970/61968中定义的线路包(Wires)信息模型和IEC61968资产信息包作为基础,形成了相应的数学模型。当然,为了保证数学模型的准确性,提高计算结果的精确度,相关工作人员认真阅读并严格执行《输变电设备状态评价标准》的相关要求,在CIM规则的基础上添加了南方电网公司所制定的相关标准。例如,在评价分类方面,工作人员在CIM规则的基础上添加了状态评价包。该评价包包括几个层叠的组成部分: 第一个大部分是输电线路。而各个输电线路又是由不同的单元,如基础、杆塔等构成的。这些不同的单元下面涉及到各個不同的状态量,如结构位移、外漏等。通过该数据模型,我们可以及时地诊断出架空输电线路系统运行中的各种隐性故障,进而采取各种合理有效的措施。

2.2架空输电线路状态评价标准分析

根据设备运行的状态量对架空输电线路所造成的影响的程度大小,工作人员经将架空输电线路的状态评价标准分为四个等级,这四个等级分别对应不同的权重系数。判断出等级之后,工作人员就能对架空电路系统的运行状况有了更好地了解,能够及时发现各种隐性故障。而工作人员首先要做的就是对各个状态量进行综合全面地分析,并对设备的状态做出合理的评价。如果设备处于正常或者注意的状态,那么完全可以正常运行。但如果设备出现异常,则应该尽快检查和维修。如果设备运行严重异常,则应该停止使用,立即检查和维修。具体来说,架空输电线路的状态评价标准主要有三个:第一,线路单元评价标准。正如上面所提到的,线路单元可以分为基础、杆塔、绝缘子等。工作人员要认真检查这些线路单位的状态,并对这些单元的状态进行评估,作扣分处理,判断其是否属于正常、注意、异常或者严重问题状态。

2.3基于贝叶斯网络的架空输电线路的状态评估探讨

传统的故障检修方法执行定期维修的制度,这种制度存在着很大的不合理性。很多输电设备出现了重复停电的状态,造成了人力、物力资源的大量浪费,这也严重影响了电力设备的可靠性水平。而贝叶斯网络架空输电线路隐形故障评估系统,通过一系列的状态评估规章将各种变量代码化,形成各种可以度量的信息数据库,能够准确地了解输电设备的运行状态,提出最合理的维修策略。状态评估工作主要分为两大部分:线路单元评估和整体评估。首先,从线路单元评估方面来说,工作人员要充分考虑各个线路单元的状态,并对各个状态进行评估,作扣分处理。同时,要注意一点,在对某一输电线路中的同类设备进行状态评价时,不应对各个设备的状态量进行重复累加,而要以最严重的状态进行相应的扣分。如果评价过程中出现多个状态量变化的情况,且变化的原因及具体的部件无法明确时,工作人员应该进行相应的分析诊断,判断状态量异常的原因。其次,线路的整体评价是在单元评价的基础上发展起来的。如果单元评估为严重异常,则整个线路的整体评价也为严重异常。通过状态评估的相关结果,工作人员可以对设备发生故障的概率以及设备的风险等进行分析,并建立相应的更为完善的数据模型。当然,我司已经完成了相应的程序化验证工作,一些具有相应特征的数据库和计算模块已经建立起来,为之后的状态评估工作提供了有利的支持。在状态评估的过程中,我们必须注意一点,该方法中无法获得足够多的历史评价数据,其预测的精度可能会大有下降。对此,我们要做好以下两方面的工作:第一,加强沟通与交流,力求从更多的渠道获得更多的状态评价的历史数据;第二,进一步优化状态评价的输入接口或者相应的界面,允许工作人员自动或者手动输入相关信息。

3.总结

贝叶斯网络的架空输电线路隐形故障诊断系统的应用,给输电系统的正常运行提供了有利的保障,促进了我国电力行业的进一步发展。

贝叶斯判别分析 第4篇

一、贝叶斯判别法的基本思想

设有k个总体 , 它们的先验概率分别为 。各总体的密度函数分别为: (在离散情形是概率函数) , 在观测到一个样品X的情况下, 可用著名的Bayes公式[2]计算它来自第g总体的后验概率 (相对于先验概率来说, 将它又称为后验概率) :

并且当

时, 则判X来自第h总体。

有时还可以使用错判损失最小的概念作判决函数, 这时把X错判归第h总体的平均损失定义为

其中称为损失函数。它表示本来是第g总体的样品错判为第h总体的损失。显然 (3) 式是对损失函数依概率加权平均或称为错判的平均损失。当h=g时, 有 ;当 时, 有 。建立判别准则为如果:

则判定X来自第h总体。

二、实例分析

本文参考有关财务评价准则, 给出了一套可以全面反应企业财务状况的指标体系, 该体系包括以下13项指标:

X1:流动比率;X2:速动比率;X3:总资产周转率;X4:存货周转率;X5:资产负债率;X6:每股收益;X7:净利润增长率;X8:每股收益增长率;X9:主营业务毛利率;X10:主营业务利润率;X11:主营业务利润率;X12:净资产收益率;X13:总资产利润率。

1. 数据处理

上述指标构成了一个整体, 能充分反映企业财务的实际情况。但是这十三个指标有很强的相关性, 如果利用所有的指标进行财务分析, 难免出现重叠的信息, 导致分析过程复杂化。因此本文对上述指标进行因子分析, 将13个财务指标归为三类, 第一公共因子在X6, X9, X10, X11, X12, X13上有较大载荷, 反应了公司获利能力, 可命名为获利因子;X3, X4, X7, X8归为一类, 命名为运营因子;X1, X2, X3反应了公司变现能力, 归为一类, 命名为变现因子。

表1是因子得分系数矩阵, 根据表中的因子得分系数和原始变量的标准化值, 就可以得到每个观测值对应的主因子得分, 进而大大简化了财务危机的判别过程。

2. 利用贝叶斯判别法对财务困难进行判别

利用SPSS软件, 根据上述确定的三个因子及其样本数据, 进行贝叶斯判别分析, 得到下面的贝叶斯判别函数表:

从表2可以得到两类判别函数:

第一组:

第二组:

将各样品的自变量值代入上述两个Bayes判别函数, 得到两个函数。比较这两个函数值, 哪个函数值比较大就可以判断该样品判入哪一类。下面给出错判矩阵:

从表3可以看到, 在70家实际被ST的公司中, 有61家被正确地判别, 正确率为87.1%;在70家财务正常的公司中, 有59家被正确预测, 11家被错判, 正确率为84.3%;模型总的预测正确率为85.7%, 说明模型的判别效果比较理想。

三、结论

随着计算机科学的迅速发展, 贝叶斯的应用越来越广泛与深化。目前贝叶斯方法中存在的主要问题是合理先验分布的选择。已有研究成果中先验分布选择的随意性较大, 缺乏程式化的分析方法。但从总体上说, 贝叶斯判别模型具有良好的预测效果, 可直接作为金融机构、投资者、债权人和监管机构等做财务危机、信用风险预警分析的一个有效工具。

参考文献

[1]郑茂:我国上市公司财务风险预警模型的构建及实证分析[J].金融论坛, 2003 (10) :39-41

[2]吴喜之:现代贝叶斯统计学[M].中国统计出版社, 北京, 2000

基于贝叶斯网络的试卷分析 第5篇

1 贝叶斯网络与因果推理

贝叶斯网络又称为置信网络, 是基于概率分析、图论的一种不确定性知识的表达和推理模型。一个典型的贝叶斯网络由两部分组成: (1) 有向无环的图, 其中每一个节点代表一个变量、属性、状态或其他的实体, 节点之间的弧反映了变量间的依赖关系, 指向节点X的所有节点被称为X的父节点。 (2) 与每个节点相联系的条件概率表列出了此节点相对于其父节点所有可能的条件概率。贝叶斯网络约定以节点Vi的父节点为条件, Vi与任意非Vi子节点条件独立。

2 利用BNT软件包分析试卷

在此次的试卷分析试验中, 以过去学生的期末考试成绩为依托, 随机抽取了一部分学生的考试信息作为此次试验的原始数据。利用软件筛选、整理这些数据, 然后通过基于MATLAB语言开发的关于贝叶斯网络学习的BNT软件包建模, 主要完成建立贝叶斯网络的工作, 以此来反映选定因素对试卷成绩的影响。影响试卷成绩的因素主要有:A作业提交率、B上课出勤率、C否是留级生、D主观题得分率和E客观题得分率。

2.1 为试卷分析筛选数据

第一步:把影响试卷的因素作为变量, 即贝叶斯网络模型中的节点, 得到的候选数据集如表1所示。其中, R (is pass) 标记为该样本的状态值, “1”表示成绩及格, “0”表示成绩不及格。

第二步:由于贝叶斯网络是用离散型变量, 因此, 对原始数据进行处理, 数据离散处理结果如表2所示。

例如离散处理“上课出勤率”这一变量。根据教学经验, 一般同学的出勤率都在90%以上, 如果低于70%, 学习成绩很可能不理想, 所以, 将变量B分为3段小于70%为low, 70%~90%为mid, 大于90%为high。

第三步:数据格式转换。

根据MATLAB的特点, 将数据集转换为矩阵的形式, 而且所有属性的取值全部依次编号为1, 2, 3.

以由此得到的样本数据集作为模型数据集来构造模型。

2.2 贝叶斯网络的建模

接下来的工作就是以得到的数据建立贝叶斯网络, 然后对得到的贝叶斯网络进行参数学习。从得到的贝叶斯网络和学习得到的参数中可以看出选定的因素对试卷的影响。

经过实践, 笔者得到的结果是:“上课出勤率”和“作业提交率”是影响其他因素的原因, 而“上课出勤率”又可以影响到“作业提交”, 这是与限制了父节点个数的结果相同的部分, 不同的是: (1) “是否是留级生”又影响了“客观题得分率”和“主观题得分率”两项。如果出现这样的结果, 不难看出, 留级生在考试分数上和正班生还是有一定差距的。 (2) “主观题得分率”影响了“是否及格”这一项。出现这种结果是因为在统计数据时, 主观题分值占了60%.

从以上试验结果的数据中可以看出, 作业提交率和上课出勤率对其他三个因素的影响。

3 结论

对试验结果分析后发现, 得到的结果基本符合实际情况。学生的“上课出勤率”和“作业提交率”是影响其学习成绩的重要因素。由此可见, 知识是平时一点一滴积累起来的, 即便是在大学校园, 在日常教学过程中, 也应加强对学生的纪律管理, 督促学生按部就班地学习。

参考文献

预案分析的贝叶斯网络方法 第6篇

预案是指根据评估分析或经验,对潜在的或可能发生的突发事件事先制定的应急处置方案。目前我们在编制预案时最常用到的方法是关键路径法,在预案实际应用过程中常会受到各种原因造成的不确定性问题影响,使得预案的执行结果偏离预期结果。尤其是在大型复杂的预案执行过程中,因其各个活动之间存在很多错综复杂、关联耦合的相互关系,不确定因素及不确定信息充斥其间,使得这种偏离预期会更明显。面对不确定性问题对预案执行的影响,使得我们有必要对预案制定是否科学、内容是否完备等进行评估,对在现有资源情况下预案偏离预期结果的可能性进行分析。目前对预案进行评估分析时,人们常会考虑用预案演练的方式来进行,但是并非所有的预案都可以通过演练的方式进行检验,同时演练的高成本在一些预案中也难以承受。同时由于关键路径法是一种处理纯粹确定性问题的方法,这种方法本身没有试图处理或量化不确定性问题,所以我们必须引入一种其它的方法来进行预案分析。

本文推荐的基于概率推理的贝叶斯网络法是为解决不确定性、不完整性问题而提出的,因其对于解决复杂项目的不确定性问题和活动之间的关联性引起的不确定性问题有很大的优势,而被广泛使用于一系列的决策支持应用,将其应用于预案分析中还是一种较新的尝试。

1 贝叶斯网络法

1.1 贝叶斯网络

贝叶斯网络(也称为信念网络,因果概率网络,因果网,图形概率网络,概率因果模型和概率影响图)为很多涉及不确定性和概率推理的问题提供决策支持。贝叶斯网络是一个有向图,连同相关的概率表。

图1由节点、箭线和概率表构成。该图显示了在某项目中那些特定任务延迟原因构成的简单贝叶斯网络。这些节点代表不确定性变量,每个节点都有一组状态(例如“合同签订”节点的“按期”和“逾期”)。箭线代表变量之间的因果关系或影响力(例如“合同签订”和“工人技能”可能会影响“按期完工”)。概率表代表每个节点变量状态的概率。因为变量没有前因(称为起点节点),概率表只包含事前分布(例如,合同签订节点PA1=0.95和PA2=0.05)。这也被称为先验分布用以表示之前的信念。对于每个有前因的变量,概率表对每个前因状态有条件概率的组合(例如图1,按期完工的概率表)。这也被称为似然函数,表示前一特定状态引起某一结果的可能性。

贝叶斯网络是将概率统计应用于复杂领域进行不确定性推理和数据分析的工具。当一些变量已经被观测到时,我们可以据此推断其它未被观测变量的概率。这些观测值代表了后验概率并通过贝叶斯规则作用于每个受它影响的节点,因此其影响就可以传播到贝叶斯网络上的其它节点并修改这些节点的概率分布。

1.2 贝叶斯网络的活动时间

图2所示是一个按不确定性来源和其对某项活动持续时间影响为模型建立的贝叶斯网络原型,模型中包含使得活动持续时间不确定的那些变量。其中初始时间估计是活动的第一期估计,是根据历史数据,过去的经验或专家判断进行的初始估计;资源包含对活动时间带来影响的任何因素,资源水平可以从“成本”,“人员经验”和“技术水平”这些可直接观察的“指标”节点中推断出来。通过显示各种情况下运行该模型的结果,可帮助项目管理人员对各种“指标”节点对活动的影响认识得更加深刻。

2 贝叶斯网络法在预案分析中的应用

为说明如何通过贝叶斯网络的活动时间模型对一个活动进行分析,假设在一个预案中某项活动的贝叶斯网络时间模型如图2所示,“成本”、“人员经验”及“现有技术水平”为“指标”节点,“指标”节点和“资源”的等级简单的分为低、中和高三种情况。未观测到各“指标”节点情况时,假设各“指标”节点三种情况出现的概率均等,根据历史数据,过去的经验或专家判断,就可以通过贝叶斯网络法计算得到活动时间的概率分布,结果如图3所示。

根据得到的概率分布还可以计算出活动时间累计概率。在图4中可以看到,应用贝叶斯网络法我们可以通过计算得到任务在多少天内完成的概率是多少,可通过计算的结果来验证。例如按照上述假设在未能观测到“指标”节点的情况下,有90%的可能性在11天15小时内完成该项活动。据此,我们可以通过计算得出的结果来分析应用关键路径法制定的预案中各个活动的活动周期的合理性。

贝叶斯网络法用于处理不确定性问题的优势还体现在可以应用后验概率来修订已得到的结果。在上例中如在我们已知“资源”等级为高的情况下,被修订后的“活动时间”应如图5所示。这时活动有90%的可能性在4天7小时内完成该项活动。这样使得我们可以在预案执行过程中实时的修订原有“估计”,使得预案执行者在预案实际执行过程能更好的调配资源,以实现预案执行效果最优。

贝叶斯网络法在预案分析中另一个重要的应用是,在“活动时间”有约束的情况下,可通过计算得到“资源”的所需等级。如我们在已知“活动时间”需控制在4天半以内的情况,“资源”所需等级如图6所示。

3 示例

为了说明如何将贝叶斯网络引入预案的映射过程,同时避免由于引入贝叶斯网络后使原有活动网络变得过于复杂,图7所示的保障预案是一个用关键路径法制定的最为简单的保障预案。

如图7所示,某产品承制单位针对使用单位用关键路径法编制的一个简单保障预案。该预案由4个活动A、B、C和D组成。用关键路径法的计算结果如表1。可以看到活动A,B和D的总时差=0,整个保障活动需要20天。

将贝叶斯网络法引入原有的保障预案后可得到如图8所示保障预案贝叶斯网络图。在该网络图中节点表示活动A、B、C和D的“活动时间”,箭线尾代表上一活动的结束,箭线头表示下一活动的开始。活动A、B、C和D的“活动时间”、“资源”和“指标”节点等都可以用贝叶斯方法进行单独的分析,也可在对每一活动分析基础上对整个保障预案进行分析。

4 结论

综上所述,可以看到利用贝叶斯网络法分析预案中的不确定性问题的优势是:能明确量化不确定性和模型变量间的因果关系;使人们有可能用新的数据(如一些观测值)推翻原有概率分布;可用不完整数据进行预测。但我们也必须认识到引入贝叶斯网络会使活动网络变得复杂,在大型的工程项目中这种影响尤为突出,这个问题需进一步分析研究加以解决。

摘要:在对预案进行评估分析和执行过程中常会涉及不确定性问题,传统的预案编制工具关键路径法(Critical Path Method,CPM)不具备处理不确定性问题的能力。本文推荐的贝叶斯网络法(Bayesian Networks)因其处理分析不确定性问题的能力已经被广泛应用于一系列的决策支持应用,但对预案评估分析的应用是新颖的。本文介绍了用贝叶斯网络法分析传统关键路径法编制的预案。

关键词:预案分析,不确定性问题,贝叶斯网络

参考文献

[1]Pan H P,Liu L.Fuzzy Bayesian Networks—a General Formalism forRepresentation,Inference and Learning with Hybrid Bayesian Networks.Internationa Journal of Pattern Recognition and Artificial Intelligence,2000,14(7):941-962.

[2]PEARL J.Bayesian networks[R].Tech Rpe:R-277,11,2000.

[3]DEVIREN M,DAOUDI K.Structural Learning of Dynamic BayesianNetworks in Speech Recognition[R].Euro speech,2001.

[4]姚玉玲,刘靖伯.网络计划技术与工程进度管理[M].北京:人民交通出版社,2008,27-35.

贝叶斯判别分析 第7篇

载重货车超载问题最早于1913年美国第一部管制车重的法规中被提出,是指机动车的实际装载量超过核定载质量的行为。发展至今,美国、日本等国家都已建立了较完善的综合性治超体系并且成效显著。由于客观运输条件和社会文化环境的差异,国外有效的治理方案都无法切合中国的实际情况。中国道路货运业陷入“压价超限超载运力过剩再超限超载”的恶性循环之中[1]。

在过去10年,运输超载决策均衡问题受到很多关注,而博弈论是研究冲突对抗条件下最优决策问题的常用理论,被广泛应用于超载控制的分析中[2]。李忠奎等建立了货运企业收入的计量模型,对运输企业在“惩罚博弈”下可能的行为选择进行了研究[3]。方媛媛等采用弹性治理方罚金函数和查超成本函数,构建治超博弈模型[4]。庞小宁等基于执法者与运输者之间的博弈模型分析,指出运输者的逐利行为和执法者以罚代管的行为是导致超载运输合法化的主要原因[5]。蒋在文建立运输企业、道路监管部门和政府的三参与者博弈模型,对超载治理中运输企业与道路监管部门之间的合谋决策兴奋进行探讨[6]。目前,在治超博弈模型构建方面已取得一定进展,但以往的模型中并未细化超载运输的负外部效应。为此,本文综合考虑事故成本和运输价格因素,构建超载治理博弈模型,并对各参数相互影响下的均衡解进行分析,找出道路货运运输利润与安全风险的均衡点。

1 交通事故与超载的内在关联

2008~2010年全国共发生87起1次死亡10人以上的重特大道路交通事故,导致1 266人死亡,其中涉及货车重特大事故32起[7]。统计分析1次死亡10人以上的货车重特大事故案例发现,比例最高的事故诱发因子是超载运输,图1为2008~2010年超载事故比例的分布情况。结果显示3年的超载事故比例均在30%以上,特别是2010年货车重特大事故中竟有70%货车存在超载现象。产生这一结果的主要原因是道路货运成本过高,运输者之间竞争激烈,迫使很多企业或个人选择超载运输。在交通事故中,很多轻微超载现象可能没被主管部门所察觉或没被统计在事故报告里,故实际的数值会远比统计值大得多[8]。

2 超载利益主体的矛盾分析

道路货物运输系统中,最直接相关的2个利益方是管理者与运输者,因此深入剖析我国治超方案实施过程中管理者和运输者的行为特征就显得尤为关键。

方案1:集中治理。2004年全国开展车辆超载集中治理活动。各管理部门联合出动大量人力物力,取得显著成效,但成本太高,缺乏可持续性。此后管理方重点进行日常主要干线公路的检查,运输者则选择不断向县乡道分散、昼伏夜出。方案1说明此策略对博弈双方的利益冲突都很大,很难达到均衡。

方案2:计重收费。2001年全国各省陆续推广实施计重收费,致力于遏制“大吨小标”现象[9]。但计重收费设备安装在收费站的出口车道上,不能从源头杜绝超载行为,不安全因素依然存在。显然方案2给道路货运业带来了负效应,并非真正的博弈均衡。

方案3:源头治理。近年来,管理方出台多项法律法规,从市场管理机制、运输者日常管理及运行监控等多方面强化运输源头管理,但我国运输者数目繁多、实力参差不齐,很难达到预期的效果。

综上所述,治理超载的根本途径不是强制减少超载现象,而是管理者和运输业者博弈双方达成利益均衡。

3 超载博弈模型的建立与分析

本文的博弈均衡模型涉及2个参与者:运输者A和管理者R。运输者的策略集SA={超载,不超载},管理者的策略集SR={检查,不检查}。在整个运输网络中,各参与者选择行动是按先后顺序发生的,博弈时序如图2所示。通常情况下,管理者和运输者在运载量方面常存在信息不对称的现象,故参与者之间呈现出1个具有不完全信息的动态博弈过程。

3.1 记号与假设

假设货运市场上存在高、低2种运价,以高运价运营的概率为α, 则低运价的概率为1-α。假设高运价时运输者发生交通事故的概率为μ1,低运价时事故的概率为μ2,一旦发生事故运输者损失为w,也将给管理者带来损失为η(η

为了预防交通事故的发生,管理者决定是否做检查,设检查的概率为δ,检查的成本花费为Cr。如果经检查运输业者未超载行驶,则相安无事;反之,则处以数量为b的罚金。

3.2 收益模型

运输者的收益主要取决于运输成本和运输状态。考虑高、低2种运价,运输者的收益最优化问题可以表述为

式(1)为目标函数,使运输者的收益最大;式(2)是高运价下的运输成本大于低运价时的成本;式(3)表示超载处罚金一般要比超载带来的额外收入要高;式(4)表示在任意市场运价下,超载运输获得的利润始终比不超载时多。

管理者的收益主要取决于检查概率和车辆的运输状况,计算公式为

-δCr+δb(β,v)-η(μ1,μ2)

3.3 模型求解

完美贝叶斯均衡法则是不完全信息动态博弈均衡的基本均衡概念。按照贝叶斯法则计算管理者的判断为

管理者和运输者双方的策略,在运输业者选择“超载”策略的情况下,管理者的期望得益为

同理也能列出运输者选择“不超载”时,管理者的期望得益为

当Uundefined=Uundefined及Uundefined=Uundefined时,管理者的混合策略满足序列理性要求的检验。用Matlab计算出高运价下选择“超载”的概率为

undefined (11)

则低运价下选择“超载”的概率为

undefined

式中:R、X为复杂的计算公式,由于运算结果庞大,本文将复杂部分予以简化。

在管理者选择“检查”的策略下,运输者的期望得益为

当U超载 =U不超载时,运输业者的混合策略也通过了序列理性的检验。求得:

undefined (15)

3.4 模型分析

由式(11)、(12)知,超载的概率β、v与运价变化率成反比,运价α越低,运输超载现象越突出。自运输市场开放以来,运输量和运输业者都不断增加。然而由于能源危机、大量收费公路的出现导致运输成本不断上涨,运输企业的利润空间变窄。运输业者竞相压价承揽货源,以超限超载运输获取利润。长此以往,市场必然供大于求,出现运力过剩的现象。运输业者为了求生存,定会选择再超载超限运输,进入“压价超限超载运力过剩再超限超载”的恶性循环中。不但破坏了运输市场的秩序,且严重影响了运输的安全性。运价α差异越大,运输模式的变化也就越大。此外,超载的概率β 与超载被查出时的处罚金b成反比。处罚金b的增加直接影响运输者的收益,驱使超载的运输者改变其出行选择,但并不是抑制超载现象的最优策略。

由式(15)可知,管理者的检查概率δ与运输者的事故损失w成正比,与超载被查出时的处罚金b成反比。事故损失值w越大,说明违法超载运输者越多,管理者应该加大检查力度。但加大检查力度,无疑会增加查超成本Cr,此决策并非管理者的最优选择。反而言之,加大处罚力度b,可以减少管理者的检查频次和成本,也减少了事故的发生率,此决策是管理者的最佳选择。

综上所述,利润不均衡是导致道路货运市场无序竞争的主要原因。因此,在给予博弈各方一定的利润空间的基础上,通过行业宏观管理合理调控运输价格,改变原有的利润分配模式,加大处罚力度,使运输者理性放弃超载的积极性,也大大节省了管理者的监管成本,是解决超载问题的最优策略。

4 结 论

1) 货车重特大事故的发生与车辆超载运输密切相关,统计分析表明,2008~2010年货车重特大事故中超载比例均达30%以上, 2010年超载比例竟增至70%。

2) 基于3种治超方案对管理者和运输者两大利益主体的行为特征进行剖析;研究表明,博弈双方利润分配均衡与否是治超成效的主要影响因素。

3) 对比高、低运价和事故成本因素,构建运输者与管理者超载博弈模型;分析表明:运价是产生道路货运超载的直接因素,而要实现运输的良性循环和减少交通事故的发生,必须给予博弈各方一定的利润空间,通过行政手段合理调整运价,使运输者理性放弃选择超载运输的积极性。

摘要:长期超载运输使得货车安全性能急剧下降,诱发了大量的道路交通安全事故。文中对运输负效应影响下的超载治理机制进行了研究。在对超载利益主体的行为特征进行深层剖析的基础上,综合考虑运输价格和事故成本的影响,构建管理者与运输者之间的超载治理博弈模型,并利用完美贝叶斯均衡法则求解。结果表明,在运输条件不变的情况下,运输价格的调整显著影响运输模式的变化。改变原有的利润分配模式,使运输业者理性放弃选择超载运输的积极性,是从根本上解决超载问题的关键。

关键词:道路运输,超载,博弈论,完美贝叶斯均衡

参考文献

[1]Xu S Z,Zhao Q.Study on vehicle-mounted overloa-ding control system for passenger vehicles[J].Pro-cedia Engineering,2011(15):1214-1218.

[2]Dino G,Roger B M.Sequential equilibria in Bayesiangames with communication[J].Games and Econom-ic Behavior,2007,60(1):104-134.

[3]李忠奎,荣朝和.治理公路超载超限运输的长效机制和对策研究[J].中国公路学报,2005,18(4):96-99.

[4]方媛媛,沈传海.公路货运超载治理博弈分析[J].长安大学学报:社会科学版,2009,11(4):23-28.

[5]庞小宁,张旺.货运机动车超限超载行为博弈分析的制度启示[J].山西财经大学学报,2011,33(S1):35-36.

[6]蒋在文.道路超限运输治理中的合谋行为理论研究[J].公路,2012(1):122-127.

[7]Li F Y,Hu DW,Zhou C X,et al.Factor Analysisof Grievous Road Traffic Accidents in China[C]∥The 11th International Conference of ChineseTransportation Professionals,Nanjing:ASCE,2011:1966-1977

[8]Sauerzapf V,Jones A P,Haynes R.The problemsin determining international road mortality[J].Ac-cident Analysis and Prevention,2010,42(2):492-499.

贝叶斯判别分析 第8篇

显著性检测问题来源于人类的视觉注意机制,这种机制使人们可以在没有训练的情况下迅速将注意力聚焦在显著目标上。它是由人眼视觉系统的高度发达所决定的,而计算机视觉目前还达不到这样的程度,基于视觉注意显著图的生成方式还没有形成统一模型。同时由于显著区域检测在自适应压缩、目标检测、图像检索等中有着广泛的应用价值,因此,显著目标区域检测得到国内外学者的广泛关注。

目前关于显著区域提取的工作主要划分为三个大的类别:一类是基于低级视觉特征,由数据驱动的自底向上的视觉计算模型。其中的大部分都是基于像素点和周围像素的特征对比,包括亮度、颜色和梯度方向等。例如文献[1,2]是此类方法中的经典方法,此模型建立在局部特征对比的基础上,忽略了显著目标自身信息的指导,使得检测结果不够理想。为此文献[3]在Itti模型的基础上利用深度搜索和层次转移来模拟人眼关注物体的顺序,引入了视觉树算法,此算法计算结果很大程度上依赖于参数的选择。进而文献[4]提出利用进化规划原理检测显著区域,核心是局部区域的显著性与其在整幅图像中出现的频率成反比,缺陷是难以保证大目标检测的准确性。针对该问题,文献[5,6]提取出的显著区域也能保留精准的边缘,且该算法用三种低级视觉特征,设计了一种新的特征融合策略,通过分析不同特征对显著图产生的不同作用而动态的计算出特征的权值获得更为鲁棒的显著图。一些研究者从频域角度提出基于残余频谱思路,利用自然背景的傅里叶频谱的统计特性,将频谱的残差傅里叶逆变换计算显著图,算法对于小目标较好[7,8]。另外一些研究者利用相位谱提出四元数傅里叶变换相位谱(PQFT)的多分辨率时空显著性检测模型,通过计算图像的四元数表达式来获得时空显著图[9]。第二类是基于高级视觉特征,与任务、知识等相关的自顶向下的视觉选择注意模型,其中比较有代表性的是基于判别显著性的检测方法,将提取图像块特征并且聚类作为先验知识来模拟人眼对不同物体的辨别能力[10,11]。例如文献[12]提出一个基于目标识别的生物视觉注意机制模型。这个模型包括训练阶段和注意阶段,并把自底向上和自顶向下的显著图融合为一幅引导视觉注意的全局显著图。文献[13]在自底向上的显著性度量基础上,提出熟识度来引导自顶向下视觉注意目标识别,构造出应用于SIFT特征的统一视觉注意模型(UVAM)。第三类是将概率模型引入显著检测问题,从底层特征的空间关系出发,计算特征的空间复杂度来获得像素的显著值。例如一些文献先对颜色成分进行高斯混合模型聚类,通过对比得到颜色显著图,然后结合方向的空间分布性质和方向熵对比计算得方向显著图[14]。另外一些将贝叶斯决策[15]、马尔科夫搜索[16]、窗口内外的统计分布特征[17]引入显著性检测过程,实现显著目标检测。

综上可见,因高级视觉计算模型需要对大规模的图像数据库进行学习,计算量大且不具有通用性,所以显著提取算法主要从低级视觉出发,目前现有的低级视觉模型主要依赖像素间的相互对比,缺乏利用显著目标的自身特性以及相互关系来分析和理解。为此,依据显著目标是显眼、紧凑和完整的思路,本文提出基于过渡滑动窗特征分布贝叶斯分析的视觉注意检测模型,既考虑了不同的低级显著特征,同时通过贝叶斯结构考虑各个显著元素之间的关系,通过对比贝叶斯结构中内窗和过渡窗外的特征值得到该像素是显著像素的概率值,最后通过取最大值模型合并得到输入图像的显著图。

1 显著目标检测系统组成

本文构造系统组成框图图1所示,首先根据局部区域与其多个尺度邻域的对比得到亮度显著值;然后利用颜色信息的空间紧凑性、同质性和孤立性得到颜色显著值;同时通过多尺度多方向的Gabor滤波器组模拟人类视觉系统提取图像块的方向显著值;把这些显著特征一起输入单尺度的贝叶斯结构,通过对比贝叶斯结构中内窗和过渡窗外的特征值得到该像素是显著像素的概率值,此值为显著值,最后通过取最大值模型合并得到输入图像的显著图,从而提取显著目标。

2 基于过渡滑动窗特征分布贝叶斯分析的的视觉注意检测模型

2.1 亮度显著值

通过对大量显著目标的观察发现,如某个目标显著,那么其像素值与其邻域存在较大差异。目标的亮度显著值是指该目标亮度与其多个尺度邻域对比的差异和。因此像素点(u,v)亮度显著值:

其中:Dt(u,v)表示点(u,v)的像素值与其tt邻域内像素平均值的欧氏距离,l(u,v)表示点(u,v)的像素值,mt(u,v)指像素点(u,v)的tt邻域内像素的平均值,t={2z,4z,8z},z=min(m,n),m、n为图像的宽和高。

亮度显著图示例如图2。

2.2 颜色显著值

颜色是彩色图像的重要信息,人类视觉感知系统对颜色信息的敏感度较高,所以颜色信息是视觉注意中非常重要的特征。为实现合理的颜色特征显著性检测,首先提取图像的颜色主分量,然后以颜色主分量为中心进行聚类,最后依据显著目标是显眼、紧凑和完整来进行显著性检测。在Lab颜色空间,利用a分量和b分量分别建立直方图,用高斯函数对其进行平滑。将两个直方图的局部最大值组合,得到组成这幅图像的颜色主分量。以颜色主分量为中心按照距离最小原则进行初始聚类,设定一个阈值T,当属于某种颜色分量在图像中所占的比例小于T时,将这种主分量去掉,并把原本属于它的像数点归入到与其距离次最小的颜色主分量,突出主分量的作用。颜色主分量提取示意图如图3。

下面依据颜色信息空间紧凑性、同质性和孤立性来进行颜色显著值计算。

1)空间紧凑性(Space Compactness),指颜色分量的空间分布的紧凑程度,可由类内方差衡量。由于靠近图像中央区域的目标类间方差和较小,因此可用类内方差和类间方差相结合来检测空间紧凑性,还可以抑制方差较大的背景区域。颜色分量i的类内方差iVin、类间方差和iVout分别为

式中:iμsp=⎢⎣Yave(i)⎡Xave(i)⎥⎦⎤表示颜色分量i的质心,Xave(i),Yave(i)分别指颜色分量i的像素点的横坐标和纵坐标的平均值。diisp表示颜色分量i的像素点的空间位置对于颜色分量j的质心的偏离程度,Num(i)表示颜色分量i的像素点个数。由于方差越大,其空间分布越扩散,显著性越差。因此,将类内方差iVin归一化使得最大的iVin的值为0,而最小的iVin的值为1,同理,归一化iVout使得最大的iVout的值为0,而最小的iVout的值为1。颜色分量i的空间紧凑性ic为

2)同质性(Homogeneity),指局部区域颜色分量相似度,反映区域的一致性,颜色分量i同质性定义为

其中:am(i)=Num(i)∑(x,y)∈sp(i)a,bm(i)=Num(i)∑(x,y)∈sp(i)b,am(i),bm(i)分别是指颜色分量i的像素点的a分量和b分量的平均值,μiab表示颜色分量i的质心。iVab表示颜色分量i的方差,Siab表示由颜色分量i的像数点的a分量和b分量组成的颜色向量集。

3)孤立性(Isolation),是指局部区域相对于周围环境的孤立程度。区域与其周围环境的差异越大,越能引起人类的注意。颜色分量i的孤立性定义为

其中:μjab指颜色主分量j的质心,N(j)表示颜色分量j在图像中所占的比例。

通过空间紧凑性、同质性和孤立性综合实现颜色显著值的计算,颜色分量i的显著值为

2.3 方向显著值

方向特征是一种依赖于亮度的视觉特征,它反映物体表面的内在特性。由于人类的视皮层细胞可以被看作是一个线性空间滤波器,因此Gabor滤波器可以有效地描述哺乳动物视皮层细胞感受野的剖面。同时人类视觉系统具有多通道和多分辨率的特征,而二维Gabor函数正是一种基于多通道和多分辨率分析方法的典型代表,所以利用多尺度多方向的Gabor滤波器组模拟人类视觉系统提取图像块的方向显著值。实验中滤波器选取55、99、1313和1717四个尺度,为了降低计算复杂度,每个尺度仅选择四个方向θ0=0{°,45°,90°,135°}作为Gabor能量的朝向选择,构成一个16维的Gabor滤波器组(4个尺度4个方向),将每个方向的四幅特征图通过取最大值合并得到四幅不同朝向的方向特征图,然后再通过取最大值合并得到一幅方向显著图。

2.4 像素特征值向量

由前三小节描述获得某一像素点的特征向量为

其中:x为输入图像中的一个像素点,Lx为点x的亮度显著值,Cx为点x的颜色显著值,Ox为点x的方向显著值。

2.5 基于过渡滑动窗的贝叶斯结构

设一个矩形窗R,分为三部分:内部窗K、过渡环T和外围部分B,如图6所示。

2.5.1 显著值

在一个矩形窗R内,内部窗K、过渡环T和外围部分B,如图6所示。标记R和K的宽和长分别为

wR、hR和wK、hK。设x∈ℜ2为窗R中的一点,而F(x)为x点处的特征值向量,由前4节得到Fx={Lx,Cx,Ox}。

定义两个假设,H0:点x不显著;H1:点x显著。并且相应的概率为P(H0)和P(H1)。首先假设H1对于K中的点成立,H0对于B中的点成立。由以上假设,可得条件特征分布p(F(x)|H1)和p(F(x)|H0)。根据贝叶斯概率公式P(A|B)=P(B|A)P(A)/P(B),可以定义

并且由P(F(x))=p(F(x)|H0)P(H0)+p(F(x)|H1)P(H1),可以进一步将式(8)写成

由P(H1|F(x)),可以计算出K中每个点为H1的概率,然后由设定的阈值判断假设H1是否成立。则定义K中的点x的显著值S(x)为所估算的概率值。

由上述定义所得的显著值反映了K和B中的特征值的对比。

2.5.2 显著性检测

设I为长和宽分别为hI和wI的输入图像,令R(i)为中心在点i上的窗,以步长ωs滑动此窗,计算每一处窗位置i的显著值Si(x)。步长ωs的选择必须保证内窗与内窗之间可以重叠,则某一点的显著值为

由于此方法结合了过渡窗,只要保证步长的选择使内窗之间重叠就能使每一处的内窗K跟外围部分B进行充分的对比,因此不需做内窗K的多尺度假设,只要进行单尺度的运算就能保证检测的完整。

2.5.3 条件概率密度函数

为了计算出S(x),需要估计出条件概率密度函数p(F(x)|H1)和p(F(x)|H0)。因此在K和B中计算归一化特征直方图。进一步用高斯核函数平滑此直方图以增加鲁棒性,分别独立计算每个特征通道的显著值,取最大值得到最后的显著值。

令hisK(F)和hisB(F)分别表示从K和B得到的直方图。g(F)为高斯平滑函数。则所估算的条件概率密度函数p(F(x)|H1)和p(F(x)|H0)为

其中:*表示卷积算法,N(⋅)表示和归一化操作:

3 仿真实验

为了验证算法的合理性和有效性,本文采用MSRA数据库中的图片进行实验。将本文算法与Itti模型、文献[8]算法(简称Hou算法)、文献[15]算法(简称SUN算法)、文献[17]算法进行对比;最后根据查准率、查全率和F-Measure等性能指标进一步测试所提算法的性能。

在本文算法实验中选取如下窗大小为尺度,输入图像宽和长为wI和hI,R和K的宽和长分别为wR、hR和wK、hK,ωs为步长,B的宽和长为wB、hB。取wK=0.25max{wI,hI},hK=0.1max{wI,hI},

并且P(H1)=0.2。比较所得到的显著图如图8。

从图8可以看出,本文算法有较好结果。Itti模型可以较好检测到显著目标,但是当背景较杂乱时会出现误判现象,见图8中第三、五和第六个目标。SUN算法能检测出较好的边缘,但是对于显著目标的检测内部不饱和。Hou算法当背景较复杂时,检测效果不够理想,文献[17]所提算法在目标和背景的颜色差异比较大时有较好的表现,但是当目标与背景的颜色相近时提取的显著目标不够完整,且对于不同颜色组成的同一物体检测效果不佳,如图8中第二、三、五和六个目标。与上述四种算法相比,本文算法能够比较准确和全面地检查到显著区域,而且较好的抑制杂乱背景影响。但是,当目标与背景差异较小或背景对目标存在较大干扰时,所提算法效果下降明显,如果需要在背景较复杂图像条件下准确检测显著目标,需要加入更多的语义信息进行辅助处理。

对本文算法和Itti模型方法、Hou算法、SUN算法、文献[17]算法分别采用自适应阈值方法进行显著目标提取。对于所有算法进行相同的后期处理:关闭孔洞、去除面积较小的区域(面积阈值为图像面积1/1 000)。比较所得到的显著目标提取图,如图9所示。

同时MSRA显著目标数据库提供了9名不同的观察者为图像样本的显著目标制定的矩形框,对不同的矩形框取平均并以其为标准把矩形框内部区域判为目标(值为1),矩形框外判为背景(值为0)得到二值化的显著概率图,采用查准率、查全率和F-Measure检测算法的有效性,F-Measure定义如下:

式中:Precision表示查准率,Recall表示查全率,α取0.3。

从图10可以看出,本文提出算法在查准率、查全率和F-Measure都好于其它三种算法,并且在查全率上有较大改进,表明本文算法思路的合理性。

结束语

依据显著目标是显眼的、紧凑的和完整的思路,将紧凑性、同质性、孤立性与初级视觉特征一同作为像素点特征通过一个以局部窗口的块来估算显著值的过渡窗贝叶斯模型来提取视觉注意显著目标,将此方法应用于各类具有不同特点的图像进行仿真实验,得到较好的检测结果。与其他四种具有代表性的算法相比,该方法的检测结果更加准确、合理,对于目标检测的整体性效果更好,但本文模型也存在不足之处,由于只考虑到低级视觉特征,因此当目标与背景差异较小或背景对目标存在较大干扰时,所提算法检测性能下降明显,如何结合先验信息增强算法处理复杂图像的能力将是今后的工作。

摘要:依据显著目标是显眼、紧凑和完整的思路,提出基于过渡滑动窗特征分布贝叶斯分析的显著目标检测模型。首先根据局部区域与其多个尺度邻域的对比得到亮度显著映射图;然后利用颜色信息的空间紧凑性、同质性和孤立性得到颜色显著映射图;同时通过多尺度多方向的Gabor滤波器组模拟人类视觉系统提取图像块的方向显著映射图。最后将这些显著特征一起输入单尺度的贝叶斯结构模型,通过对比贝叶斯结构模型中窗内和过渡窗外的特征值计算出该像素是显著像素的概率值,最后通过取最大化映射规则计算出输入图像的显著图,从而得到显著目标。将此算法应用于不同图像进行仿真实验,得到较好的显著性检测结果,表明该方法是切实可行的。

贝叶斯判别分析 第9篇

如今室外定位技术已经比较成熟, 但是能够获取定位目标的室内相对位置的室内定位技术还需进行进一步研究改进, 并且一系列基于室内位置的服务在一些大型室内场合中有着广阔的应用前景[1], 如机场、商场、图书馆等。近年来, 随着射频识别技术 ( RFID) 的高速发展, 基于RFID的室内定位技术越来越受到人们的关注[2]。基于有源射频识别校验的动态定位技术LANDMARC[3]因其方法简单、准确度较高而被广泛应用, 但其定位精度不是很高。郭菲菲 ( 2008) [4]提出贝叶斯算法及其改进算法, 它是通过收集数据中的新证据并结合类的先验知识的统计原理, 是一种基于概率的定位方法。其改进算法即通过引入参考标签, 利用加权最近邻算法得到定位目标的位置坐标对贝叶斯算法所得坐标进行修正, 进一步减小了整个定位区域内的平均定位误差。

二、贝叶斯定位算法

贝叶斯定理 ( Bayes Theorem) 是贝叶斯分类的基础, 该定理收集数据中的新证据并结合类的先验知识得到统计结果[5]。贝叶斯算法来源于贝叶斯分类, 是一种统计学的分类方法, 其可以通过预测类成员关系的可能性计算出样例隶属于某个特定类的概率, 因此, 贝叶斯定位算法是一种基于概率的定位方法。从贝叶斯理论可以得知, 只要获得信号强度向量在各样本点的概率, 就可以通过比较这些概率从而对目标进行分类, 也就是说, 目标最终归为哪一类是由其在哪个样本点的概率较大来定的。在定位过程中, 算法要实现的就是计算信号强度概率分布, 进一步去判断定位目标所属的类别, 从而得到定位点位置, 如式 ( 1) 所示:

其中, o是信号强度向量, l表示样本点的位置, p ( . | . ) 指随机变量的条件概率, p ( . ) 指随机变量的概率。

三、贝叶斯算法的改进

本文要进行仿真研究的改进Bayes算法是一种基于RSSI的复合定位算法, 算法在贝叶斯方法的基础上引入参考标签的概念, 旨在减小室内复杂布局和人流变化等随机因素对定位精度的负面影响。该改进算法分为两个阶段进行: 离线训练 ( offline) 阶段和在线定位 ( online) 阶段。在线定位阶段得到的位置坐标由贝叶斯分类得到的坐标和参考标签修正得到的坐标通过加权得到, 这样旨在实现定位精度的提高。

( 一) 离线训练工作步骤。进行离线训练的工作, 包括以下几个步骤。

1. 建立指纹数据库。这个步骤就是采集若干个样本点的信号强度向量, 样本点的位置是已知的, 位于定位场景中各个等大划分的网格中心, 每一个样本点的信号强度信息和位置坐标就构成了一个位置指纹点, 从而所有的样本点就构成了一个位置指纹数据库。训练数据可以表示为 ( li, oi) , 其中i∈ ( 1, n) , 表示样本数据库中训练样本的个数。

2. 建立概率模型。该步骤的目的是获得各个样本的先验概率和条件概率。该概率通过将每个样本点看作一个类别, 采用贝叶斯方法建立分类模型而得到。

( 二) 在线定位步骤。当目标位置接收到的信号强度值已知时, 在线定位分如下步骤进行。

1. 估算粗略坐标。在离线阶段已经得到了信号强度概率模型, 并且样本点的室内位置坐标是已知的, 将定位点按照此模型将其分类为一个对应的样本点, 这样该样本点的坐标值就是定位点的粗略估算坐标值 ( x1, y1) 。

2. 修正粗略估算坐标值。计算定位点与参考标签的信号强度差值, 选定与之差值最小的几个参考标签, 使用加权最近邻算法再一次估算定位点的位置坐标得到。

3. 计算定位点的最终坐标。由以上两步得到的坐标值加权平均得到最终坐标 ( x2, y2) 。

四、定位性能仿真分析

( 一) 仿真环境的设计。仿真场景设为一个长21 米, 宽21 米的仓库, 定位区域为中心20 × 20m的区域, 在仓库的四个角落里安放四个阅读器。把定位区域分成2 × 2m的100个网格, 每个网格的中心就是样本点的位置所在, 每个网格的四个角落点作为修正的参考点的位置。样本点和参考点均采用成本较低的被动式标签。在进行定位性能比较时, 主要是对定位误差进行比较。根据下面公式计算:

(x, y) 是真实坐标, (x0, y0) 是估计坐标。

传统的贝叶斯算法和其改进算法性能比较, 其仿真结果如图1 所示。从图1 可以看出, 改进的Bayes算法的CDF曲线与传统的Bayes算法CDF曲线相比, 改进后的曲线更陡, 而改进算法在执行过程中只是多加了一定数量的参考标签, 而被动式参考标签的价格比较低, 成本不会因此提高太多, 并且两种算法运行的时间性能相差不多。由此我们可以得出结论: 改进的贝叶斯算法在提高定位性能上是可行的。

五、结语

本文研究并实现了两种基于RFID的室内定位算法, 即贝叶斯算法以及改进的贝叶斯算法。而改进的Bayes算法在Bayes算法的基础上加入参考标签, 进一步改善了定位准确度。只是改进的Bayes算法与Bayes相比, 由于加入参考标签的缘故成本会有所增加, 但由于被动式参考标签价格较低, 增加的成本在可以接受的范围内, 因此改进的Bayes算法是最可取的。

参考文献

[1]Liu Hui, Darabi H, Banerjee P, et al.Survey of Wireless Indoor Positioning Techniques and Systems[J].IEEE Trans.on Systems, Man, and Cybernetics III, 2007, 37 (6) :1067~1080

[2]贾晓林.RFID技术的发展历史和标准现状[J].家电科技, 2008, 19:32-34

[3]L.Ni, Y.Liu, Y.Lau, A.Patil.LANDMARC:Indoor location sensing using active RFID[A].Proceedings of 1st IEEE International Conference on Pervasive Computing and Communications[C].2003:407~415

[4]郭菲菲.基于贝叶斯学习的RFID室内定位方法研究[D].哈尔滨工业大学, 2008, 12

贝叶斯判别分析

贝叶斯判别分析(精选9篇)贝叶斯判别分析 第1篇在日益激烈的市场竞争中, 我国的企业不确定因素日益增大, 上市公司因财务危机陷入困境、...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部