电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

贝叶斯博弈模型

来源:盘古文库作者:火烈鸟2025-09-161

贝叶斯博弈模型(精选9篇)

贝叶斯博弈模型 第1篇

众所周之, 排污权的价格问题是排污权交易有效运行的核心内容, 因此我们首先应明晰排污权的价格构成和决定因素。通常, 环境资源价值包括经济价值、生态环境价值和景观文化价值三部分[2]。从纯理论上看, 排污权的内在经济价值应等于购买排污权在未来产生上述三方面额外收益的净现值之和。排污权的实际交易价格则与环境质量的恢复成本密切相关。在不考虑交易费用的条件下, 排污权的交易价格可以是各排污商完成目标减排任务时的边际成本差异区间内的任意值, 而排污权交易的竞争均衡价格正好是与各排污商的边际减排成本相等时的对应值[3]。

经济学原理同时指出, 在不完全竞争的现实社会中, 商品交易价格的高低还取决于买卖双方采取的策略类型。在信息不完全条件下, 我们发现拍卖价格机制比传统的标价出售等方式更有利于商品市场价值的充分实现和稀缺资源的有效配置, 因此拍卖问题已成为当前博弈论和信息经济学研究的一个热门领域[4]。对排污权这种特殊商品的拍卖, 由于投标方的主观估价通常属私人信息, 因此这种情况下进行的博弈可称之为不完全信息博弈 (即贝叶斯博弈) 。博弈理论告诉我们, 贝叶斯纳什均衡只有在“各博弈方的策略同时是对其他博弈方策略的最佳反应”[5]时才会出现, 而且不同形式的拍卖机制设计能直接影响排污权交易的市场效率。考虑到排污权拍卖的典型形式包括暗标拍卖和双方报价拍卖 (又分为政府指导价下进行的买卖双方报价拍卖和交易所内自由进行的买卖双方报价拍卖) , 本文分别针对以上三种典型拍卖模式具体探讨其静态贝叶斯纳什均衡的满足条件, 揭示不完全信息条件下排污权交易价格的形成机理, 比较分析各类排污权价格实现模式的效率高低。

1 排污权的暗标拍卖模式

最常见的暗标拍卖是第一价格密封投标, 即各投标方拿出一个密封的竞价给销售者, 统一时间公证开标, 出价最高的投标方获胜并为拍卖品支付该竞价[6]。此时, 中标博弈方的得益是其对拍卖标的的估价与成交价格 (即自己报价) 之差。在这种暗标拍卖中, 卖方通过拍卖形式出售自己的剩余排污权, 相关博弈方均为买家。我们假设仅两博弈方, 其估价 (为他人不知的个人信息) Vi和Vj相互独立, 且服从[0, 1]上的标准分布, 各自对排污权的报价bi (vi) 、bj (vj) 是其估价的线性函数, 即bi (vi) =ai+civi, bj (vj) =aj+cjvj。则处于贝叶斯纳什均衡时的策略组合[bi (vi) , bj (vj) ]应满足对博弈方i的每个类型vi, 有:undefined。其一阶条件为:undefined。将此式与bi (vi) =ai+civi比较可得:undefined。同理, 可求出博弈方j的最佳反应, 并得到:undefined。联立以上公式, 可求得undefined, 因此undefined。可见, 各博弈方使自己的期望得益最大时的排污权报价刚好等于其估价的1/2。其现实意义是:在排污权的暗标拍卖中, 报价越高, 中标的概率越大, 但中标的得益却较小。要兼顾两方面, 投标方的理性做法是折衷报价。

在实践中, 排污权暗标拍卖方式隐含一些对卖方不利的危险因素, 如投标人较少 (甚至买方垄断) , 投标人窜通或不积极成交等, 则拍卖时可能因买方出价低导致排污权卖不到应有价格 (甚至中标价远低于卖方的实际减排成本) 。因此, 在利用暗标拍卖出售排污权时, 往往应修正暗标拍卖的规则设计。如卖方可增设排污权的底价 (一般等于卖方对其减排成本的估价Vs) , 若中标价低于底价则不成交, 从而保证买卖双方通过排污权交易都可获得一定的福利。可见, 在排污权的暗标拍卖中, 买方仅选择bi (vi) =Vi/2的报价值 (排除了其他双方合意的价格) , 可能会使卖方亏损或低于卖方的底价而导致最后无法成交, 因此排污权暗标拍卖的交易效率较低并具有不确定性。

现代博弈论的“实现理论”还指出, 通过设计出特定博弈规则, 暗标拍卖可实现某种预定的均衡目标。如“说实话的直接机制”将规则设计为:投标方的中标概率和中标的价格都设定为其声明价的1/2 (假设估价服从[0, 1]上的均匀分布) , 则投标方为使自己在博弈时的期望得益最大, 必然会使声明价等于其估价 (数学推导略) [7], 藉此我们可间接发现排污权的最高交易价格 (理论上在不考虑交易费用的情况下等于买方的边际减排成本) 。

2 政府指导价下的排污权交易模式

若排污权交易是在政府的指导下由买卖双方通过主动参与报价而完成的, 则此类成交模式属于“双方报价拍卖”的简化情形。在该模型中[8], 买卖双方就某货物进行交易时, 双方同时各报一个价。当买方的报价高于卖方的报价时, 则以双方报价的中间价成交;否则, 不成交。在有政府指导价这一特定背景下, 买卖双方基于不完全信息条件下的静态博弈可导出排污权的特定成交机制。

我们仍假设买卖双方对排污权的估价Vb 和Vs标准分布于[0, 1]区间, 政府计算出来的排污权参考价格X∈[0, 1]。则买方的最佳反应 (策略) 为:当Vb≥x时, 买方的报价Pb=x;否则, Pb=0, 即不买。同时, 卖方的最佳反应为:当Vs≤x时, 卖方的报价Ps=x;否则Ps=1, 即不卖。显然, 仅当Vs≤x≤Vb时, 买卖双方才会以价格x发生交易, 否则宁愿不成交, 因此[Pb=x, Ps=x]是双方报价拍卖这个静态贝叶斯博弈的贝叶斯纳什均衡。事实上, 这种给定价格水平上的均衡 (成交价格只有x一种) 也被成为“一价均衡”。

从图1可见, 在政府指导价下的排污权交易必须满足Vs≤x≤Vb时才会发生。而直线上方阴影部分的其它所有点尽管都满足Vs≤Vb, 理论上也能找到一中间价使双方获利。但在一价均衡中, 双方“宁为玉碎, 不为瓦全”的策略排除了很多有价值的交易, 导致市场上排污信用的成交量偏小。可见, 一价均衡并非效率很高的贝叶斯纳什均衡。

一般说来, 政府给定排污权指导价的直接目的有两个:一是促使企业重视排污权的价值并在减排力度的选择方面起到引导作用;二是政府可按指导价参与排污权买卖, 在一定程度上调节市场上排污权的供求, 防止因排污权被贱卖而伤害卖方减排积极性。但考虑到此交易模式有可能导致很多有低成本减排能力的企业无法大量出售其剩余排污权 (在无参考价下本来愿意卖的, 现在却不卖了) 。因此, 我们认为实践中政府给定的排污权交易的指导价应根据季节变化动态地设定为一个区间值, 政府调控排污权交易市场时可依价格区间的下限值买入, 上限值卖出, 从而传递减排成本信号, 提高成交效率。

3 交易所进行的排污权交易模式

在交易所, 由买卖双方自主进行的排污权交易可看成典型的双方报价拍卖。我们同样假设买卖双方对排污权的估价Vb 和Vs标准分布于[0, 1]区间, 并且将买卖双方的报价策略设定为线性函数策略, 其公式为:Pb (Vb) =ab+Cbvb, Ps (Vs) =as+Csvs。在这种情况下 (报价为线性函数) 的博弈均衡也简称为线性策略均衡[7]。若买卖双方的最优策略组合[Pb (Vb) , Ps (Vs) ]为相应均衡, 则Pb必须满足:undefined, 即undefined, 可进一步求得其一阶条件为:undefined。同时, Ps须满足, undefined, 即undefined, 可求得其一阶条件为:undefined。联立以上公式可得:undefined;undefined。由于这种双方报价拍卖中仅当Pb≥Ps时才会成交, 因此发生排污权交易时还必须满足:undefined, 即undefined。

从图2可见, 虽然阴影部分满足Vb≥Vs, 即买方对排污权的估价高于卖方的估价, 但交易并不会发生, 这意味着上述线性策略均衡也不能达到最高的效率状态。相对于一价均衡而言, 以上线性策略均衡的效率损失总体上较少。事实上, Myerson进一步证明了在估价为标准分布时, 依照双方报价拍卖静态贝叶斯博弈, 线性策略均衡能够产生比其他任何贝叶斯纳什均衡更高的期望值。这在一定程度上说明了政府投资建立排污权“交易所”这一平台的必要性。需要指出的是, 通过交易所模式买卖的产品要求具有标准化属性。此外, 在交易所内买卖信息公开, 单笔信用买卖的直接交易成本较小, 但建立信息传播和实施交易的一次性基础设施投入较大。交易所模式的特点表明, 实践中不但有些污染物难于在环境权益交易所进行排污权交易 (如非点源水污染物的减排信用不能满足“标准化”要求[9]) , 而且只有当交易对象数量多且交易规模较大时采用此市场结构才更有效率[10]。

4 结语

基于前文的分析可知, 现实中的排污权交易大多可视为买卖双方在自己的估价和得益信息不公开的条件下所进行的一种博弈行为, 拍卖是充分实现排污权价值的一种有效手段。贝叶斯博弈的结果表明, 三种不同形式的典型拍卖机制直接影响着排污权价格实现的市场效率。当卖方通过暗标拍卖形式出售自己的剩余排污权时, 各买方博弈的结果是使自己的报价刚好等于其估价的1/2, 此报价导致最后无法成交, 所以暗标拍卖的效率较低。当排污权交易在政府指导价下进行时, 该交易模式可能导致很多有低成本减排能力的企业无法大量出售其剩余的排污权, 排污信用成交量小。当排污权通过交易所买卖时, 其效率高于政府指导价下的交易, 但建立交易平台所需的前期投入较大, 故一般仅适用于交易对象多且交易规模较大时的标准减排信用。可见, 根据贝叶斯博弈, 在不完全信息条件下, 只有根据环境状况的不同有选择使用和完善各类拍卖模式才能提高排污权价格的实现效率。

参考文献

[1]Montgomery W D.Markets in Licenses and Efficient Pollution Control Pro-grams[J].Econ Theory, 1972, 5∶395-418.

[2]李雄华.试论环境资源权益交易的市场机制[J].生态经济, 2009, (9) ∶183-184, 189.

[3]李寿德.排污权交易与市场结构研究[D].西安交通大学博士学位论文, 2002.

[4]许永国.拍卖经济理论综述[J].经济研究, 2002, (9) ∶84-91, 95.

[5]张维迎.博弈论与信息经济学[M].上海:上海人民出版社, 1996.

[6]涂敏.标准拍卖及其变异[J].江苏商论, 2007, (4) ∶23-25.

[7]谢识予.经济博弈论[M].上海:复旦大学出版社, 2002.

[8]Kalyan Chatterjee, William Samuelson.Bargaining under Incomplete Informa-tion[J].Operations Research, 1983, (5) ∶835-851.

[9]范定祥, 廖进中.基于进化博弈的农业非点源减排研究[J].西安财经学院学报, 2010, (3) ∶77-81.

贝叶斯博弈模型 第2篇

对安哥拉山羊的初生重和产羔数配合阈-线性动物模型进行了二性状遗传参数的贝叶斯分析.采用SPSS13.0软件准备育种数据,用MTGSAM软件对943头安哥拉山羊初生重和产羔数的遗传参数进行Gibbs抽样运算.Gibbs抽样器的.运行参数为:共运行550 000次,前50 000次作为初始化过程舍弃.稀疏间隔为100.后Gibbs分析使用R-CODA软件.结果表明,初生重的直接遗传力为0.329,总遗传力为0.341,属于中等偏高遗传力.初生重的母体遗传力为0.157,初生重的个体直接一母体加性遗传相关为-0.184.产羔数的直接遗传力为0.140,属于低偏中等的遗传力.产羔数的直接加性遗传效应与初生重的母体加性遗传效应间的相关为-0.069.两性状的遗传相关和表型相关分别为0.109和0.018.

作 者:田慧芳 乔利英 刘文忠 李建斌 作者单位:田慧芳,乔利英,刘文忠(山西农业大学动物科技学院)

李建斌(山西省沁水示范牧场)

贝叶斯博弈模型 第3篇

摘要:人力资源管理的众多不确定性因素可能导致企业面临各种各样的风险,有效评估和预警人力资源管理风险有助于提高企业人力资源管理的有效性。基于现有研究成果的局限性,将贝叶斯网络引入到企业人力资源管理风险预警研究之中。首先阐述了贝叶斯网络的相关理论和在风险管理方面的应用研究,然后对人力资源管理风险的内涵和分类进行界定,在此基础上构建了人力资源管理风险预警指标体系。最后以贝叶斯网络为工具,建立了基于贝叶斯网络的人力资源管理风险模型。通过问卷调查获得网络节点参数,在MATLAB平台结合Full-BNT工具箱完成了贝叶斯网络的局部学习,并根据网络推理的结果提出相应的风险管理决策。

关键词:人力资源管理风险;贝叶斯网络;风险预警

中图分类号:F243.2 文献标识码:A文章编号:1672-1101(2016)01-0028-05

随着知识经济和全球化竞争时代的到来,人力资源已成为企业的核心资源,人力资源管理在企业管理中处于战略地位。然而,因为人力资源具有自己的独特属性,企业在进行人力资源管理的过程中不可避免地会遇到各种各样的风险。迄今为止,已有不少国内外学者对其进行过研究[1-2],并取得一定的成果,这些成果为企业防控人力资源管理风险提供了重要借鉴。但是,总的来说,这些研究成果多数停留在人力资源管理风险的内涵、分类、危害及防控措施等定性方面,只有少数采用了定量的方法,如层次分析法、模糊综合评判法、风险矩阵法等工具来评估企业人力资源管理风险水平[3-4]。虽然这些数学方法计算简便、容易操作,但是由于这些方法涉及的指标大都具有非线性和模糊性,其准确性和客观性难以保证。基于此,本文将贝叶斯网络(Bayesian networks,BN)方法引入到人力资源管理风险预警研究中,探索用于研究人力资源管理风险的新方法,以期对企业人力资源管理有一定的借鉴作用。

一、贝叶斯网络的相关知识

(二) 贝叶斯网络的应用综述

国内关于贝叶斯网络的应用研究比较晚,大多数研究都集中在最近几年,并且主要应用在人工智能、故障诊断、模式识别等领域,其中将贝叶斯网络应用于风险评估尤其是企业风险管理评估方面的研究比较少。

如索秀花[6]在利用SCOR模型并结合社会领域的马林诺夫斯基理论对供应链风险因素进行分析识别的基础上,以汽车备件供应链为例,建立了基于贝叶斯网络的局部风险评估模型,应用消息传递算法(Pearl算法)对风险进行动态预测,并诊断出影响风险的主要因素,可以有针对性地提出风险应对策略。李江飞[7]从风险发生的概率、风险的损失、风险发生的可控性三个角度对地铁项目施工风险进行了评价,利用贝斯网络借助Netica软件完成了施工风险发生概率的评估。尹凤阳[8]根据事故致因理论构造了船舶过闸风险评价的贝叶斯网络拓扑结构,并在VS2008系统开发平台上开发了风险评价系统,得出多个风险因素共同作用时,事故发生概率呈多倍增长。王美怡[9]采用贝叶斯网络推理和层次分析法相结合的方法,对不确定风险进行综合评估,以帮助管理者有效地规避风险,对高风险部分进行着重管理。熊涛[10]构造了基于贝叶斯网络的上市公司信用风险预警模型,在MATLAB软件上利用数据训练BN模型,并与Logistic模型进行对比,体现了贝叶斯网络模型用于风险评价的优越性。王爱文等[11]提出了基于因果贝叶斯网络的风险建模与分析方法,该方法被应用于某公司国际采购风险评估中,效果显著。周田[12]以IT企业研发人员为研究对象,在构建贝叶斯网络时加入时间因素,设计了帮助企业进行人力资源绩效考核的小型软件,具有很强的实用性。陆静和王捷[13]将贝叶斯网络拓扑结构用于商业银行全面风险预警,利用Netica软件进行网络推理,完成了各种风险指标对全面风险影响程度的计算,结合预警系统灯号模型,对银行风险水平做出判断,有利于管理者有针对性地进行风险管理。

二、人力资源管理风险预警指标体系的构建

(一) 人力资源管理风险的内涵及其分类

何谓人力资源管理风险,虽然学者们的观点不一致,但是比较普遍接受的观点是,人力资源管理风险是指在组织人力资源管理的活动中,因为没有妥善地处理好人力资源管理中各种因素之间的关系,而给组织的经营管理带来意想不到的损失的可能性。人力资源管理中存在着各种风险,十分庞杂,本文在文献研究的基础上[14],结合企业人力资源管理实例,将人力资源管理风险分为五大类:(1)招聘配置风险:是指组织在对人力资源进行招聘、配置和使用的过程中,因为人为因素或是企业内外部因素不确定性的影响所产生的风险。众所周知,有效的人力资源配置会给企业带来巨大的效益,但是在人力资源招聘与配置过程中,可能会存在人职不匹配、人员配置低效率等问题,导致人力资源的浪费。(2)培训开发风险:培训是企业人力资源管理工作的一项重要职能,企业的培训相当于人力、物力、财力的投资,任何投资都是有风险的,人力资源管理培训也不例外,比如培训收益风险、培训后人员流失风险等。(3)绩效考核风险:绩效考核是人力资源管理的核心环节,有效的绩效考核会对员工起到激励作用,反之,若绩效考核不公正、不全面、员工满意度低,则会挫伤员工的工作积极性,带来用人风险。(4)薪酬福利风险:是指由于薪酬设置不合理、福利待遇差等原因给企业带来的人力资源管理风险。(5)员工管理风险:人力资源管理的核心是人,由于人力资本具有复杂性、流动性、动态性,这就导致企业在进行人力资源管理时不可避免地会遇到员工违纪、人员冲突、劳资纠纷等风险。

(二) 指标体系的构建

建立具有科学性、真实性、可行性、全面性的人力资源管理风险预警指标体系,是构建贝叶斯网络进行风险评估的基础。根据人力资源管理风险的分类,结合文献查阅的结果,建立如表1所示的人力资源管理风险预警指标体系。

三、基于贝叶斯网络的人力资源管理风险模型

(一) 贝叶斯网络的构建

贝叶斯网络的构建有两种方法:一种是分析节点关系并咨询专家意见来构建,另一种是利用较完整的数据,通过网络学习功能来完成构建。鉴于人力资源管理各种风险的定量数据很难收集,本文采用第一种方法,利用因果关系结合专家经验构建贝叶斯网络。根据原因在前,结果在后的变量顺序,本文将人力资源管理风险作为终端节点,一级风险指标作为次层节点,二级风险指标作为初始端节点,构建了基于贝叶斯网络的人力资源管理风险预警系统的拓朴结构,如图1所示。

(二) 网络节点的设置

在确定了贝叶斯网络结构后,需要对节点进行设置并赋值,即获得节点参数,包括先验概率和条件概率分布(CPD)。考虑到企业人力资源管理风险的定量数据很难查阅到,因此通过向人事主管、人力资源管理专家、企业风险管理专家组成的专家组征求意见,获得一个比较主观的结果。本模型实际运用中,企业可以根据自身的实际数据对该模型中的先验概率进行修正。

本文中的人力资源管理风险指标体系由5个一级指标和17个二级指标组成,若将这22个指标通过MATLAB软件,利用Full-BNT工具箱进行参数学习,学习过程复杂且长,限于篇幅,论文选取招聘配置风险及其下的3个二级指标进行贝叶斯网络的局部学习。

本文选取某企业作为调研对象,通过向该企业人事主管、人力资源管理专家、风险管理专家组成的20人专家组进行问卷调查,得到该企业人力资源管理风险中招聘配置风险的数据,以便运用基于贝叶斯网络的人力资源管理风险模型,判断其人力资源管理风险状况。

在进行问卷调查获得参数时,为了克服专家过度自信等认知方面的偏差,论文给出了风险概率等级的分值量化表(如表2所示),拟先采用等级区间判断,专家可以凭自己的经验判断指标的风险等级,再结合等级量化表在相应的问卷调查表中填入概率值。同时,借助风险概率等级量化表,我们可以由参数学习得到的后验概率来判断人力资源管理风险所处的风险水平,为进行相应的风险防范和控制提供依据。

在完成问卷调查之后,通过对收集到的问卷进行分析,得到这次调查问卷的基本信息如表3所示。

由表可知本次问卷的有效回收率达75%,问卷调查的数据是可以使用的。利用SPSS19.0软件对15份有效问卷的数据进行统计分析,求得各节点概率的平均值作为最终的节点参数,如表4、表5、表6所示。

四、结束语

本文

将贝叶斯网络方法应用于人力资源管理风险的预警研究中,通过构建人力资源管理风险的网络拓扑结构,将各类风险因素对于人力资源管理总体风险的影响归入到具有因果关系的网络结构中,并以招聘配置风险为例进行贝叶斯网络的局部学习,通过问卷调查在对各级网络节点进行赋值的基础上,利用Full-BNT工具箱,完成了贝叶斯网络的参数学习,实现了对人力资源管理风险的定量研究。管理者可以结合本企业人力资源管理风险的实际数据,进行贝叶斯网络推理,根据推理结果,有针对性地采取措施来防范控制风险。当然,由于人力资源管理风险因素种类很多,所以防控人力资源管理风险势必是一个复杂的系统工程。因此,在对人力资源管理风险进行全面防范的基础上,还需要企业树立风险管理理念,提高识别风险的能力,完善人力资源管理制度,加强人力资源管理风险预警信息系统的建设等,这样才能有效地落实风险管理。

参考文献:

[1]张兰霞,王俊.基于BP网络的人力资源管理风险预警模型[J].南开管理评论,2007,10(6):78-85.

[2]Danielle S Beu,M.Ronald Buckley.Using Accountability to Create aMore Ethical Climate[J].Human Resource Management Review,2004(14):67-83.

[3]王爱莲,李君.基于风险矩阵法的石油销售企业人力资源管理风险评估[J].西安石油大学学报(社会科学版),2014,23(1):37-42.

[4]陈心德,周晋.基于模糊综合评判法的人力资源管理风险预警模型[J].商业研究,2006(15):12-16.

[5]黄友平.贝叶斯网络研究[D].北京:中国科学院,2005.

[6]索秀花.供应链风险的识别与评估[D].广州:暨南大学,2011.

[7]李江飞.基于贝叶斯网络的地铁项目施工风险评价研究[D].哈尔滨:哈尔滨工业大学,2013.

[8]尹凤阳.基于贝叶斯网络的船舶过闸风险评价研究[D].武汉:武汉理工大学,2011.

[9]王美怡.贝叶斯网络在不确定性风险决策中的应用[D].北京:首都经贸大学,2012.

[10]熊涛.基于贝叶斯网络的我国上市公司信用风险预警研究[D].金华:浙江师范大学,2013.

[11]王爱文,杨敏,段华蕾.基于因果贝叶斯网络的风险建模与分析[J].系统工程与电子技术,2013,35(5):1023-1030.

[12]周田.基于贝叶斯网络的人力资源绩效考核模型的研究与应用[D].北京:首都师范大学,2014.

[13]陆静,王捷.基于贝叶斯网络的商业银行全面风险预警系统[J].系统工程理论与实践,2012,32(2):225-235.

[14]战一欣.企业人力资源管理风险控制研究[D].长春:吉林大学,2011.

[15]张连文,郭海鹏.贝叶斯网引论[M].北京:科学出版社,2006.

贝叶斯博弈模型 第4篇

多无人机 (unmanned aerial vehicle, UAV) 协同搜索是多无人机协同的一个重要研究方向。多架UAV同时对一个未知区域进行搜索, 目的就是大量获取搜索区域的信息, 确定目标存在的具体位置。文献[1]提出了一种基于贝叶斯理论的多UAV鲁棒协同搜索方法, 首先建立搜索环境的数学模型, 然后考虑到UAV传感器测量的不确定性以及环境自身的不确定性, 引入鲁棒性能参数以提高系统的抗干扰性以及稳定性, 最后对目标函数进行优化求解, 从而引导UAV在区域中进行搜索。任务集结是协同作战的首要行动和自组织协同控制的重要内容, 文献[2]为优化集结行动中系统任务状态协调过程能量最优性、协同控制动态响应性和集结行动时效性3个性能指标, 采用基于快速一致性控制算法的协同控制结构, 在合作博弈框架下给出多无人机系统自组织协同与优化控制问题描述, 建立了优化控制输入的Pareto解集, 采用Nash讨价还价方法给出基本合作博弈优化一致性控制算法。在基本算法中引入过去状态差值, 并以优化目标构建适应度函数, 采用遗传算法优化代价函数的加权矩阵, 得到改进合作博弈优化一致性控制算法。文献[3]通过考虑合作联盟的目标价值收益指标函数、损伤代价指标函数及航程代价指标函数, 建立多无人机联盟合作博弈模型, 构建出其博弈矩阵, 给出合作联盟特征函数与混合策略纳什均衡的定义, 采用粒子群算法 (particle swarm algorithm, PSO) 求解出混合策略的纳什均衡, 并利用Shapley值方法, 给出一种合作博弈的求解方法, 最终得到多无人机对地攻防最优对抗策略。文献[4]对目标运动行为的综合利用, 以敌我双方为局中人, 把敌我双方可能的行为作为策略集, 建立博弈论模型, 通过求解Nash均衡改进扫描式搜索路径规划算法。文献[5]通过分析实际战场中目标价值和毁伤概率信息的不确定性, 提出了不确定信息条件下需要解决的无人机 (UAV) 攻防博弈问题。以敌我双方发射导弹的价值信息为依据, 建立基于不确定信息的多UAV攻防对抗的支付函数, 构建攻防双方博弈支付矩阵。将粒子群算法和区间数多属性方案排序方法相结合, 给出基于不确定信息下博弈纳什均衡求解方法, 为不确定环境下UAV攻防博弈实现最优策略提供了新方法。

现在我们考虑一些无人机为降低传输成本, 提高自身的利益, 会出现不良行为的无人机。无人机的行为有两种类型:协作的无人机总是会协助联盟内其他无人机进行信息传输;不良行为的无人机则表现为在联盟内有时会不参与其他无人机的协作信息传输。为了模拟存在协作无人机和不良行为无人机间的联盟形成过程, 建立了基于贝叶斯联盟博弈[6]模拟无人机间协作传输信息的过程。

1 系统模型

如图1所示为无人机目标系统, 各个无人机之间能够形成联盟并在彼此间共享目标信息。假设各个无人机位于不同的高度, 避免了他们彼此间的碰撞[7]。

无人机的运动模型:

其中, 是角度, vi是对地速度, ci是常数对应每个无人机的高度, 考虑两种类型的无人机成员:协作的无人机和不良行为的无人机。

2 贝叶斯联盟博弈建立

我们利用贝叶斯联盟博弈形成处理无人机类型的不确定算法[8]。表示无人机可能的类型集合, Tw代表协作的无人机, Tm代表不良行为的无人机。

无人机i的预期收益:

其中表示平均效用的权重系数, 表示平均成本的权重系数。对于无人机i来说, 是其对同联盟S内其他无人机的联合信念概率, 其计算如下:

无人机i的效用表示为:

其中, 表示无人机i加入联盟S后信息传输延时, 表示无人机i不加入任何联盟的信息传输延时。

无人机i传输目标信息到同联盟任何无人机j引起的平均成本为:

其中, 表示无人机i传送目标信息到联盟S内无人机j的平均成本, |S|表示联盟S中无人机的数量。

为了更多获知不完全信息下无人机的类型, 根据当前时隙和历史信念[8]的结果, 通过贝叶斯定理[9], 每个无人机更新关于其他无人机类型的信念概率。θ=0代表不合作, θ=1代表合作。

其中, 是时隙的信念, Pe表示误报率, j表示漏报率。

3 基于离散马尔科夫链的联盟形成稳定性分析

当每个无人机从自身的效益值角度进行联盟组合的调整时, 那么状态 (联盟结构) 之间的变化可以运用马尔科夫链[10]的方法进行分析, 以验证贝叶斯联盟形成算法的稳定性。

离散马尔科夫链状态空间集合为:

其中Γx表示一种联盟结构, DN为贝尔数。状态转移概率用表示。联盟结构从Γ转移到Γ, 的概率为:

表示联盟结构从Γ转移到Γ, 的过程中涉及到的转移联盟结构的无人机。表示无人机被选中进行联盟结构变化的概率, 表示与无人机所在当前联盟大小一致的其他包含该无人机的联盟的总个数。如果包含该无人机的当前联盟中所包含的总无人机数为f, 那么。则表示无人机决定从当前联盟Sli转移到联盟Sli, 中导致当前联盟结构从γ转移到联盟结构γ'。

得到由构成的转移矩阵U, 状态向量可以由下列方程组得到:

其中表示转置运算, T1表示元素为1的集合, , 其中, 表示联盟结构Γx形成的概率。在状态概率向量, 向量中的最大值所对应的联盟结构Γx即为最稳定的联盟结构, 即最有可能形成的联盟结构。

4 仿真分析

设效用函数的权重系数为, 成本函数的权重系数为。不完全信息下, 当N=4时, 有15种可能的联盟结构。无人机可能的联盟结构如表1。

每个无人机的通信范围的半径设为500 m, 最大速度设为50 km/h。无人机的自动导航仪控制其保持在一定的高度, 目标是固定的, 但他们的位置是随机产生的。仿真区域为10km×10km。图3表示仿真中观察到的各个无人机与目标之间两次连续相遇的时间间隔的累积分布函数。

设无人机4的类型为协作行为, 其他无人机开始时, 协作行为的概率为, 不良行为的概率为1-Pi, j=0.01, 误报率, 漏报率j=0.01。基于信念更新机制, 根据公式 (6) 和 (7) , 无人机1、2、3协作行为概率更新的过程如图4。

假设对所有无人机来说, 成本系数一样, 所有无人机的成本系数从0到3, 图6代表不完全信息下的纳什稳定联盟结构。当成本系数大于2.6时, 所有的无人机将会选择单独行动, 即不形成任何联盟。

5 结论

基于无人机的类型不确定, 利用动态贝叶斯联盟博弈, 无人机间倾向于形成联盟来减少目标信息传输的通信延时, 并且利用信念更新机制来改变关于无人机类型的信念, 依据贝叶斯联盟形成算法, 获得稳定的联盟结构。

摘要:在无人机通信网络中, 无人机之间协同通信已经成为重要的研究方向。本文针对无人机类型的不确定性, 基于动态贝叶斯联盟博弈, 通过计算无人机在最小通信延迟下的收益, 利用贝叶斯联盟博弈来分析无人机的策略选择。此外, 利用信念更新机制来发现系统中潜在的联盟成员。仿真表明, 获得的联盟结构是纳什稳定的。

关键词:贝叶斯联盟博弈,无人机,延时

参考文献

[1]祁晓明, 魏瑞轩, 沈东, 等.面向目标不确定的多无人机鲁棒协同搜索[J].系统工程与电子技术, 2013, 35 (11) :2303-2308.

[2]王勃, 姚佩阳, 贾方超, 等.多无人机任务集结合作博弈优化自组织协同控制[J].电光与控制, 2014, 21 (11) :5-13.

[3]陈侠, 赵明明, 徐光延.基于合作联盟的多无人机对地攻防对抗策略[J].兵工自动化, 2014 (1) :49-55.

[4]杨少环, 高晓光, 符小卫.基于博弈论的无人机搜索路径规划[J].系统工程与电子技术, 2011, 33 (10) :2254-2257.

[5]陈侠, 刘敏, 胡永新.基于不确定信息的无人机攻防博弈策略研究[J].兵工学报, 2012, 33 (12) :1510-1515.

[6]Ieong S, Shoham Y.Bayesian Coalitional Games[C]//AAAI.2008:95-100.

[7]George J M, Sujit P B, Sousa J B, et al.Coalition formation with communication ranges and moving targets[C]//American Control Conference (ACC) , 2010.IEEE, 2010:1605-1610.

[8]Akkarajitsakul K, Hossain E, Niyato D.Coalition-based cooperative packet delivery under uncertainty:a dynamic Bayesian coalitional game[J], 2012:371-385.

[9]ZHANG Qing-qing, XU Yue-ping, TIAN Ye, ZHANG Xu-jie.Risk-based water quality decision-making under small data using Bayesian network[J], Journal of Central South University, 2012, 19:3215-3224.

贝叶斯博弈模型 第5篇

Nelson(1959)和Arrow(1962)认为:“追求利益最大化的企业,在R&D上投资的社会回报大于对企业自身的回报,导致了企业在R&D上投资的不足”,而且在企业R&D产出的知识转移到其他企业时,转移成本几乎为零,转移过程中几乎无损的知识,能够很容易变成公共产品,这种现象严重地阻碍了企业对R&D的投资。由于多数企业认为知识产权被侵害后,涉及的举证和诉讼成本过高,原创性知识的低成本转移,导致企业重视核心技术开发的意识不强,也阻碍了企业对R&D的投资。这种现象,从长远来讲,不但会危害企业的市场竞争力,更重要的是,会引发企业群体和国家技术知识的边缘化,严重的影响国家核心竞争力的提高。

实践证明,一个企业的发展和壮大或一个国家的经济增长,对R&D投资的依赖度较大。R&D的投资额度愈大,知识企业的产出愈高,导致国家和企业的发展越块,而且对投资的连续性和大额度,会导致企业或国家形成某种专业知识的垄断地位,进而对于利用该种专业知识的产品市场定价中起到主导作用。因此,可以说增加R&D投资水平,不论对于微观企业的发展,还是对于宏观国民经济的发展,均具有重要的作用。

R&D是知识资源生产的重要方式,在知识经济条件下对国民经济增长至关重要。Aspremont and Jacquemin建立A&J模型(1988)研究一对对称组织在R&D和生产阶段的决策问题,研究结果认为对称组织“研究和生产”决策将根据其边际成本去选择是在这两个阶段的某一个阶段合作或是两个阶段都合作,或是根本不愿意合作而独自进行。然而在从事R&D合作活动或是竞争活动的企业中,出现两个对称性企业的情况并不多见,现实中更多地出现的是在“规模”和“能力”上非对称性企业之间的博弈以及知识的外溢。这样就有人将不对称因素引入A&J模型去研究企业R&D生产的策略选择问题(Ruslan Lukatch,Joseph Plasmans,2000),结果认为不对称企业可产生不同的R&D支出和生产决策,大企业有高的R&D支出费用和产出,而且如果以合谋或福利最大化战略为目标选择,其优化解隐含着在不对称企业间存在R&D知识的传导和溢出,但R&D投资和生产活动仅仅在大企业开展。

然而在企业制订R&D战略目标时,目标的选择在发展中的市场是多样的,企业之间理性的R&D投资决策不仅取决于企业规模的不对称性,也依赖于技术的不对称性。本文试图将技术的不对称性引入A&J的扩展模型,建立双组织R&D投资博弈模型,并应用完美贝叶斯均衡分析方法,对企业在规模、能力和技术等不对称因素作用下的R&D投资策略选择进行分析,并利用现实数据进行仿真研究。

2 投资博弈的理论分析

2.1 投资博弈的概念

假设在个体行为理性的前提下,我们分析在一个社会的框架内R&D组织(企业)之间,围绕着是否对某项R&D组织(企业)是博弈的参与者。如果假定市场上只有两个组织,则这种博弈就变成双组织参与下的R&D投资博弈。R&D组织双方采取投资、不投资的行为,构成两个博弈方可选择的策略集合,R&D组织在投资或投资行为上的时间差,构成了博弈次序,不容质疑R&D投资双方通过对项目的投资获及一定的投资收益,这种收益有正有负,有直接的也有间接的,这正是博弈双方的得益。本文是应用博弈分析方法,探讨对两个组织投资的博弈分析,论证了为了实现R&D的高投入和投资效率、企业或国家必须从政策上所做出的策略选择。

2.2 双组织R&D投资的动态博弈模型

在知识要素竞争的市场上,当一个企业决策是否对一个知识创新项目进行R&D投资时,它并不清楚本企业以外是否还有其它企业也进行该知识项目的投资。当该企业进行R&D投资决策时,如果设定同样也有一个企业也在进行该知识项目的投资(也许可能有多个),则可以研究双企业在这一过程中的决策行为。因此,在建立企业R&D投资动态博弈模型时,我们假定市场上对该知识项目进行投资的组织(大学,科研,企业)只有两个甲和乙,其中甲组织为行业内标杆组织,以下均把甲和乙两组织用两企业来代替,其假定条件能够代表普遍情况,使其分析的结果将更具一般性。

对于两个知识生产企业甲和乙,双方可供选择的策略都有投资和不投资策略两种。企业甲在选择“策略类型”——投资或不投资之后,实际上还将进一步选择其“策略行为”既对应用该R&D投资所产出产品的价格是采用提高策略还是降低策略,可以知道这种选择是介于合并均衡与分开均衡之间的一种带有随机性的选择。为了集中讨论企业的R&D投资决策行为,假设企业乙在观察到企业甲产品的市场价格信息后,判断企业甲是否对某R&D项目进行了投资,从而决定本企业是否采用R&D投资行为作为与甲企业竞争的主要手段。为了简单起见,我们假定企业甲是技术知识标杆企业,在技术创新方面起着领头羊的作用,企业乙在决策中始终选择跟随甲企业的技术标杆,寻求与企业甲技术同等水平,价格也趋于一致。即企业甲选择高价格时,企业乙也选择高价格;企业甲选择低价格时,企业乙也选择低价格,且两企业的选择有先后之分,在选择知识项目时,企业甲先选择,企业乙后选择。尽管企业乙不知道企业甲的R&D投资选择,即不知道企业甲是否投资了某项R&D项目,但企业乙可根据企业甲的“价格行为”信息来确定企业甲的行为,基于此确定自己是否对该R&D项目的要进行投资和自己产品的价格定在多少为好。假设双方对该项目均有完全充分的信息,即甲乙双方都清楚在各自选择下的得益,这样我们可以建立一个典型的“完全但不完美信息动态博弈”模型(图1所示)。

假定反工业需求函数是线性的:p=a-bQ,这里Q=q甲+q乙是两企业在a,b>0情况下的全部产量,p是均衡的市场价格。设企业甲对某知识生产项目i的投资为xundefined,其所生产的知识产出为某一时点的kundefined(所表现出来的产出形式可能为技术、专利、发明或新产品、新工具和新流程),使用R&D投资的技术产出ki甲后,企业甲单位产品价格为pundefined。特别是企业个体的生产成本函数反映另外一个企业研究效果的影响效应,建立在甲企业边际成本基础上的乙企业在R&D上投资的影响,可通过一个反映知识外溢效果的常数β甲乙来反映,β甲乙是指随着企业乙研究成果影响,企业甲生产成本递减的紧密程度。因此,有企业甲生产成本函数是:

Cundefined(q甲,xundefined,xundefined)=(A甲-xundefined-βundefinedxundefined)q甲,

i=1,2,…

这里0≤A甲≤a(反需求函数参数相比边际成本的最高值是最大的),它是甲企业没有R&D投资的边际生产成本;0≤βundefined≤1(外溢效果的水平间隔),xundefined+βundefinedxundefined≤A甲,(边际生产成本是非负值),undefined(意味着p≥0)。

同理,如若将甲企业在R&D项目i上投资所产生知识外溢对企业乙的影响系数用β乙甲表示,其它符号与甲企业的相似,则有企业乙的生产成本函数为:

Cundefined(q乙,xundefined,xundefined)=(A乙-xundefined-βundefinedxundefined)q乙,

i=1,2,…

2.3 投资博弈的具体收益分析

假设:企业知识生产的成功率为100%,专利制度不完善,我们对以上的博弈收益进行分析。当甲企业选择对某知识生产项目i的投资在t1时刻为xi甲时,在基于该技术进行产品生产t2时刻甲企业的选择高价策略时,则企业甲的市场利润为(pundefined-Cundefined)q甲,此时市场价格pundefined=p,若在t2时刻企业乙也选择高价格策略(即产品市场价格同企业甲),则企业乙的市场利润为(pundefined-Cundefined)q乙,显然,由于Cundefined>Cundefined,则企业乙的单位利润要高于甲;若在t2时刻企业乙选择低价格策略,此时其市场定价Pundefined=p,则企业乙的市场利润为(Pundefined-Cundefined)q乙,企业甲的市场利润为(Pundefined-Cundefined)q甲,此时利润单元可能低于甲。在t2时刻甲企业的选择低价策略时,此时市场价格Pundefined=p,若企业乙在t2时刻选择低价格策略(即产品市场价格同企业甲),则企业乙的市场利润为(Pundefined-Cundefined)q乙,企业甲的市场利润为(pundefined-Cundefined)q甲,由于投入成本差异,同样企业乙的利润单元要高一些;由于企业乙跟随特性,在此时它不可能选择高价格策略,因此,在t2时刻企业乙只能选择低价格策略。

当甲企业对某知识生产项目i在t1时刻选择不投资时,在t1时刻甲企业的选择高价策略时,此时市场价格pundefined=p,若在t1时刻企业乙选择高价格策略(即产品市场价格同企业甲),则企业乙的市场利润为(pundefined-Aundefined)q乙,企业甲的市场利润为(Pundefined-Aundefined)q甲,此时由于甲企业的标杆特性,则有Aundefined

这里假设市场对甲、乙两企业的品牌产品有一定认可度,也就是说两企业的市场分额保持不变,即在划分市场容量上q甲,q乙在价格变动前后保持一致。则可据以上的分析知有两个企业参与的R&D项目投资博弈的收益矩阵。由这一矩阵可知,这一博弈为完全信息的动态博弈。在缺少R&D投入鼓励政策,加之知识产出可以以较低成本转移到其他企业的情况下(β→0),其纳什均衡策略是:企业甲、乙均选择不投资、且都是低价格策略。甲、乙两企业的产品收益矩阵为(Pundefined-Ai)q甲,(Pundefined-Ai)q乙,其中Ai为该产品生产的社会平均成本。这一纳什均衡反应的机制是两个企业都失去了进行R&D投资的动力,企业选择的是在价格上无序竞争,导致企业知识生产动力缺乏,失去了企业核心竞争力的培养,企业发展更多的是实现短期效应,可持续发展能力受到削弱,这是我国目前企业发展现状的真实描述。

2.4 均衡的改善

根据企业R&D投资的实践可知,企业都进行或都不进行R&D投资是两种极端情况,而且知识产出的获取是要付出一定成本的。在两企业进行R&D投资的博弈中,技术标杆型企业甲选择投资或不投资于一个技术项目,企业乙也有同样的选择。为了实现均衡的改善,我们假定①R&D投资多的企业从税收和财政上可以享受更多的优惠政策,原创性知识转移的成本较高;②企业甲与企业乙创新成功的概率为P(P∈(0,1))有差异,即P甲>P乙;③企业甲与企业乙之间存在知识的溢出效应,溢出效应对企业的生产成本也有消减作用,消减作用的大小用β表示,其大小与两个企业间的距离成反比关系。

在此情况下,博弈收益矩阵得到改变,据此矩阵分析,当企业甲选择对某一技术进行R&D投资时,企业乙无论是否选择对同一技术进行投资,企业甲获得的期望利润均要大于企业乙的期望利润,即(P甲p甲-Cundefined)>(P乙p乙-Cundefined)。甲企业选择不投资的情况,则乙企业可以选择投资或不投资,在此情况下的收益大小具有不确定性。由此该博弈存在两种可能性结构,企业甲对技术研发的最优投资决策是,在政府提供优惠政策的情况下,其具有投资动力,企业乙在企业甲投资的情况下,失去投资的动力。在此情况下,如若该技术是企业乙发展的关键技术,企业乙的最优选择策略是与企业甲合作生产新知识,如若企业间的溢出效应较大,且与企业间的距离大小成反比,此时在不考虑其它因素情况下,乙企业的最优决策是迁移到甲企业所在区域,由于本文的篇幅所限,这里不加以论述。在甲企业对某技术不投资的情况下,乙企业可据该技术在消减成本中的作用进行投资决策。

3 结论及政策建议

由上面的分析可以推出这样的结论,不论是大型知识企业或是中小型知识企业,其生产成本的大

小不仅取决于该企业在R&D上的支出,而且取决于其它企业R&D支出所带来的溢出效应,这种效应的大小与企业间的距离成反比,企业集群的根本原因是企业希望得到较强的知识溢出效应;在专利制度不健全的情况下,不论是大型知识型企业还是中小企业,都失去进行R&D投资动力,企业的竞争大都处于一种价格上的无序竞争,导致企业对知识产品的需求不足,企业失去持续发展的基础保障;在政府提供优惠政策,知识转移的成本高昂的情况下,大型知识型企业具有R&D投资的根本动力,小企业具有在R&D上进行合作创新的动机,并可根据这一需要将企业迁移到标杆型企业所在的区域,享受环境给R&D生产活动带来的成本消减。

我国企业目前发展的情况处于仍没有形成一个真正市场化的知识生产、价值评估、交易与投资的产业链条。因此,企业的R&D生产本身的市场化程度很低,企业之间知识的直接交易额很低。基于这一博弈分析的结果提出如下建议:

(1)从税收和财政上向进行R&D投资多的企业提供更多的优惠政策,进一步提高原创性知识转移的成本,建立知识生产、价值评估、交易与投资的完整产业链条。

(2)知识和技术的溢出效应要求我们要加大发展各种高技术开发区和产业园区,促进企业聚群和企业间的R&D合作活动,促进知识的共享和人力资本的交流以及知识的生产。

摘要:建立不对称企业在R&D投资决策中的博弈模型,通过模型分析得到,如果从税收和财政上向进行R&D投资多的企业提供更多的优惠政策,提高原创性知识转移的成本,建立知识的生产、价值评估、交易与投资的完整产业链条的情况下,大型知识企业具有R&D投资的根本动力,小企业具有在R&D上进行合作创新的动机。

关键词:不对称企业,分析,模型

参考文献

[1]SI XUN-LIAN,CHEN JIN-XIAN. Game Analysis on Encoding of Tacit Knowledge in Business Enterprise[C].PROCEEDINGS OF 2003 INTERNATINAL CONFERENCE ON MANAGAMENT SCIENCE & ENGINERING(VOLUME 1), 2003(10):2004

[2] BA S, STALLAERT J, WHINSTON A B. Optimal Investment in Knowledge With a Firm Using a Market Mechanism [J]. Management Science, 2001,4:1203-1219

[3] LUKATCH R,PLASMANS J.R&D and Production Behavior of Asymmetric Duopoly Subject to Knowledge Spillovers[D].CESIT Discussion paper No. 2000/07

[4] DOLOREUXA D, PARTOB S. Regional innovation systems: Current discourse and unresolved issues[J]. Technology in Society, 2005( 27):133–153

[5]SANIDAS E.Technology,Technical and organizational innovations,e-conomic and societal growth[J].Technology in Society,2004(26):67–84

网络故障管理的贝叶斯模型参数学习 第6篇

贝叶斯网络也被称为信念网络或者因果网络,是描述数据变量之间依赖关系的一种图形模式[1]。贝叶斯网络表现为一种赋值的复杂因果关系网络图,网络中每一个节点表示一个事件,各节点之间的有向弧表示事件发生的直接因果关系[2]。

在研究网络故障诊断方面,贝叶斯网络能集成定性和定量信息,具有充分利用先验信息,发挥学习作用的优点[3]。但Bayesian网的精确推理是NP难题[4],并且其近似推理也是NP难题[5]。例如,故障征兆节点有n个父节点,就需要2n个条件概率;同时在现实条件下很难搜集几种因素相互作用可能产生的结果。在确定贝叶斯网络有向弧的问题上,需要一定程度的简化。

我们可以将Noisy-OR、Noisy-AND节点模型组成的贝叶斯网络应用于网络故障诊断。Noisy-OR、Noisy-AND节点模型将规则库直观地映射成一个开始学习的初始网络,通过参数的学习和修正,实现了诊断知识的不断完善,并具有精确的语义和良好的可理解性[6] 。

2 Noisy-OR/AND模型

2.1 Noisy-OR节点

Noisy-OR节点和逻辑OR相似。当所有前提条件(Ni)都为“假”时,Noisy-OR节点(Nj)也为“假”。所不同的是,如果有一个以上前提条件为“真”时,Noisy-OR节点并不一定为“真”。我们定义参数cij来表示前提条件Ni取真时对Nj取真的认可度。给定网络中各节点的信任度和每一条连接的认可度,可以用下面的公式表示Noisy-OR节点的信任度:

2.2 Noisy-AND节点

Noisy-AND节点的定义是:当所有前提条件(Ni)都为“真”时,Noisy-AND节点(Nj)才为“真”,Noisy-AND节点(Nj)的一个前提条件(Ni)为“假”时,并不表示该节点的一定为“假”。定义参数cij来表示前提条件Ni取假时对Nj取真的否定度。下面的公式表示Noisy-AND节点的信任度:

3 参数学习

3.1 学习算法

借鉴用于神经网络的反向传播算法,可以推导贝叶斯网络的参数调整梯度公式如下[7]:

其中η是学习率,δj是对于节点Nj的误差。对于输出节点,δj=ζ(Nj)-P(Nj),其中ζ(Nj)是对于这个学习样本在Nj的期望值,P(Nj)是这个学习样本在目前条件下的计算值。对于隐层节点Ni,从子节点Nj反向传播到Ni的误差:

3.2 交叉验证方法

在网络训练过程中,当训练样本造成的训练误差随学习循环次数增加而逐次降低,由测试样本同步测试网络训练品质时,发现测试误差曲线在某处停止下降,并反转向上增加,即产生了过度训练现象,如图1所示[8]。

根据输入节点的个数和样本数量,可以采用k-折交叉验证法(k-fold cross validation)来获得学习循环的最适合停止点。在N个样本中随机选取R个(R<=N),均分为k组。轮流选择第i组作为测试样本,剩余k-1组作为训练样本。每次训练后,用测试样本计算训练结果的平均误差。在获得第i组的最小平均误差时停止训练,并记录训练次数mik组样本都作为测试样本后,mi的平均值m就可以作为N的学习次数。

4 应用实例

在实际应用中,考虑如图2所示的网络。这是一个具备多种接入方式的呼叫中心中应用层各设备之间的逻辑关系图。PBX(A)、传真服务器(D)、短信网关(B)、Web服务器(C)分别接入话音、传真、短信、Web呼叫,并递交CTI服务器(G)处理;CTI服务器将呼叫分发到普通座席(I)和VIP座席(J);普通座席通过访问本地数据库(E)处理呼叫;VIP座席则需要通过应用服务器(H)访问本地数据库(E)和VIP数据库(F)。相应贝叶斯网络的拓扑如图3所示,设定工作正常为“假”(0),发生故障为“真”(1),则隐层节点G、H为Noisy-OR节点,结果结点I、J为Noisy-AND节点。

经过统计,将得到的50个故障样本及相应输出点期望值输入,前3条输入如表1所示。

随机选取cij的值,采用5折交叉验证法,选取学习率为0.1,得到平均学习次数为288次。再将所有样本学习288次,获得的贝叶斯网络权值如图3标注。

当发生故障时,可以根据故障体现的输出节点状况和原因节点发生故障的概率,采用贝叶斯方法推导出在当前情况下,哪些节点发生故障的概率更高,进行有针对性的排查,提高故障定位的效率。在实际应用中,原因节点的故障率分别为:P(A)=0.0001,P(B)=0.0002,P(C)=0.001,P(D)=0.0005,P(E)=0.0009,P(F)=0.0005。当J发生故障时,推断出VIP数据库发生故障的概率最高,与实际情况相符。

5 结论与展望

本文对网络故障管理中的贝叶斯模型进行了研究,应用Noisy-OR/AND模型和反向传播算法建立了基于某个呼叫中心的网络故障管理模型,结合k-折交叉验证方法从统计数据中快速地完成贝叶斯网络的有向边参数学习。在故障发生时得到了验证。

参考文献

[1]冀俊忠,刘椿年,沙志强.贝叶斯网模型的学习、推理和应用.计算机工程与应用,2003,39(5):24-27.

[2]Neapoi Itan R E.Probabilistic reasoning in expert systems[M].New York:Wiley,1990.

[3]王华伟,周经伦,何祖玉,等.基于贝叶斯网络的复杂系统故障诊断.计算机集成制造系统,2004(2).

[4]Cooper G.Probabilistic inference using belief networks is NP-hard.Ar-tificial Intelligence.1990,42:393-405.

[5]Dagum P,Luby M.Aproximate probabilistic inference in Bayesian net-works in NP hard.Artificial Intelligence,1993,60:141-153.

[6]霍利民,朱永利,苏海锋.基于贝叶斯网络的电网故障诊断新方法.华北电力大学学报,2004,31(3):30-34.

[7]Sowmya Ramachandran,Raymond J Mooney.Revising Bayesian Net-work Parameters using Backpropagation[C].Proceedings of the1996IEEE International Conference on Neural Networks,Washington D.C.,1996:82-87.

贝叶斯博弈模型 第7篇

目前,交通方式划分主要分为集计模型和非集计模型,集计模型主要采用距离曲线法的思路,所考虑的因素较为单一,并不能全面地解释交通方式划分影响因素之间的关系;非集计模型主要是基于效用最大化原理的离散选择模型,刘炳恩等利用北京调查数据建立交通方式选择的MNL模型[1],鲜于建川等建立了基于知识的神经网络的方式划分模型[2],李海峰等分析了出行方式选择的影响因素,应用神经网络来进行方式划分[3]。但传统的集计模型和非集计模型均为确定性模型,并对数据的完整性有较高要求,对于出行方式选择的不确定研究较为缺乏,而且无法定量表明影响因素相互间的关系,而贝叶斯网络是不确定知识和推理领域最有效的理论模型之一,目前多应用于交通事故预测,秦小虎等提出了基于贝叶斯网络来预测交通事故的方法[4],基于以上背景,本文建立了基于贝叶斯网络的交通方式选择模型,在定量分析交通方式选择影响因素间的相互关系基础上,进行各种交通方式选择不确定性分析,并以苏州市为例,研究了苏州市居民出行方式选择特性。

1 出行方式影响因素分析

1.1 出行方式选择影响因素

影响城市居民出行方式选择因素分为内在因素与外在因素2类,内在因素包括出行者的自身特性、出行者的出行特性以及交通设施特性,而外在因素主要包括相关的交通政策和社会经济发展水平等[5]。

1.1.1 内在因素

1) 出行者的自身特性。

出行者年龄。不同年龄阶段的出行者往往偏好于不同的交通工具。

家庭结构。出行者所处的家庭结构也会对其选择交通工具产生一定的影响。

家庭月收入。低收入者较偏向于公共交通或骑自行车,收入较高的出行者则倾向于选择出租车和私人小汽车出行。

交通工具拥有情况。通常情况下,出行者比较偏向于选择家中储备的交通工具出行。

其他方面。身体条件、个人喜好、生活习惯等。

2) 出行者的出行特征。

出行目的。不同的出行目的采用某种交通方式的比重不同,一般来说,生活、娱乐等目的的出行,人们更有可能选择步行。

出行时耗。随着出行时间的变化,人们采用某类交通方式的比例会有所变化。在其他条件相同的情况下,人们出行一般选择出行时耗最短的方式。

出行距离。出行距离长度对于出行者的交通方式选择是非常重要的。短距离出行。步行和自行车比较受偏爱;中长距离出行,公交车、出租、摩托车、小汽车的出行比例较高。

出行费用。不同的交通工具根据出行距离的不同,所需的出行费用也各不相同。人们一般选择出行费用最低的方式。

3) 交通设施特性。

包括交通工具的安全性、舒适性、可靠性和方便性,道路设施服务水平等。随着生活水平的提高,人们对于安全性、舒适性等的要求也不断提高。

1.1.2 外在因素

1) 交通政策。

对某类交通工具所采用的交通政策会对这类出行方式产生影响。不同的交通政策对各出行方式的影响程度不同,尤其是公共交通,在很大程度上取决于交通政策。

2) 社会经济发展水平。

社会经济发展水平会影响到单位及个人购买某类交通工具的能力,进而影响这类出行方式的状况。

为简化模型建立难度,选取以下因素作为模型的输入变量,并对某些连续型变量进行离散化处理,如表1所列。

1.2 影响因素相关性分析

由居民出行调查数据,可对所选变量进行相关性分析,进而可得出变量之间存在的关联性,用相关系数ρ来度量。如有二维随机变量(X,Y),其相关系数由式确定,并通过假设检验来推断相关性的显著程度。

ρXY=Cov(X,Y)DXDY=E[(X-EX)(Y-EY)]DXDY(1)

2 基于贝叶斯网络的居民出行方式选择模型

2.1 贝叶斯网络原理

贝叶斯网络[6]由定性部分(以DAG表示的网络拓扑结构)和定量部分(条件概率表)组成,可以用N=<<V,E>,P>来描述。<V,E>为定性部分,是1个有向无环图的节点和有向边,节点代表随机变量,节点变量可以是任何问题的抽象,如测试值、观测现象、意见征询等,有向边代表了节点间的互相关系(由父节点指向其后代节点)。定性部分蕴涵了1个条件独立假设:给定其父节点集,每1个变量独立于它的非子孙节点。典型的贝叶斯网络局部连接方式有序连接、聚合连接及分叉连接3种。P为定量部分,即参数部分,用来表征节点间相互关系强度,是V上的概率分布,指每1个变量在它的父节点下的条件概率,通过在每个节点上指定1个条件概率表格(CPT)来表示,CPT描述每个节点变量上可能的取值在其父节点变量取值组合下的条件概率分布,没有父节点的变量称为根节点变量,用先验概率进行信息表达。按照d-分离和条件独立性假设[7,8,9],变量集V的联合概率分布P可以写成下式:

Ρ(X1,X2,,Xn)=i=1nΡ(Xi/Ρarent(Xi))(2)

2.2 拓扑结构建立

影响因素的相关性分析可为贝叶斯网络拓扑结构的建立提供定量依据,从而得到类似于图1所示的拓扑结构。

2.3 参数估计

拓扑结构建立后,将网络中各节点编号为X1,X2,…,Xn,可利用调查数据对其进行参数估计。若节点Xixi个取值,其父节点Parent(Xi)有qi个的取值,分别将其编号为1,2,…,xi和1,2,…,qi。若无父节点,则qi=1。于是,网络的参数值为θijk=P(Xi=k/Parent(Xi)=j),这些参数并不是相互独立的,根据概率分布的规范性,有

k=1xiθijk=k=1xiΡ(Xi=k/Ρarent(Xi)=j)=1(3)

式中:θijk为在Xi节点的父节点取编号为j的取值的条件下,Xi节点取编号为k的取值的概率。

从实际的居民出行调查中,可以得到m组关于G的完整数据,采用最大似然估计法对网络参数进行标定[8,9,10]。关于参数θ的对数似然函数为

L(Θ/D)=logl=1mΡ(Dl/Θ)=l=1mlogΡ(Di/Θ)(4)

式中:Dl为实际获得的样本;Θ为所有网络参数θ的集合。

在样本Dl中,Xi=k且π(Xi)=j,则令f(i,j.k:D)=1,否则为0。于是有

logΡ(Dl/Θ)=i=1nj=1qik=1xif(i,j,kDl)log10θijk(5)

mijk为在m组样本中满足Xi=k且π(Xi)=j的的样本的数量,得

l(Θ/D)=i=1nj=1qik=1ximijklog10θijk(6)

由于k=1xiθijk=1,可知当θijk取值为mijkk=1ximijk(当k=1ximijk0)或者1xi(当k=1ximijk0)时,使得关于参数θ的对数似然函数值达到最大,即得到了θ的估计。

2.4 贝叶斯网络推理及模型验证

利用贝叶斯网络模型进行推理的特点是:在拓扑结构图上的任意1个节点的信息都能传送给与它非“d-分离”的节点,而且信息可以在任一点任何时候加入作为判据来进行推理更新,加入的信息(判据)越多,所得到的推理结果便越准确。目前较为常用推理算法主要有蒙特卡洛算法和团树传播算法等等[6,10,11]。

将部分调查数据,输入到模型中,进行推理计算,得到各方式选择的概率值,并与实际方式选择情况相比较,通过计算各方式的命中率,从而验证模型的可靠性。

各交通方式命中率:

hi=CiΟiΟi×100%(7)

式中:Ci为贝叶斯网络测算值方式i概率最大的出行个体构成的集合;Oi为在观测样本中选择方式i的出行个体构成的集合。

3 实例分析

对苏州市居民出行进行了调查,抽样率为2.31%,共抽取了24 768份调查数据。本文以所获得的出行数据为基础,对影响因素进行了相关性分析,见表2所列。

注:设定相关系数大于0.1为相关关系较为显著

由相关性分析可知,收入与小汽车拥有存在显著的相关关系,笔者根据贝叶斯网络的构建原则,利用GeNIe建立了如图2所示的拓扑结构。

基于出行调查数据利用GeNIe软件对模型进行参数估计,从而得到了贝叶斯网络的条件概率表(CPT)。各节点的CPT分别如表3~9 所列(由于节点mode的参数较为庞大,因此无法在文中列出)。

某出行个体数据如表10所列,将其输入到模型中,所得其出行方式选择结果如表11所示,模型所得结果与实际选择方式一致,即该个体命中。

利用所得到的调查数据,对模型进行验证。按命中率计算方法对抽取的数据进行计算,得到全体命中率为88.57%,模型实用性较好。各方式命中率如表12所示。

4 结论

1) 采用贝叶斯网络建立的出行方式选择模型是可行的,其预测结果精度较高。

2) 模型中,可根据实际的数据获得情况,灵活的调整网络的结构,加强可操作性,对于不同的城市,可根据实际情况调整各种影响因素的取值范围,从而改变网络的参数,使方式选择结果更合理。

但是,模型还存在着一些不足和值得改进的地方:

1) 模型是通过现状居民出行调查进行标定,对于未来居民出行方式的预测具有一定的局限性,需结合SP调查重新进行参数标定才能合理预测特征年居民出行方式比例结构。

2) 模型主要适用于较为稳定情况下的出行方式选择分析,没有考虑到其他外部条件的特殊变化,如交通政策的改变等,这也是影响出行方式选择的1个很重要的因素。

综上所述,基于贝叶斯网络分析居民出行选择特性,充分考虑了城市交通问题的复杂性与随机性,具有较强的实用性。

摘要:论文以居民出行方式选择为研究对象,分析了城市居民出行方式的影响因素,建立了基于贝叶斯网络的居民出行方式选择模型,并以苏州市为例,结合居民出行调查数据采用极大似然法对模型进行了参数估计,并采用贝叶斯网络推理方法验证模型精度。结果表明,该模型能较全面地考虑居民出行选择的影响因素,模型精度较高。

关键词:出行方式,贝叶斯网络,参数估计,推理

参考文献

[1]刘炳恩,隽志才.居民出行方式非集计模型的建立[J].公路交通科技,2008,25(5):116-120

[2]鲜于建川,隽志才.基于知识的神经网络在出行方式选择中的应用研究[J].计算机应用研究,2008,25(9):2 651-2 654

[3]李海峰,王炜.基于神经网络的交通方式选择模型[J].公路交通科技,2007,24(7):132-136

[4]秦小虎,刘利.一种基于贝叶斯网络的交通事故预测方法[J].计算机仿真,2005,22(11):230-232

[5]Guo Xiucheng,Lv Shen.Study of passenger flowforecast model on coperative and compeetitive ODmatrix in urban rail transit in china[C].The Siga-pore:TEEE-ITSC,2002

[6]张连文,郭海鹏.贝叶斯网引论[M].北京:科学出版社,2006

[7]Zhang N L.Irrelevance and parameter learning inBayesian networks[J].Artificial Intelligence,1996,88(1):359-373

[8]Vomlel J.Two applications of Bayesian networks[J].In Proceedings of Conference Znalosti 2003,10(2):73-82

[9]Friedman N,Linial M,Nachman I,et al.UsingBayesian networks to analyze expression data[J].Journal of Computational Biology,2000,7(3):601-620

[10]Wolbrecht E,Dambrosio B,Paasch R,et al.Moni-toring and diagnosis of a multistage manufacturingprocess using Bayesian networks[J].AI EDAM,2000,14(1):50-56

基于贝叶斯的防病患欺诈模型研究 第8篇

目前社会上存在着一些不法分子在履行参保缴费义务上虚构事实, 隐瞒真相, 以骗取医保权益, 或在医疗行为上虚构事实, 隐瞒真相, 以骗取医保基金或医保待遇。这类欺诈行为在各个国家普遍存在。美国联邦政府多次表示, 打击医疗保险诈骗案, 是医疗保险改革议程的重要组成部分。这些违法行为已经给我们国家带来了极大的经济损失, 严重影响我国医疗行业的进一步发展。我国虽还没有完整的社会医疗保险欺诈统计数据, 但防病患欺诈已经成为引起学者重视的社会问题。

就目前业界人士认为, 防范欺诈的手段有两个, 一是政策调控, 采用行政手段, 依靠法律和行业互助来限制这种不良行为;二是利用技术手段, 防范于未然。两者相比, 利用技术手段是目前最佳的防范欺诈手段。实践证明较为有效的有NCR公司开发的Teradata数据仓库。Taniguchi等学者也提出了三种欺诈侦测方法。国内对这种防病患欺诈主要采用的还是行政手段。夏宏等认为要加强法律法规建设, 完善医疗保险制度等措施。李连友等梳理了相关制度, 指出应该做一些实证研究。杨鹤标等提出了基于概率分布的异常检测模型, 但该模型只能应用于已结束治疗且有医疗欺诈嫌疑的情况。

综上可知, 国内对防病患欺诈问题的研究处于起步阶段, 需要一种技术为作为重要手段来解决目前存在的病患欺诈问题。与此同时, 贝叶斯分类以其简单, 高效与准确等特点, 在一些实际的事例里得到了广泛的研究与应用。本文尝试运用贝叶斯的相关理论与方法建立防病患欺诈模型, 对未知类别属性的患者进行预测, 识别有欺诈趋向的病患。为相关医疗部门有针对性地采取处理措施, 防范病患欺诈行为的发生, 减少欺诈行为带来的经济损失提供理论支持。

1 模型构建

客户的数据主要包括两种:静态数据和动态数据。静态数据指的是通常不会改变的数据, 如客户的基本信息等。动态数据指的是经常或定期改变的数据信息, 如每月消费金额, 交费记录等。由于社会对人的隐私权的尊重, 现在患者的手续已趋于简单化, 一般只需提供证件号码和地址即可办理, 所以现在相关部门所拥有的客户基本信息已经很简单, 很难从中发现对欺诈分析有价值的信息。而动态数据反映的是具体行为, 往往可能隐藏一些行为特征, 所以应从动态数据中进行挖掘, 尝试从中发现欺诈行为的一些规律和特征。通过对欺诈行为的具体分析, 本文得出贝叶斯分类模型所需要的训练样本集的各属性 (如表1) 。

模型建立如下:

(1) 每个数据样本用一个n维特征向量X={x1, x2, …xn}表示, 分别描述对n个属性A1, A2, …, An样本的n个度量, 即为病患设定的基本属性例如年龄、出生, 消费金额等。

(2) 假定有m个类C1, C2, …Cm。给定一个未知的数据样本X (即没有类标号) , 分类法将预测X属于具有最高后验概率 (条件X下) 的类。即贝叶斯分类将未知的样本分配给类Ci, 当且仅当

则, 最大化最大的类Ci称为最大后验假定。可得

(3) 由于P (X) 对于所有类为常数, 只需要P (X|Ci) P (Ci) 最大即可。如果类的先验概率未知, 则通常假定这些类是等概率的, 即P (C1) =P (C2) =…=P (Cm) 。并据此只对最大化。否则, 最大化P (X|Ci) P (Ci) 。类的先验概率可以用计算, 其中si是类Ci中的训练样本数, 而s是训练样本总数。

(4) 给定具有许多属性的数据集, 计算的开销可能非常大。为降低计算的开销, 在下面的模型中们做了类条件独立的假定。给定样本的类标号, 假定属性值相互条件独立, 即在属性间, 不存在依赖关系。这样,

概率可以由训练样本估值, 其中Ak是分类属性, , 其中sik是在属性Ak上具有值Xk的类Ci的样本数, 而si是Ci中的训练样本数。

(5) 为对未知样本X分类, 对每个类Ci, 计算。样本X被指派到类Ci, 当且仅当

2 实验研究

在射阳中医院相关工作人员帮助下, 获得了大约2000条病患的数据。

2.1 数据预处理

首先把获得的数据通过数据清理数据转换形成满足属性表1所示的各类样本数据集, 为实验做好准备。把样本数据集分为两个部分:一部分用来训练模型, 其他数据用于对模型进行修正和检验。

2.2 实验过程

参照了相关资料, 贝叶斯分类对于多属性的数据集计算量会比较大。为降低计算复杂度, 我们做了独立性假设, 同时选取15个训练样本 (见表2) 。通过分析训练数据, 得出Age的三个离散值分别为<20, 20~50, >50;Jy (Freq) 的三个离散值分别为low, medium, high;Yh (Ratio) 的三个离散值分别为<20, 20~40, >40;Bh (Grade) 的三个离散值分别为fair, excellent, bad。

设C1对应Is (Fraud) =“yes”, C2对应Is (Fraud) =“no”。待分类未知样本为:

可知, P (X) 为常量, 需要计算P (X|Ci) P (Ci) 。然后比较值, 取最大的Ci即为样本的类标识属性。

首先计算先验概率P (Ci) , i=1, 2。

然后计算P (X|Ci) , i=1, 2。为了计算它, 需要计算以下条件概率:

显然P (X|C1) P (C1) >P (X|C2) P (C2) , 所以预测得到该样本的类别属性是Is_Fraud="yes"。

2.3 程序实现

因C++面向对象的优点, 用其编写了子程序BaysClass来实现上述模型的功能, 工作流程见图1。具体效果如图2。

数组变量p1用来存储测试样本集中如果类标识属性“Is_Fraud”=“yes”时不同字段取得不同值时的条件概率;数组变量p2用来存储测试样本集中如果类标识属性“Is_Fraud”=“no”时不同字段取得不同值时的条件概率;数组变量q1用来存储测试样本集中如果类标识属性“Is_Fraud”=“yes”时不同字段取得不同值时的条件概率值的积;数组变量q2用来存储测试样本集中如果类标识属性“Is_Fraud”=“no”时不同字段取得不同值时的条件概率值的积。

2.4 性能测试

准确率是用来衡量某个分类模型对整个数据集分类的准确程度。在病患实际应用中, 相比有欺诈趋向的病患和正常病患, 我们更关心有欺诈趋向的病患, 从这个方面来讲, 命中率更能衡量此类模型的优劣。其定义分别说明如下:

准确率=预测正确的记录数/全部记录数

命中率=被准确预测为某个类别的记录数/预测出为此类别的记录数

由于k-折交叉确认方法的优点, 本文选择10-折交叉法对模型进行评估 (k取10具有相对低的偏置和方差[10]) 。

共取1000个数据作为测试数据, 其中欺诈病患共计256个, 正常病患744个。256/744=0.34。把这些数据分为10个大小不等且互不相交的子集:S1, S2, …., S10。其中每个子集的欺诈病患/正常病患都接近0.43。测试的结果见表3, 表4。

从测试结果看, 本文建立的防病患模型的准确率和对有欺诈行为趋向病患的命中率都是令人满意的。

3 结束语

本文建立了基于贝叶斯的防病患欺诈模型, 通过程序进行了实验, 并对其性能进行评估。需要说明的是, 经模型分析出患者有异常行为不一定说明该患者就发生了欺诈行为, 正常患者有时也会因一些特殊的原因或突发事件而表现出异常行为。故模型测试结果仅作为相关医药部门进行防病患欺诈的辅助手段, 为其有针对性的进行跟踪, 节省社会资源提供帮助。

本模型在训练样本集属性的选择上主要是分析了个人病患的就医行为, 下一步将会以病患种类作为分析对象, 并将现有程序延伸成为一个系统继续完善。

摘要:为避免病患欺诈给我国相关部门带来的极大经济损失, 甚至会危害到我国医疗的进一步发展, 采用贝叶斯分类对防病患欺诈模型进行了研究, 并对其性能进行测试。测试结果表明所建模型性能良好。研究成果可为相关部门防范病患欺诈提供理论支持。

关键词:贝叶斯,病患,欺诈,异常检测,社会稳定

参考文献

[1]Taniguchi M, Haft M, Hollmen J, et al.Fraud detection in communication networks using neural and probabilistic methods.In Proceedings of The 1998IEEE International Conference in Acoustics[C]//Speech and Signal Processing, 1998:1241-1244.

[2]夏宏, 汪凯, 张守春.医疗保险中的欺诈与反欺诈[J].现代预防医学, 2007, 34 (20) :3907-3908.

[3]Li Lian-you, Shen Chun-yu.On overview of researches on fraud in China’s social health insurance system[J].Journal of Xiangtan University, 2009, (06) :71-75.

[4]杨鹤标, 史晓丽.基于概率分布的临床行为检测模型[J].计算机工程与设计, 2011, 32 (8) :2857-3860.

[5]王珏, 杨鹤标.序列挖掘在临床行为模式发现中的应用研究[D].江苏大学, 2008.

[6]陈朝大, 梁柱勋, 郑士基.一种利用关联规则的改进朴素贝叶斯分类算法[J].计算机系统应用, 2010, 19 (11) :106-109.

[7]廖阳.基于拓展贝叶斯决策模型的云计算类企业财务风险实证[J].统计与决策, 2013 (24) :179-182.

[8]郭刚正.贝叶斯方法在决策分析中的应用[J].统计与决策, 2013 (16) :67-69.

[9]王姝音, 印桂生, 湛浩旻等.网构软件系统中实体协作的贝叶斯博弈分析[J].计算机工程, 2014, 40 (2) :52-57.

贝叶斯博弈模型 第9篇

显著性检测问题来源于人类的视觉注意机制,这种机制使人们可以在没有训练的情况下迅速将注意力聚焦在显著目标上。它是由人眼视觉系统的高度发达所决定的,而计算机视觉目前还达不到这样的程度,基于视觉注意显著图的生成方式还没有形成统一模型。同时由于显著区域检测在自适应压缩、目标检测、图像检索等中有着广泛的应用价值,因此,显著目标区域检测得到国内外学者的广泛关注。

目前关于显著区域提取的工作主要划分为三个大的类别:一类是基于低级视觉特征,由数据驱动的自底向上的视觉计算模型。其中的大部分都是基于像素点和周围像素的特征对比,包括亮度、颜色和梯度方向等。例如文献[1,2]是此类方法中的经典方法,此模型建立在局部特征对比的基础上,忽略了显著目标自身信息的指导,使得检测结果不够理想。为此文献[3]在Itti模型的基础上利用深度搜索和层次转移来模拟人眼关注物体的顺序,引入了视觉树算法,此算法计算结果很大程度上依赖于参数的选择。进而文献[4]提出利用进化规划原理检测显著区域,核心是局部区域的显著性与其在整幅图像中出现的频率成反比,缺陷是难以保证大目标检测的准确性。针对该问题,文献[5,6]提取出的显著区域也能保留精准的边缘,且该算法用三种低级视觉特征,设计了一种新的特征融合策略,通过分析不同特征对显著图产生的不同作用而动态的计算出特征的权值获得更为鲁棒的显著图。一些研究者从频域角度提出基于残余频谱思路,利用自然背景的傅里叶频谱的统计特性,将频谱的残差傅里叶逆变换计算显著图,算法对于小目标较好[7,8]。另外一些研究者利用相位谱提出四元数傅里叶变换相位谱(PQFT)的多分辨率时空显著性检测模型,通过计算图像的四元数表达式来获得时空显著图[9]。第二类是基于高级视觉特征,与任务、知识等相关的自顶向下的视觉选择注意模型,其中比较有代表性的是基于判别显著性的检测方法,将提取图像块特征并且聚类作为先验知识来模拟人眼对不同物体的辨别能力[10,11]。例如文献[12]提出一个基于目标识别的生物视觉注意机制模型。这个模型包括训练阶段和注意阶段,并把自底向上和自顶向下的显著图融合为一幅引导视觉注意的全局显著图。文献[13]在自底向上的显著性度量基础上,提出熟识度来引导自顶向下视觉注意目标识别,构造出应用于SIFT特征的统一视觉注意模型(UVAM)。第三类是将概率模型引入显著检测问题,从底层特征的空间关系出发,计算特征的空间复杂度来获得像素的显著值。例如一些文献先对颜色成分进行高斯混合模型聚类,通过对比得到颜色显著图,然后结合方向的空间分布性质和方向熵对比计算得方向显著图[14]。另外一些将贝叶斯决策[15]、马尔科夫搜索[16]、窗口内外的统计分布特征[17]引入显著性检测过程,实现显著目标检测。

综上可见,因高级视觉计算模型需要对大规模的图像数据库进行学习,计算量大且不具有通用性,所以显著提取算法主要从低级视觉出发,目前现有的低级视觉模型主要依赖像素间的相互对比,缺乏利用显著目标的自身特性以及相互关系来分析和理解。为此,依据显著目标是显眼、紧凑和完整的思路,本文提出基于过渡滑动窗特征分布贝叶斯分析的视觉注意检测模型,既考虑了不同的低级显著特征,同时通过贝叶斯结构考虑各个显著元素之间的关系,通过对比贝叶斯结构中内窗和过渡窗外的特征值得到该像素是显著像素的概率值,最后通过取最大值模型合并得到输入图像的显著图。

1 显著目标检测系统组成

本文构造系统组成框图图1所示,首先根据局部区域与其多个尺度邻域的对比得到亮度显著值;然后利用颜色信息的空间紧凑性、同质性和孤立性得到颜色显著值;同时通过多尺度多方向的Gabor滤波器组模拟人类视觉系统提取图像块的方向显著值;把这些显著特征一起输入单尺度的贝叶斯结构,通过对比贝叶斯结构中内窗和过渡窗外的特征值得到该像素是显著像素的概率值,此值为显著值,最后通过取最大值模型合并得到输入图像的显著图,从而提取显著目标。

2 基于过渡滑动窗特征分布贝叶斯分析的的视觉注意检测模型

2.1 亮度显著值

通过对大量显著目标的观察发现,如某个目标显著,那么其像素值与其邻域存在较大差异。目标的亮度显著值是指该目标亮度与其多个尺度邻域对比的差异和。因此像素点(u,v)亮度显著值:

其中:Dt(u,v)表示点(u,v)的像素值与其t×t邻域内像素平均值的欧氏距离,l(u,v)表示点(u,v)的像素值,mt(u,v)指像素点(u,v)的t×t邻域内像素的平均值,t={2z,4z,8z},z=min(m,n),m、n为图像的宽和高。

亮度显著图示例如图2。

2.2 颜色显著值

颜色是彩色图像的重要信息,人类视觉感知系统对颜色信息的敏感度较高,所以颜色信息是视觉注意中非常重要的特征。为实现合理的颜色特征显著性检测,首先提取图像的颜色主分量,然后以颜色主分量为中心进行聚类,最后依据显著目标是显眼、紧凑和完整来进行显著性检测。在Lab颜色空间,利用a分量和b分量分别建立直方图,用高斯函数对其进行平滑。将两个直方图的局部最大值组合,得到组成这幅图像的颜色主分量。以颜色主分量为中心按照距离最小原则进行初始聚类,设定一个阈值T,当属于某种颜色分量在图像中所占的比例小于T时,将这种主分量去掉,并把原本属于它的像数点归入到与其距离次最小的颜色主分量,突出主分量的作用。颜色主分量提取示意图如图3。

下面依据颜色信息空间紧凑性、同质性和孤立性来进行颜色显著值计算。

1)空间紧凑性(Space Compactness),指颜色分量的空间分布的紧凑程度,可由类内方差衡量。由于靠近图像中央区域的目标类间方差和较小,因此可用类内方差和类间方差相结合来检测空间紧凑性,还可以抑制方差较大的背景区域。颜色分量i的类内方差iVin、类间方差和iVout分别为

式中:iμsp=⎢⎣Yave(i)⎡Xave(i)⎥⎦⎤表示颜色分量i的质心,Xave(i),Yave(i)分别指颜色分量i的像素点的横坐标和纵坐标的平均值。diisp表示颜色分量i的像素点的空间位置对于颜色分量j的质心的偏离程度,Num(i)表示颜色分量i的像素点个数。由于方差越大,其空间分布越扩散,显著性越差。因此,将类内方差iVin归一化使得最大的iVin的值为0,而最小的iVin的值为1,同理,归一化iVout使得最大的iVout的值为0,而最小的iVout的值为1。颜色分量i的空间紧凑性ic为

2)同质性(Homogeneity),指局部区域颜色分量相似度,反映区域的一致性,颜色分量i同质性定义为

其中:am(i)=Num(i)∑(x,y)∈sp(i)a,bm(i)=Num(i)∑(x,y)∈sp(i)b,am(i),bm(i)分别是指颜色分量i的像素点的a分量和b分量的平均值,μiab表示颜色分量i的质心。iVab表示颜色分量i的方差,Siab表示由颜色分量i的像数点的a分量和b分量组成的颜色向量集。

3)孤立性(Isolation),是指局部区域相对于周围环境的孤立程度。区域与其周围环境的差异越大,越能引起人类的注意。颜色分量i的孤立性定义为

其中:μjab指颜色主分量j的质心,N(j)表示颜色分量j在图像中所占的比例。

通过空间紧凑性、同质性和孤立性综合实现颜色显著值的计算,颜色分量i的显著值为

2.3 方向显著值

方向特征是一种依赖于亮度的视觉特征,它反映物体表面的内在特性。由于人类的视皮层细胞可以被看作是一个线性空间滤波器,因此Gabor滤波器可以有效地描述哺乳动物视皮层细胞感受野的剖面。同时人类视觉系统具有多通道和多分辨率的特征,而二维Gabor函数正是一种基于多通道和多分辨率分析方法的典型代表,所以利用多尺度多方向的Gabor滤波器组模拟人类视觉系统提取图像块的方向显著值。实验中滤波器选取5×5、9×9、13×13和17×17四个尺度,为了降低计算复杂度,每个尺度仅选择四个方向θ0=0{°,45°,90°,135°}作为Gabor能量的朝向选择,构成一个16维的Gabor滤波器组(4个尺度×4个方向),将每个方向的四幅特征图通过取最大值合并得到四幅不同朝向的方向特征图,然后再通过取最大值合并得到一幅方向显著图。

2.4 像素特征值向量

由前三小节描述获得某一像素点的特征向量为

其中:x为输入图像中的一个像素点,Lx为点x的亮度显著值,Cx为点x的颜色显著值,Ox为点x的方向显著值。

2.5 基于过渡滑动窗的贝叶斯结构

设一个矩形窗R,分为三部分:内部窗K、过渡环T和外围部分B,如图6所示。

2.5.1 显著值

在一个矩形窗R内,内部窗K、过渡环T和外围部分B,如图6所示。标记R和K的宽和长分别为

wR、hR和wK、hK。设x∈ℜ2为窗R中的一点,而F(x)为x点处的特征值向量,由前4节得到Fx={Lx,Cx,Ox}。

定义两个假设,H0:点x不显著;H1:点x显著。并且相应的概率为P(H0)和P(H1)。首先假设H1对于K中的点成立,H0对于B中的点成立。由以上假设,可得条件特征分布p(F(x)|H1)和p(F(x)|H0)。根据贝叶斯概率公式P(A|B)=P(B|A)P(A)/P(B),可以定义

并且由P(F(x))=p(F(x)|H0)P(H0)+p(F(x)|H1)P(H1),可以进一步将式(8)写成

由P(H1|F(x)),可以计算出K中每个点为H1的概率,然后由设定的阈值判断假设H1是否成立。则定义K中的点x的显著值S(x)为所估算的概率值。

由上述定义所得的显著值反映了K和B中的特征值的对比。

2.5.2 显著性检测

设I为长和宽分别为hI和wI的输入图像,令R(i)为中心在点i上的窗,以步长ωs滑动此窗,计算每一处窗位置i的显著值Si(x)。步长ωs的选择必须保证内窗与内窗之间可以重叠,则某一点的显著值为

由于此方法结合了过渡窗,只要保证步长的选择使内窗之间重叠就能使每一处的内窗K跟外围部分B进行充分的对比,因此不需做内窗K的多尺度假设,只要进行单尺度的运算就能保证检测的完整。

2.5.3 条件概率密度函数

为了计算出S(x),需要估计出条件概率密度函数p(F(x)|H1)和p(F(x)|H0)。因此在K和B中计算归一化特征直方图。进一步用高斯核函数平滑此直方图以增加鲁棒性,分别独立计算每个特征通道的显著值,取最大值得到最后的显著值。

令hisK(F)和hisB(F)分别表示从K和B得到的直方图。g(F)为高斯平滑函数。则所估算的条件概率密度函数p(F(x)|H1)和p(F(x)|H0)为

其中:*表示卷积算法,N(⋅)表示和归一化操作:

3 仿真实验

为了验证算法的合理性和有效性,本文采用MSRA数据库中的图片进行实验。将本文算法与Itti模型、文献[8]算法(简称Hou算法)、文献[15]算法(简称SUN算法)、文献[17]算法进行对比;最后根据查准率、查全率和F-Measure等性能指标进一步测试所提算法的性能。

在本文算法实验中选取如下窗大小为尺度,输入图像宽和长为wI和hI,R和K的宽和长分别为wR、hR和wK、hK,ωs为步长,B的宽和长为wB、hB。取wK=0.25×max{wI,hI},hK=0.1×max{wI,hI},

并且P(H1)=0.2。比较所得到的显著图如图8。

从图8可以看出,本文算法有较好结果。Itti模型可以较好检测到显著目标,但是当背景较杂乱时会出现误判现象,见图8中第三、五和第六个目标。SUN算法能检测出较好的边缘,但是对于显著目标的检测内部不饱和。Hou算法当背景较复杂时,检测效果不够理想,文献[17]所提算法在目标和背景的颜色差异比较大时有较好的表现,但是当目标与背景的颜色相近时提取的显著目标不够完整,且对于不同颜色组成的同一物体检测效果不佳,如图8中第二、三、五和六个目标。与上述四种算法相比,本文算法能够比较准确和全面地检查到显著区域,而且较好的抑制杂乱背景影响。但是,当目标与背景差异较小或背景对目标存在较大干扰时,所提算法效果下降明显,如果需要在背景较复杂图像条件下准确检测显著目标,需要加入更多的语义信息进行辅助处理。

对本文算法和Itti模型方法、Hou算法、SUN算法、文献[17]算法分别采用自适应阈值方法进行显著目标提取。对于所有算法进行相同的后期处理:关闭孔洞、去除面积较小的区域(面积阈值为图像面积1/1 000)。比较所得到的显著目标提取图,如图9所示。

同时MSRA显著目标数据库提供了9名不同的观察者为图像样本的显著目标制定的矩形框,对不同的矩形框取平均并以其为标准把矩形框内部区域判为目标(值为1),矩形框外判为背景(值为0)得到二值化的显著概率图,采用查准率、查全率和F-Measure检测算法的有效性,F-Measure定义如下:

式中:Precision表示查准率,Recall表示查全率,α取0.3。

从图10可以看出,本文提出算法在查准率、查全率和F-Measure都好于其它三种算法,并且在查全率上有较大改进,表明本文算法思路的合理性。

结束语

依据显著目标是显眼的、紧凑的和完整的思路,将紧凑性、同质性、孤立性与初级视觉特征一同作为像素点特征通过一个以局部窗口的块来估算显著值的过渡窗贝叶斯模型来提取视觉注意显著目标,将此方法应用于各类具有不同特点的图像进行仿真实验,得到较好的检测结果。与其他四种具有代表性的算法相比,该方法的检测结果更加准确、合理,对于目标检测的整体性效果更好,但本文模型也存在不足之处,由于只考虑到低级视觉特征,因此当目标与背景差异较小或背景对目标存在较大干扰时,所提算法检测性能下降明显,如何结合先验信息增强算法处理复杂图像的能力将是今后的工作。

摘要:依据显著目标是显眼、紧凑和完整的思路,提出基于过渡滑动窗特征分布贝叶斯分析的显著目标检测模型。首先根据局部区域与其多个尺度邻域的对比得到亮度显著映射图;然后利用颜色信息的空间紧凑性、同质性和孤立性得到颜色显著映射图;同时通过多尺度多方向的Gabor滤波器组模拟人类视觉系统提取图像块的方向显著映射图。最后将这些显著特征一起输入单尺度的贝叶斯结构模型,通过对比贝叶斯结构模型中窗内和过渡窗外的特征值计算出该像素是显著像素的概率值,最后通过取最大化映射规则计算出输入图像的显著图,从而得到显著目标。将此算法应用于不同图像进行仿真实验,得到较好的显著性检测结果,表明该方法是切实可行的。

贝叶斯博弈模型

贝叶斯博弈模型(精选9篇)贝叶斯博弈模型 第1篇众所周之, 排污权的价格问题是排污权交易有效运行的核心内容, 因此我们首先应明晰排污权...
点击下载文档文档为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部