贝叶斯理论范文
贝叶斯理论范文(精选10篇)
贝叶斯理论 第1篇
关键词:贝叶斯理论,决策理论,决策方法,进展
1 贝叶斯理论的发展
总体来说, 贝叶斯理论的发展经历了以下几个阶段:1736年Thomas Bayes提出了重要的贝叶斯定理, 1763年其遗著《论有关机遇问题的求解》被他的朋友Richard Price整理发表, 贝叶斯理论的价值才被世人认识, 贝叶斯理论开始莫基。随后, Laplace等作了进一步的工作, 目前以他姓名命名的定理的现代形式实际上归功于Laplace。进入到20世纪50年代, 贝叶斯理论得到了充分发展, 60、70年代以来, 其发展达到鼎盛时期。许多专家学者投身于贝叶斯理论的研究和应用推广中来, 力图从不同的角度对贝叶斯理论进行进一步的探讨和研究, 形成了具有多分支的理论系统。
2 贝叶斯决策理论
贝叶斯理论系统中的另一个重要分支就是贝叶斯决策理论。贝叶斯决策 (Bayesian Decision Theory) 就是在不完全情报下, 对部分未知的状态用主观概率估计, 然后用贝叶斯公式对发生概率进行修正, 最后再利用期望值和修正概率做出最优决策。
贝叶斯统计理论与最优决策的结合, 首先在商业和社会科学中得到了很大的成功, 其次是在物理、化学、生物等学科领域得到了广泛的应用, 如今其概念和方法在社会许多领域得到了广泛应用, 如在工程技术、管理科学、系统运筹、医疗诊断等。
3 贝叶斯决策方法简介
贝叶斯决策方法主要包括经验贝叶斯决策、两阶段贝叶斯决策和序贯贝叶斯决策三种方法。
3.1 经验贝叶斯 (Empirical Bayes, 简称EB) 决策
经验贝叶斯决策的主要工具是经验贝叶斯方法, 该方法由Von Mises提出, 被Robbins所广泛发展。其基本思想是在已知状态参数向θ= (θ1, θ2, …, θp) 各分量之间结构关系的前提下, 使用当前抽样数据及有关历史数据对先验分布的一些数字特征进行统计推断。它在未知θ是低维还是高维时, 处理问题特别有效。这种方法一般又分为两种:一种是假设θ的先验分布属于某一含有未知超参数的分布族, 通过利用观测数据来估计其中的未知参数, 这种方法称为参数经验贝叶斯方法, 简称PEB方法。
3.2 两阶段贝叶斯决策
两阶段贝叶斯决策是以先验两阶段确定理论为基础的。在第一阶段, 记π1 (θ|λ) 为参数的未知先验分布, 其中λ为一超参数, 这儿我们不直接对参数兄作估计, 而是代之以元有第二阶段的先验分布π2 (λ) , 它可以是一个合适的正常先验, 但常常是选择一个合适的无信息先验。类似于经验贝叶斯决策, 这种方法也可以分为“可交换”和“一般意义下的”两种情况。
3.3 序贯贝叶斯决策
序贯决策是一种多级决策的方法。该决策过程是序贯进行的, 类似于序贯概率比检验。它是在每次试验 (或抽样观测) 之后, 进行一次统计推断, 看能否决定采取某种行动, 若能, 则做出决策, 否则, 则再进行一次试验。因此, 序贯决策的目的是在试验次数随机的情况下, 尽可能利用较小的样本进行统计推断。序贯贝叶斯决策根据不同情况又分为三种: (1) 最佳固定容量的序贯贝叶斯决策; (2) 序贯贝叶斯因子检验法; (3) 决策树法。决策树用一些标记符号表示决策者所能采取的各种行动路径, 通过树枝状展开, 并利用概率表达其中的可能状态, 经运算得知采取每种行动路径后能够获得的期望值。
4 贝叶斯理论与方法的研究进展
贝叶斯方法属于风险性决策方法, 决策者虽不能控制客观因素的变化, 但却掌握其变化的可能状况及各种状况的分布概率, 并利用期望值即未来可能出现的平均状况作为决策准则。不确定性是生活中的常态, 贝叶斯方法不是使决策问题完全无风险, 而是通过其他途径增加信息量使决策中的风险减小。关于贝叶斯理论与方法的研究以深入到各个方面。
4.1 数量遗传学中QTL作图的贝叶斯方法研究
在许多复杂情况下.贝叶斯统计方法比经典数理统计方法能更直接解决问题.且可有效整合部分先验信息.但其需要高强度计算的特性曾限制了其广泛应用近几十年来.随着高速计算机的发展以及MCMC算法的不断提出.贝叶斯方法已被用于群体遗传学、分子进化、连锁作图和数量遗传学等研究领域.已有许多学者研究了数量遗传学中QTL作图的贝叶斯方法从简单到复杂的。
4.2 贝叶斯网络的研究进展
贝叶斯网络在经济和医学等领域越来越多的应用日益显示出其发展前途, 这些应用通过正在建成许多应用模型用于预测石油和股票价格、控制太空飞船和诊断疾病等等不断地渗人我们的社会和经济生活中。除此之外贝叶斯网络还被应用于信息恢复诊断与故障检测、工业方面、电讯通信业、交通管理、文化教育和国防系统等各个领域。在解决许多实际问题中, 我们可以使用贝叶斯网络这样的概率推理技术从不完全的、不精确的或不确定的知识和信息中做出推理。
4.3 贝叶斯数据挖掘算法在反垃圾邮中的研究进展
随着互联网络的发展, 垃圾邮件越来越多地充斥着人们的邮箱, 部分学者开始研究现在反垃圾邮件的技术, 研究了用来评价垃圾邮件分类方法的语料库和评价体系, 着重对贝叶斯理论和贝叶斯参数估计理论进行研究, 并取得以下的研究成果: (1) 在贝叶斯分类器的工作原理基础上, 设计了基于朴素贝叶斯反垃圾邮件模型; (2) 在贝叶斯分类器的工作原理基础上, 提出一种新的邮件分类方法———贝叶斯参数估计邮件分类, 设计实现了基于贝叶斯参数估计的反垃圾邮件模型; (3) 通过对以上两种方法进行邮件过滤实验比较, 证明在邮件分类中基于贝叶斯参数估计分类方法比朴素贝叶斯分类方法具有更高的召回率、正确率和F值。基于贝叶斯参数估计的邮件分类算法为解决目前困扰人们的垃圾邮件问题提供了一种新的解决方法和途径。
4.4 基于贝叶斯方法的水文模型不确定性研究进展
水文过程的发生与发展取决于气象因素和地理因素, 是一个复杂的动态过程;水文模型接受水文、气象等多种输入, 运用了许多水文模型与参数, 依赖于对输入、输出信息进行解释的专家们的判断, 这些复杂的因素导致了水文预报必然存在不确定性。水文模型不确定性是水文预报不确定性的重要来源之一, 该不确定性始终存在并制约着防洪决策的正确性。水文学家很早就认识到了这一问题, 并试图通过多方面的努力来消除或减少该不确定性。
贝叶斯概率水文预报突破了常规确定性水文模型在信息利用方面的局限性。经美国国家气象局的实际应用表明:不管水文预报的不确定性有多大, 总可以保证从概率水文预报中获得正的经济效益。概率水文预报是水文预报发展的必然趋势, 作为预报决策系统的重要组成部分, 必将引起国内外水文界的兴趣和关注。
5 结语
从1736年出现贝叶斯理论至今, 贝叶斯理论已经发展的较为成熟并被广泛应用于各个领域。虽然贝叶斯理论在某些领域的研究中还存在一些局限性和风险性, 但是人们越来越感受到贝叶斯理论和方法的重要性。
参考文献
[1]岳超源.决策理论与方法[M].北京:科学出版社, 2005.
[2]徐泽水.不确定多属性决策方法与应用[M].北京:清华大学出版社, 2006.
[3]施锡铨, 范正绮.决策与模型[M].上海:上海财经大学出版社, 2003.
[4]简祯富.决策分析与管理[M].北京:清华大学出版社, 2007.
[5]苏岩.贝叶斯统计的发展及其争鸣[J].保定师范专科学校学报, 2003 (02)
贝叶斯理论 第2篇
贝叶斯推理;启发式策略;天然样本空间;频率影响
根据不确定性信息,人们作出推理和决策需要对各种结论的概率作出估计,这类推理称为概率推理,概率推理是概率和逻辑的研究对象。概率和逻辑是研究客观概率或规则的认知。贝叶斯推理概率推理问题,透露的概率信息认知过程和规律,指导人们有效的学习和判断决策,有一个非常重要的理论和现实意义,根据直观的推理,和自己的判断,来研究推理过程,这样的推理被称为贝叶斯推理。
贝叶斯推理问题的研究范式
在统计研究工作中,为探究概率以及推理方面的问题,通常采用不同的研究范式,以更好提高统计研究质量。从当前理论界现有有的研究成果来看,贝叶斯推理的研究范式有两个,一个是文本范式,另一个经验范式。文本范式形式是在直接提供每个事件的概率、命中率和误报率的基础上,得出一个事件发生的概率的大小。然而,在现实生活中人们通常采用经验理论,从所经历事件的常规经验出发得出结论,而不是像文本范式被动地接受,因此,经验范式能有效的克服文本范式格式变动较差的缺陷。在实验中,测试的概率应在经验丰富的事件过程中,收集基础概率信息具有主动地位,命中率相对比较高,有效降低误报率和能干扰统计效果的无用信息,然后作出判断的经验范式。实验过程是非常接近日常生活中的概率信息,在行使其判断的情况下,更真实地根据人民群众实际特性和过程的概率作出判断。因此,许多研究人员使用这个范例。研究范式的变化并没有消除上述问题,在不同的研究范式中,有概率忽视信息或敏感现象,并出现了各种概率忽略或敏感现象。
几个主要理论
如前所述,在某些条件下,人的概率判断,忽略基础概率,其他条件不能忽视基本的概率。那么,它是如何作出判断的?哪些因素会影响人们的推理的概率?在这方面,不同的研究人员已经提出了不同的观点。
(一)启发式策略理论。Kahneman和Tversky概率的直觉推理的认知策略,这主要是依赖于经验判断或猜测,于是常常做出错误的判断。主要的认知策略,包括“代表性”和“可用性启发式”。可用性启发式是人们往往很容易得到这种现象在知觉或记忆的例子中估计出现的概率,如在实验中被要求估计的英文字母R,L,N,K,V在开始的单词数量和第三个字母的单词的数量,在实际上前者的比例是根据远低于后者的比例的基础上,因为人们更容易记住以这些字母开头的单词,不容易记得他们中间的字。
(二)天然样本空间假说。Gavanski的大概率事件,它是在一定范围内,因为这是一种自然倾向抽样,他们称之为“自然采样空间”,直接从样本来确定采样空间的性质,如果事件的概率是公正的,作出准确的判断是容易的,但是,如果要求为了正确确定事件而从非自然样本空间中抽样,容易做出错误的判断。如癌症的患病问题,从癌症,以确定接收到的X射线检查的概率更自然,因为采样更容易接受,但是如果实验任务是要求从接受X射线的人口以确定癌症的概率,这是自然采样方向相反的结果问题的错误表征。
(三)频率影响。同意与自然采样,Gigerenzer Hoffrage的看法的地步,但他们指的是“天然”是自然的方式处理概率的人,人们的信息获取环境信息通过事件的频率,而不是标准的概率(百分比),虽然这两种类型的信息具有相同形式的含义,但人们将有不同的精神表示不同形式的外部信息。从进化的角度来看,人类随着科技发展不断演变概率推理的认知算法规则,虽然有时不符合标准的概率信息处理,却很适合处理自然数表示的频率信息。早期人类进化的频率,事件编码的频率几乎是自动的,标准的概率难于编码。因此,他们预测概率频率标准形式的问题陈述时,直观推理的条件概率将显著提高,并支持他们的实验。
(四)来样加工理论。菲德勒认为,最根本影响概率判断采样的方向,还是概率信息的形式,但不同的样品中,提取的数据需要从不同的认知加工。概率判断的认知加工分为两个过程,总结的过程中,根据他们的经验,使用概率,如旅游区域概率的估计,由于许多主观和客观条件的限制,会存在着大小各异的差距,所以,要做出正确的判断,在采样过程中,我们必须调整,这是一个认知控制过程中,通过该样本来调整不同来源的信息,实现最终概率,这就需要利用潜在的大量的规则为基础,综合运用,比如注重逻辑规则的运用,注重统计学知识与实践的结合。
随着认知水平的不断提高,贝叶斯推理在广泛的研究以来,有许多新的理论和研究方法不断被提出和证实,这些都丰富了统计推理的理论体系问题。同时,这些研究也不断证明了人们在统计估计中常见的认知错误,也为人们进行贝叶斯推理研究提供了以下启示:首先,重点要注意所统计事件的基础概率,因为基础概率小的事件,即使在研究中某种击中率较高,但总概率仍然是较小的。其次,应该对所收集掌握的信息外部表征作理性的分析,不应受经验错误或者事物表面特征所迷惑,误导判断的准确性。比如所选中时间击中率的高,但是不能表明该事件出现的就一定高,因为还受其他主客观因素影响。第三,经验策略有合理性但不能过分相信。经验策略虽然有时可以再选择样本时能减少人们的工作量,同时并能在提供一些正确的概率估计样本数据,但在大多数情况下经验策略导致我们的判断失误。当然,贝叶斯推理问题仍然值得做更进一步的研究,如人们对概率信息的内部加工过程及其特点,对基础概率、击中率或误报率的敏感或忽略及其所依存的条件以及研究方法和手段的改进等。要注重联系的观点和发展的观点的结合运用,以实践为基础,将理论与实践相结合。
(作者单位:濮阳市华龙区统计局)
基于贝叶斯理论的刀具维修决策模型 第3篇
关键词:维修决策,刀具,贝叶斯理论
0 引言
随着生产技术的高速发展, 电力和机械等行业的设备日趋大型化和精密化, 设备的正确维修对企业的安全和经济生产都具有重要意义。设备工作性能的好坏、效率的高低都与维修有关, 对故障原因症候诊断的正确处理以及维修方式的运用, 这些都需要维修计划的指导[1]。维修策略的选择与时机的确定成为研究者们关注的热点问题。
近年来, 国内外许多学者对维修决策进行了研究, 提出了各种决策模型。Murray A和Ko T J等人利用神经网络或自回归时序等模型对磨损量进行计算或监测[2~4], CAO X和陈保家等人利用比例危险模型或Logistic回归模型预测刀具有效剩余寿命[5,6]。周奇才等人提出了基于风险的维修决策, 对堆垛机的风险进行定量分析并利用风险为决策目标建立维修策略以降低堆垛机的运行风险[7]。程志君等人针对部件间存在经济相关性的复杂系统, 提出一类基于机会策略的视情维修优化模型, 解决系统层事后维修与视情维修的综合优化问题[8]。王进才等人运用马尔可夫决策模型, 提出了以费用效果为指标的维修策略[9]。罗运虎等提出基于风险的用户可靠性需求决策模型, 得到了用户可靠性需求的最优值[10]。此外, 林月平等人将最短路径算法应用在工程装备应急维修决策中, 提高了维修保障效率[11]。刘晓平等人将进化蒙特卡洛方法引入机械故障诊断的特征选择, 提高机械故障诊断精度和诊断效率[12,13]。还有一些学者开发了关于维修决策的软件支持系统, 李敏等人引入了基于状态的维修, 设计并开发了自行火炮状态维修决策支持系统 (CBMDSS) [14];吴军等人提出基于隐马尔科夫链模型的数控装备可靠性预测方法, 在此基础上, 开发了数控装备可靠性预测原型软件系统, 该系统对于提高数控装备利用率、减少数控装备维修费用以及延长数控装备使用寿命等具有重要的意义[15]。
在维修实际中, 由于设备自身特性以及实际运行条件等各种原因, 设备状态劣化的发展过程通常不是严格按照统计出来的性能曲线的过程发展, 而是劣化程度存在偏差的情况[16~18]。针对这一问题, 本文根据修正的思想将先验概率加以修正, 建立基于贝叶斯理论的维修决策模型, 以实现基于设备实际状态的维修决策。
1 基于贝叶斯理论的维修决策模型
基于贝叶斯理论的维修决策模型, 从刀具个体差异性角度出发, 根据贝叶斯理论得到刀具当前状态的后验分布, 然后再结合性能曲线确定刀具未来某一时刻状态, 得到不同时刻点的维修成本, 最后根据基于维修成本最小化的原则确定最优的维修方案。
1) 状态向量A
状态向量指设备的全部可能状态的集合。一般, 设备状态可分为正常、不正常和故障三种状态。由于设备处于故障状态时必须进行维修, 而本文讨论的主题是选择最佳设备维修时机, 因此, 故障状态不需要考虑, 设备状态只需考虑正常和不正常即可。设设备状态向量A为:
根据产品质量, 产品状态分为合格和不合格, 因此, 定义产品状态向量C为:
2) 先验概率和后验概率
先验概率指根据以往经验和分析得到的概率。设备性能曲线通常由历史统计数据分析得到, 如图1所示, 反映了设备正常/异常概率与工作时间的关系。因此, 设备状态的先验概率可以由性能曲线获得, 根据设备运行时间t即可在性能曲线上得到设备正常的先验概率Pt1 (A1) 以及设备不正常的先验概率Pt1 (A2) 。
后验概率指利用新的信息修正先验概率后获得的更接近实际情况的概率估计, 表示为Pt1 (A2|B) , 其中, B为抽样事件:在t1时刻, 在设备加工后的产品中抽取m件产品, 有n件不合格, 其余合格。本文将利用贝叶斯理论来计算后验概率。
根据贝叶斯理论, 设有构成事件完备组的2个事件Ai (i=1, 2) , t1时刻各事件发生的概率分别为Pt1 (Ai) , 独立事件B发生的概率为P (B) 。假设事件B在事件Ai条件下发生的概率为Pt1 (B|Ai) , 则t1时刻事件Ai在事件B条件下发生的概率为:
公式 (3) 中, Pt1 (Ai|B) 为t1时刻事件Ai的后验概率, Pt1 (Ai) 为t1时刻事件Ai的先验概率, B为观测样本事件。
根据条件概率公式可以得到:
式 (4) 、 (5) 中m, n分别为抽样总数和抽样次品数, 将式 (4) 、 (5) 代入公式 (3) 中, 得到t1时刻设备状态为正常、异常的后验概率Pt1 (Ai|B) (i=1, 2) 为:
后验概率Pt1 (Ai|B) 是在设备统计概率Pt1 (Ai) 基础上修正得到, 通过对设备设置抽样事件增加信息量, 克服了统计概率不针对个体的缺点, 得到更加符合设备自身实际的概率分布。后验概率的引入, 为更准确地评价设备所处状态提供了一个途径, 也为正确选择维修决策提供了基础, 是一种简单的基于状态的维修策略。
根据后验概率Pt 1 (A2|B) 在性能曲线中得到相应的运行时间t1’, 即性能曲线上t1’时刻概率Pt1’ (A2) =Pt1 (A2|B) , 记Pt1’ (A2) 为考虑设备实际运行状态后t1时刻对应的当量概率, 则有Pt1’ (A2) =Pt1’ (A2) =Pt1 (A2|B) , 反映了设备的实际劣化状态。修正后的概率才是设备实际的故障概率。应当是根据修正后的概率, 找到一个对应的时间点 (当量时间) , 就相当于设备已经运行了更长的时间, 所以才有更高的故障率。从时间上说, 由于设备加剧了劣化, 所以更接近于失效, 寿命变短, 不能运行到预期的时间点。当然, 如果设备保养得好, 也有可能是修正后的概率更低, 那就意味着设备可以使用更长的时间。
设下一维修时刻为t2时刻, 由当前修正后的点t1’时刻容易得到下一维修时刻t2时刻, 并在性能曲线中得到t2时刻对应的设备状态异常的概率Pt2 (A2) , 如图1所示。继而得到t2时刻设备状态正常概率Pt2 (A1) =1-Pt2 (A2) 。
3) 概率矩阵P
把某一时刻设备各状态的概率组成一个矩阵, 称为该时刻的概率矩阵P。设t1时刻的概率矩阵为P1, t2时刻的概率矩阵为P2, 则有:
4) 维修决策向量Q
维修决策向量指设备全部可能维修方案的集合, 设维修方案包括立即维修和暂不维修。则维修决策向量Q为:
5) 约束条件
当设备运行时间超过最大允许运行时间或抽样事件次品率超过允许值时, 均需立即维修。为了保证设备安全性, 设约束条件:
公式 (10) 中, t为设备运行时间, tmax为设备最大允许运行时间, p (B) 为抽样次品率, p (B) max为抽样允许最大次品率。
6) 维修成本矩阵F
维修过程中可能存在零件更换、生产产品质量、设备停机和人力资源等方面的损耗, 同时零件的使用寿命也影响着维修的总成本, 当零件使用时间超过其设定寿命时, 超出的使用时间会减少厂家对零件的投资成本, 本文把因为零件使用寿命延长所减少的投资称为节省投资成本;当零件超出其寿命时, 节省投资成本为正值, 反之为负值。因此, 本文所讨论的维修过程中的成本包括次品成本、零件成本、停机成本、人工成本和节省投资成本。在给定设备状态下, 不同的决策行为会有不同的维修成本。将不同设备状态、决策行为下, 各维修成本的数值表示成一个矩阵, 称为维修成本矩阵, 记为F。因此, 采取qi (i=1, 2) 维修决策时的维修成本矩阵Fi为:
公式 (11) 中各元素分别表示采用决策qi时的各维修要素。ui11、ui12分别是设备状态为正常 (A1) 、不正常 (A2) 时的次品成本;ui21、ui22分别是设备状态为正常 (A1) 、不正常 (A2) 时的零件成本;ui31、ui32分别是设备状态为正常 (A1) 、不正常 (A2) 时的停机成本;ui41、ui42分别是设备状态为正常 (A1) 、不正常 (A2) 时的人工成本;ui51、ui52分别是设备状态为正常 (A1) 、不正常 (A2) 时的节省投资成本。
7) 维修总成本U
维修总成本是各维修决策方案所产生的维修成本。维修总成本矩阵可表示为:
公式 (12) 中, u1i, u2i, u3i, u4i, u5i分别为qi决策时考虑设备状态后得到的次品成本、零件成本、停机成本、人工成本和节省投资成本。因为节省投资成本对维修是有利的, 减少了维修总成本, 所以有qi决策时维修总成本Ui为:
根据最小维修成本的原则, 得到基于贝叶斯理论维修决策模型的最优决策qmax为:
若U1
2 加工中心刀具维修时机决策
刀具是加工中心的重要部件, 刀具状态的好坏直接影响着工件的加工质量。因此, 刀具的合理更换是生产质量和经济性的重要保证。已知厂家提供的刀具性能曲线如图2所示, 刀具平均寿命为加工工件950件, 刀具已经加工工件数为800件, 在刀具加工的产品中, 抽取300件产品, 有1件不合格, 其余合格。
工厂历史运行数据表明, 刀具状态正常时产品合格率为99.9%, 刀具状态不正常时产品合格率为99%。厂家规定:产品抽样不合格率不得高于1%, 刀具加工工件数不得超过1200件。以一天为时间段, 刀具状态为正常、不正常时产生的次品数分别为1件和5件, 一件次品损失500元, 停机时间一小时损失30000元, 因为刀具原因而停机后维修时间一般为0.5小时, 即每次停机损失为15000元, 刀具寿命延长一天节省的投资成本为1000元。刀具维修过程中, 维修类型分为预防性维修和故障维修。当设备状态正常时, 实施预防性维修;当设备状态不正常时, 实施故障维修。当前时刻 (t1时刻) 和下一时刻 (t2时刻) 的维修成本如表1、表2所示。
在图2中, 横坐标为刀具已加工工件数, 纵坐标为刀具失效率。由刀具加工工件数为800, 可知其先验失效率为0.007, 即刀具先验概率分布为:
由已知条件可知, 当设备状态为正常或不正常时, 产品合格率分别为:
将上述先验概率与条件概率的数据带入公式 (6) 和公式 (7) , 得到此时刀具状态的后验概率为:
通过图2和Pt1’ (A2) , 得到修正后的当量工件数为680件, 按每天加工100件工件, 往后推一天得到第二天t2时刻加工工件数为780, 由图2可知t2时刻刀具状态分布为:
得到t1时刻和t2时刻概率矩阵分别为:
因t1时刻和t2时刻刀具均未超出平均寿命, 其节省投资成本分别为:
采用决策q1即立即维修时, 维修类型为预防性维修, 记此时维修成本矩阵为F1;采用决策q2即暂不维修时, 维修类型为预防性维修或故障维修, 记此时维修成本矩阵为F2, 有:
得到:
因为U1>U2, 所以最优决策为q2:暂不维修。
曲线中t2时刻异常概率Pt2 (A2) 可以作为t2时刻的先验概率, 在t2时刻时, 同样可以采用抽样事件增加信息量, 得到t2时刻的后验概率, 不断修正刀具所处状态, 使其更真实地反映劣化状态, 并在此基础上得到t2时刻的最优维修决策, 如此反复, 依次得到下一时刻点的最优维修决策。
3 结束语
贝叶斯理论 第4篇
摘要:以西安市城市居民出行方式为研究对象,收集西安市部分区域城市居民出行的调查数据。利用获得的调查数据,综合运用相关性分析方法和K2算法进行贝叶斯网络的结构学习;应用贝叶斯参数估计方法进行贝叶斯网络的参数学习,建立了应用于西安城市居民出行方式分析的贝叶斯网络。应用所建网络分析了是否有私家车、居民性别、居民年龄和出行目的对西安城市居民出行方式的影响。研究结果表明,基于贝叶斯网络建立的西安城市居民出行方式分析模型预测精度较高,具有较高的实用价值。
关键词:交通需求管理;出行方式;贝叶斯网络;城市居民
中图分类号:TP391 文献标识码:A
1引言
随着经济的快速发展和城市规模的不断扩大,城市居民的出行需求迅速增长,但由于交通设施不足,道路通行能力提高有限,再加之机动车保有量的迅速增加,使得城市居民出行困难。公共交通是目前城市居民出行的主要方式,由于城市居民出行需求的多样性,公共交通不能完全满足城市居民的出行需求。同时由于城市居民出行方式的多样性,各种方式都有其自身的优势,因此如何使各种出行方式相互协调、合理匹配、发挥其优势,对解决城市居民出行困难、优化城市交通结构有重要的意义。
由于城市居民出行方式的复杂性,各变量之间存在大量的依赖和关联关系,因此如何建立合理的模型对其相互关联进行研究是该领域研究的热点。对城市居民出行方式研究最初采用集计方法,该方法只能表现整体的出行方式选择特性,不能表示单个出行者的出行方式,所以国内外学者开始进行非集计模型研究。McFadden在Luce和Marschak研究的基础上,对非集计模型中的典型模型Logit模型进行系统研究,建立了非集计模型的理论体系。Daniel Mefadden将效用表示为出行者出行选择因素的函数,建立了MNL模型。DanielMefadden对MNL模型不断优化,提出了混合Logit模型,该模型对出行者选择出行方式的偏好表示的更清楚。鲜于建川等选择家庭属性、出行者属性,活动一出行属性,构造了通勤出行方式选择和出行链模式安排及其相互作用的贝叶斯模型,利用敏感性分析了在出行者及其家庭的社会经济属性、活动和出行属性影响下的出行方式。唐洁等提取相关变量,利用STATA9软件分析得出家庭收入、家庭拥有车辆情况、驾照、是否高峰时段、月票、性别及退休人数与居民出行有关。本文在借鉴相关参考文献研究成果的基础上,建立城市居民出行方式分析的贝叶斯网络模型,以此模型研究西安城市居民的出行方式。
2贝叶斯网络建模方法
2.1贝叶斯网路
贝叶斯网络是基于概率推理的以贝叶斯公式为基础的图形化网络,是为了解决不定性和不完整性问题而提出的,对于解决复杂变量问不确定性和关联性问题有很大的优势,在多个领域中获得广泛应用。贝叶斯网络的构建通过贝叶斯学习实现,贝叶斯网络学习就是寻找一个能最好匹配一个给定数据训练集网络的过程。这个网络包含一个有向无环图结构和与有向无环图中每个节点相关的条件概率表,具体包括结构学习和参数学习两个步骤。结构学习是确定各个节点问的链接关系,得到贝叶斯网络结构;参数学习是确定贝叶斯网络结构中的各个节点之问的概率分布。
2.2贝叶斯网络结构学习方法
贝叶斯网络的结构学习过程是结合包含专家知识在内的先验信息,寻找与样本数据集拟合最好的网络结构。贝叶斯网络的结构学习方法可以分成三大类:基于评分搜索的方法、基于依赖分析的方法和混合方法。基于评分搜索的方法将贝叶斯网络看成是表示变量之间联合概率分布的拓扑结构,学习的目的是得到评分最优的网络结构,该方法一般首先选择网络结构的评分函数,然后通过搜索算法寻找评分最优的网络结构。基于依赖分析的结构学习方法把贝叶斯网络结构看作是编码了变量之间条件独立关系的结构,通过学习变量之间独立性关系来确定网络结构。混合方法一般先采用基于依赖分析的方法获得节点序或缩减搜索空间,然后采用基于评分搜索的方法进行贝叶斯网络的结构学习。
评分搜索法应用较多,在定义了评分函数的情况下,贝叶斯网络的学习问题就变成了一个搜索问题,通过搜索算法寻找具有最佳评分的网络结构。常用的搜索算法有K2算法,爬山法、模拟退火算法、演化算法以及抽样算法。本文采用K2算法,该算法的基本思想是:从一个空网络开始,根据事先确定的节点次序,选择使后验结构概率最大的节点作为该节点的父节点,依次遍历完所有的节点,逐步为每一个变量添加最佳父节点。在结构学习中,结构学习方法、数据等因素使学习的结果具有较大的随机性,需要经过多次实验才可能得到满意的结果。为了提高效率,贝叶斯网络的结构学习不基于实际数据,而是根据专家意见或经验确定网络结构,这样必然受主观影响,同时模型不依赖数据,模型的可移植性差。因此,为了提高网络结构的可移植性和效率,本文采用相关分析和K2算法相结合的方法。具体过程为:先进行各因素问的相关性分析,将各变量之问的相关性按大小排序,去掉与待分析变量相关性较弱的变量;再利用K2算法进行网络结构学习,不断调整变量顺序,最终确定合理的网络结构。
2.3贝叶斯网络参数学习方法
贝叶斯网络参数学习是学习变量相对于其父节点集的概率依赖程度,进而获得局部的条件概率分布函数。贝叶斯网络参数学习的基本步骤是先选择网络参数θ的先验分布p(θ),再根据贝叶斯公式(式1)计算参数的后验分布,做出对未知参数的推断。
贝叶斯网络参数学习需要综合先验信息和样本信息,通常没有先验知识来确定先验分布,针对该问题Raiffa等学者提出了选取Dirichlet分布的先验分布方法。假定参数θ的先验分布p(θ/G)为Dirichlet分布。
2.4模型有效性验证
通过结构学习和参数学习建立了贝叶斯网络模型,为了验证模型的有效性,本文从模型结果与试验数据对比和模型预测命中率两方面验证所建立网络模型的有效性。模型预测命中率计算方法如下:
记第k条数据中发生第i种出行类型的预测概率为pik,dk=i;当pik是遍历i时的最大值时,即δk=i,认为此次命中,否则未命中。记sk=
3西安城市居民出行方式分析的贝叶斯网络建模
3.1建模数据
本研究的数据来源于陕西省科学基金资助课题“西安市城市居民出行方式选择模糊推理研究”。在工作日和周末分别针对西安市不同的人群进行调查,地址选择在城区及近郊内的停车厂、周边小区、公共车站、大型娱乐场所、高校周边。调查方式采用问卷调查和与出行者面对面询问的方式。调查内容主要包括出行目的、年龄、性别、学历、收入、心情、是否有私家车、支付方式、出行时间等,调查者并记录当天天气情况。共计1647个有效样本。为了满足建模要求,将属性变量编码为虚拟变量,将连续变量编码为离散变量,结合相关标准和建模经验,出行方式分析的各变量设置见表1。
3.2结构学习
本研究先利用相关分析法,找出各变量之间相关性较大者,然后运用基于K2算法的结构学习方法进行西安市城市居民出行方式分析的贝叶斯网络结构学习。
3.2.1相关分析
将出行方式和出行时段作为决策变量,研究各调查变量与这两个变量之间的关系。出行方式和出行时段与各变量之问的相关分析结果见表2。
根据相关性大小,筛选出出行目的、是否有私家车、出行天气、收入、支付方式、年龄、学历、出行心情、性别、出行时段、出行方式,共计11个变量进行结构学习。
3.2.2基于K2算法的结构学习
应用Matlab工具的Full-BNF工具箱采用K2算法,进行结构学习,经过多次的变量筛选和排序调整,最终获得包括8个节点和若干联系的贝叶斯网络结构,具体结构如图1所示。网络结构图中的8个节点代表8个变量,其中包括出行时段、出行方式2个需要分析的变量。节点之问的连线表示变量之间的相互影响关系。
图1中1为支付方式,2为是否有私家车,3为天气,4为年龄,5为出行目的,6为收入,7为出行时段,8为出行方式。
3.3参数学习和模型验证
应用贝叶斯方法和Matlab的Full-BNT工具箱对建立的如图1所示的贝叶斯网络进行参数学习,在学习中将各节点的先验分布取作Dirichlet分布。在各因素的影响下,西安城市居民出行方式和出行时段2个变量的参数学习结果如下:
3.3.1出行方式参数学习结果
从图1所示的贝叶斯网络结构图可知,出行方式的父节点是出行时段,出行时段决定出行方式,即出行时段是出行方式的直接影响因素。出行方式为1(乘小汽车)、出行方式2(乘公交车)、出行方式3(乘自行车)和出行方式4(步行)的概率见表3。表3同时也给出了居民出行方式的参数学习结果和测试数据的对比情况。
分析表3中的数据可知,西安城市居民选择公交车出行方式的最高,尤其是在早高峰和晚高峰时段选择公交车出行的最高。在早高峰和晚高峰时段居民选择自行车的出行的比例也较高。在中间时段,居民选择小汽车出行、自行车出行和步行出行的比例相当。
3.3.2出行时段参数学习
从图1所示的贝叶斯网络结构图中可知,出行时段的父节点是出行目的,居民的收入和出行当天的天气。因此,西安城市居民出行目的、居民收入情况和出行当天天气与出行时段的参数学习结果和与测试数据的对比见表4。
分析表4的数据可知,西安城市居民的刚性出行主要集中在早高峰和晚高峰时段。居民的弹性出行主要集中在中间时段和早高峰前和晚高峰后,而且晚高峰后的比例更大。收入情况对居民在早高峰和晚高峰时段的刚性出行的影响不明显,但对弹性出行的影响较大。天气情况对居民早高峰和晚高峰时段的出行影响不大,但对其他时段的出行影响较大。
3.3.3模型检验
以上建立了西安城市居民出行方式分析的贝叶斯网络,并对模型的参数学习结果进行验证和对比。以下对建立的模型进行检验,以证明本文所建立的模型的有效性。对西安城市居民出行时段和出行方式两个参量的预测结果的误差值和命中率见表5。
从表5可以看出,出行时段预测模型和出行方式预测模型的预测精度都较高,出行方式预测模型的预测精度比出行时段预测模型的预测精度稍高,出行时段预测模型预测精度稍低的原因会是出行时段早高峰和晚高峰时段的精确划分较困难,同时中间时段和早高峰和晚高峰的界限也较难划分。
4模型应用
利用所建立的贝叶斯网络结构模型,计算西安城市居民是否有私家车、居民性别、居民年龄和出行目的对出行方式和出行时段的影响情况,具体计算结果见表6-表9。
从表6的计算结果可以看出有私家车和无私家车的居民选择在早高峰和晚高峰出行的比例相当。有私家车的居民选择在其他时段出行的比例大于无私家车的居民。
在出行方式方面有私家车的居民主要选择自驾车出行,无私家车的居民主要选择乘公交车出行;无私家车的居民选择自行车和步行出行的比例相当;有私家车的居民选择乘公交车出行的比例也较大。
从以上分析可知公交车出行还是西安城市居民出行的主要方式。
从表7的计算结果可以看出男性和女性居民选择不同出行时段的比例相当,早高峰和晚高峰仍是西安城市居民的主要出行时段。
在出行方式选择方面,男、女居民的比例也相当,区别是男性居民选择小汽车和公交车出行的比例略大于女性居民;男性居民选择自行车出行的比例小于女性居民,选择步行的比例高于女性居民。
从表8的计算结果可以看出大于30岁和小于30岁的居民在早高峰和晚高峰出行的比例都较高,其他时段出行的比例相对较小;大于30岁的居民晚高峰出行比例高于早高峰,小于30岁的居民早高峰的出行比例高于晚高峰。
大于30岁的居民和小于30岁的居民选择公交车出行的比例相当且比其他出行方式高,这说明公交车是西安城市居民出行的主要方式。大于30岁的居民选择小汽车出行的比例高于小于30岁的居民。
可以得到,西安年轻居民主要选择公交车和自行车出行,中年以上居民主要选择公交车出行和步行。
从表9的计算结果可以看出居民刚性出行主要集中在早高峰和晚高峰,弹性出行主要集中在晚高峰和其他时段。西安城市居民刚性和弹性出行的方式主要是小汽车和公交车,但弹性出行选择小汽车的比例高于刚性出行。
5结束语
由同一性理论对贝叶斯公式的新认识 第5篇
依仗着充要性, 人们可以完全正确去推断任何原因或是结果, 当有一个时间被观察到之后, 我们可以有十足把握地去推断它的原因以及它所能导致的后果。但是现实中, 事件之间并不总是保持着充分性与必要性, 相反, 可能性充斥于每个角落。
一个事件的原因可能是有多个的, 同样的, 一个事件的结果也可能是有多个的。这样一个概念是完全符合现实的, 这样一来, 我们就不能再依仗着充要性去推断任何事情, 我们需要把所有的可能性都考虑进来, 摒弃那些信任确定性的思想, 进而以不确定性的视角是审视世界, 这样我们才能避免先入为主的错误。
如果我看到一个人总是做一些好事, 则那个人多半会是一个好人。这就是说, 当我不能准确知悉一个事物的本质时, 你可以依靠与事物特定本质相关的事件出现的多少去判断其本质属性的概率。用数学语言表达就是:支持某项属性的事件发生得愈多, 则该属性成立的可能性就愈大。
1763年, 贝叶斯将这种思想以数学的形式表达出来, 并把它作为一般的推理形式提出。如下是贝叶斯公式:
通过运用贝叶斯公式, 我们可以通过可被观察的事件去推导那些未知但是却很重要的原因。比如某地区有三家工厂生产某种产品, 已知三家工厂各自的市场占有率, 以及工厂各自的次品率, 我们便可以通过贝叶斯公式知道从任意抽取的一个次品最有可能来自哪个工厂。
但是我认为贝叶斯公式有两个隐含的前提假定, 如果违反了这两个假定, 那么对贝叶斯公式的使用将失效。
首先, 在贝叶斯公式中我们可以看出该公式是基于全概率公式的而在全概率公式中, 我们必须必须知道各个先验概率即, 也就是所观测事件的原因的发生概率。并且, 我们还需知道在各个Ai发生的情况下, B事件所发生的概率, 也即条件概率P (B|Ai) 的大小。那么第一个假定就是, 人们可以得到先验概率以及原因与结果直接的确切关系。如上述的例子中, 各个工厂的市场占有率是一组较好求得的数字, 这组数字即是先验概率P (Ai) , 但是当所讨论的范围很大时, P (Ai) 的确定将会变得困难, 比如我们在讨论的不是一个城市的市场, 而是全球的市场, 那么对每个公司的市场占有率的确定将会变得复杂。更进一步的是, 对条件概率P (B|Ai) 的确定比对先验概率P (Ai) 的确定更为困难。在我看来条件概率P (B|Ai) 所描绘的是原因与结果之间的关系, 是说一个原因在多大的可能性上会导致一个结果。如上例中每个工厂各自的次品率就是一个条件概率在现实生活中, 条件概率通常是未知的, 人们只有通过统计推断的方式才能得到这一概率, 统计推断中的置信度1-α描绘了推断正确的可能性, 当α=0.05时, 我们可以说对条件概率P (B|Ai) 的估计仍有5%错误的可能性, 所以建立在不确定的条件概率P (B|Ai) 之上的贝叶斯公式也将变得不确定, 而有可能是不成立的。
贝叶斯公式的另一条假定是, 前定事件是不会改变的, 也即是在对事件B观测的前后, 公式中的完备事件组是确定的、唯一的、不变的, 更简明的说就是, 先验概率P (Ai) 始终是不变的。但是现代物理学发现在微观世界中主观与客观并非是相互独立的。
在电子的双缝实验中, 当没有观测者的情况下, 电子以波的形式穿过双缝, 并产生衍射现象, 而当被观测时, 电子又以粒子的形式穿过双缝而不产生衍射, 由此量子物理学家得出一个有悖与人类惯有逻辑的结论, 即一个事件过程, 在有观测者与无观测者两种情况下是不一致的。也就是说, 先验概率P (Ai) 的确存在, 但是在人们观察B的前后, 先验概率P (Ai) 是不同的, 人们的主观行为改变了客观世界的存在方式, 仿佛主观和客观并非是分割的, 而是同一的。
第二个假定的缺陷显然要比第一个更为要命, 因为只要统计技术足够先进, 统计的准确率足够精确, 那么我们还是可以确定一个差不多正确的条件概率P (B|Ai) , 由此对贝叶斯公式的使用也是无误的。但是第二个问题已经涉及了哲学领域, 即同一性问题, 同一性理论主张主观精神事件和物理事件是相同的, 它们只是大脑神经过程的不同方面而已。也即是说, 运用贝叶斯公式时, 在得到条件概率P (B|Ai) 的前后时期P (P (B|Ai) P (Ak|B) 是变化了的, 主观的行为改变了客观规律性。对于哲学问题, 我们不能像对待科学问题那样通过数学语言予以解决而只能通过不断地反思与思辨去寻找答案, 并且有可能人们根本无法找到这种问题的答案。
参考文献
贝叶斯理论 第6篇
一、云南与东盟国家贸易现状
云南与东盟国家的贸易往来历史悠久,云南与东盟建立了密切的经贸关系,近几年,这种关系得到了快速的发展。据昆明海关统计,2006年云南省与东盟贸易总额达到21.7亿美元,与2005年全年相比,净增6.3亿美元,增幅高达40.6%,占2006年云南省全年外贸总额的比率高达34.8%,东盟自贸区已成为了云南省对外贸易增长最快、活力最强的重要市场。2006年,云南对外工程承包营业额达43130万美元,在全国排第13位,在沿边9省区排第2位;境外实际投资达4364万美元, 在全国排第12位,在西部省区排第1位。目前,东盟已成为云南的第一经贸合作伙伴。2002年11月4日,中国与东盟10国签署了《中国与东盟全面经济合作框架协议》,决定到2010年建成中国东盟自由贸易区,这标志着中国与东盟的经贸合作关系进入了新的历史阶段。云南企业应该紧紧抓住这个战略机遇,大踏步地走进东盟市场。
云南企业走进东盟市场,参与国际竞争的优势在于:一是云南周边三国缅甸、老挝、越南和澜沧江湄公河流域的泰国成为云南企业的主要市场。二是云南与东盟贸易进出口商品互补性较强。在云南,除少数农副产品属品种调剂外,出口商品95%以上是工业品,进口商品95%以上是林、矿、水、畜、农等资源性产品。这种互有需求的互补性贸易成为持久推动对东盟贸易的重要动力。云南出口东盟的商品主要有化工、机电、纺织、烤烟、建材、卷烟、磷化工等商品。三是多元贸易格局初步形成。云南对东盟贸易已基本形成边境贸易、一般贸易、经济技术合作、出口信贷、易货贸易互为补充的经贸格局。云南已发展到对越、老、缅、泰、柬、马六国均有经济技术合作。易货贸易的开展解决了周边国家外汇储备短缺的问题,为开拓周边市场,降低企业出口成本发挥了十分明显的作用。加强农业技术合作、开展境外替代种植进展良好。2001年年底,云南共帮助境外实施替代种植面积达44.5万亩,其中老挝7.4万亩,缅甸37万亩,品种有天然橡胶、粮、油作物、甘蔗、水果、茶叶等。其他如外资企业自营出口,边民互市等也成为实施大经贸的有力补充。一些有实力的公司如云锡公司、五矿贸易、昆钢集团、冶金集团等也已进入边贸领域,实现了真正意义上的大企业与边贸结合。
二、云南企业进入东盟市场中信息的价值
信息是对客观世界中各种事物的变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。在信息时代的今天,知识已成为重要的生产力,信息成为社会所拥有的首要资源。信息在企业竞争中发挥着越来越大的作用,具体来讲具有三方面作用:一是企业家在获取利润的基本过程中实施的每一步计划或决策,都需要根据新的信息做出相应调整,以增加企业竞争力。二是企业家可以借助信息交流,甚至通过出售有关市场行情的经济信息影响市场的运行状况,以达到其利润最大化的目的。三是作为信息系统的广告活动有其经济意义。信息具有及时性、新颖性、准确性、相关性和完整性的特征。
随着云南与东盟各国合作的进一步推进,企业将越来越多地进入东盟市场,在面对着一个相对陌生的市场的情况下,东道国市场信息的准确把握对企业进入该国市场来说是至关重要的,信息资料的完整性与准确性决定着跨国经营决策的准确性与可靠性。信息作为一种在代理人活动过程中产生的特殊商品,也具有价值和使用价值。信息的价值具有减少企业决策不确定的效用。如何评估信息的价值?比较典型的方法是在贝叶斯法则的框架下进行讨论,结果显示获取新的市场信息与不获取新的市场信息的两种情况下,企业的预期利润是不同的。
贝叶斯决策的理论基础是贝叶斯概率公式,贝叶斯公式用事件形式表达如下:设有n个事件Ai (i=1, 2,,n),它们组成事件完备组,而另有事件B,它只能与任一Ai发生时同时发生。设已知Ai发生的概率为P (Ai) ,事件B在Ai发生条件下出现的概率为P (B/Ai) ,
则:
企业决策者在利用贝叶斯决策法进行决策时,一般按以下3个步骤进行: (1) 决策者利用已掌握的信息和经验,估计出未来各种情况出现的概率,并可通过以上建立的决策模型计算出各状态下的损益值。这一阶段是在进一步调查研究以获取更多信息之前进行的, 故叫先验分析。 (2) 经过先验分析后,当决策十分重要且时间允许时,为使决策更加可靠,决策者常需考虑是否要收集追加的信息,并且为获得这些追加的信息付出代价,而这些信息也不可能完全准确,因此,必须分析收集追加信息究竟有多大价值。 (3) 如果收集的信息将会带来更大的收益,决策者会决定去做。当经过调查获得了更多的信息后,利用这些信息通过贝叶斯公式就可对先验阶段的各种估计进行修正,使得这种估计更加可靠,从而降低决策的风险性。
现假设一家云南企业准备进入一个东盟市场,企业根据以往跨国经营的经验,预测估计进入该市场成功的概率为0.60,经过计算,预计成功进入后能给企业带来500万元的利润;进入该市场失败的概率为0.40,企业将损失100万元。为了使市场进入更加可靠,企业也可以委托一家国际咨询公司专门对东道国市场做出调查和预测,但需付信息咨询费15万元。经过预测,咨询公司认为这家云南企业市场进入成功的概率为0.70,且保证预测的准确性在0.90以上。现在通过贝叶斯概率公式计算,可以看出获取市场信息与不获取市场信息的两种情况下,企业的预期利润是不同的。
根据贝叶斯概率公式,可以由预测得到的概率,推测出实际可能的概率。由决策树图可以更加容易地进行分析,如下图所示:
根据上图计算和分析结果,可以清楚地看出,由于该企业委托国际咨询公司专门进行东盟市场进入的调查预测,取得了较为可靠的信息资料来辅助决策,可使企业收益期望值提高到319万元,扣除信息咨询费15万元,净收益值也可以达到304万元,比根据企业自身预测得到的收益期望值260万元可以净增44万元。委托咨询公司预测得到的收益期望值与企业自身预测的收益期望值之差,即319万元-260万元=59万元,构成了信息的价值,15万元咨询费为信息的代价,信息的价值与信息代价之间的差额,59万元-15万元=44万元则是信息的净值。信息的净值越大,获取这一信息的意义也就越大。
由于决策者的主观概率并不是完全不可信的,而任何调查分析的结果也不是完全准确的,贝叶斯决策法巧妙的将这两种信息有机地结合起来,体现出信息的价值,往往能得出较为准确的结论,并为企业准确决策奠定坚实的基础。所以,在云南企业进入东盟市场时,企业决策者应高瞻远瞩,充分利用一切可能获得的信息资料,充分体现信息的价值,为企业做出科学决策,才可能在激烈的国外市场竞争中获得竞争优势。
参考文献
[1]李平, 黄科.云南参与大湄公河次区域合作现状及对策[J].科技合作交流, 2004, (4) :28.
贝叶斯理论 第7篇
关键词:贝叶斯推理理论,瓶颈,漂移,滚动窗
0 引言
任何事物都存在约束其发展的瓶颈资源。约束理论(Theory of constraints,TOC)[1]指出作业车间存在瓶颈设备,其生产能力限制着整个系统的产出;非瓶颈资源的利用程度不由其本身决定,而是由瓶颈资源决定;瓶颈资源上一个小时的损失是整个系统的一个小时的损失,而非瓶颈资源节省一个小时无法增加系统产销率。因此,瓶颈设备上生产任务及资源调配的优化程度直接决定着整个生产系统的优化性能,而瓶颈设备的正确识别是瓶颈优化的前提,对提升生产系统性能具有重要的工程意义。
现有的关于瓶颈识别的研究,主要集中于静态瓶颈的识别,识别方法包括最大设备负荷法[2]、缓冲池队列比较法[3,4]、最大活跃时间法[5,6]、约束松弛法[7]、正交试验法[8]、聚类分析法[9]等。这些瓶颈设备识别方法对于静态瓶颈设备的识别问题取得了一定的成效,然而文献[10]指出,作业车间存在工件随机达到、设备生产能力变化等动态事件,因此瓶颈设备会随作业环境的变化而漂移。
近年来,部分学者开始进行瓶颈设备漂移问题的研究。文献[8]研究了车间作业目标变更对瓶颈设备的影响;文献[11, 12]提出瓶颈程度和瓶颈指数的概念,通过度量制造单元生产能力、生产需求的比值确定瓶颈漂移的程度;文献[13]提出瓶颈应具有四种特性,据此来进行瞬态瓶颈的识别,通过瞬态瓶颈的变化描述瓶颈漂移。
以上学者已经开始了瓶颈漂移问题的研究,然而设备故障作为车间最常见的意外事件,轻则降低车间物流流通速率,重则引起制造单元加工过程的停滞,影响巨大。因此,针对设备故障引起瓶颈漂移的问题,需要进行早预测、早识别和早预防,保证生产计划、作业调度与生产准备随瓶颈变化而及时更新,提高车间运作效率。
本文将针对作业车间设备故障引起瓶颈漂移的问题进行深入研究。
1 基于贝叶斯理论的瓶颈漂移预测方法
贝叶斯推理理论[14]由英国数学家贝叶斯(Thomas Bayes 1702-1763)所发现,是在经典的统计归纳推理、估计和假设检验的基础上发展起来的一种推理方法,利用已有的主观判断和知识,通过客观的采样信息修改先验的概率分布,进行未知事件的统计推理决策。
对于作业车间静态瓶颈设备的识别问题,已有学者提出了很多有效的识别方法,本文在已有静态瓶颈识别的基础上,结合设备运行过程中的故障维修动态信息,利用贝叶斯推理理论对瓶颈设备先验信息进行更新,获取设备运行过程中各动态阶段的瓶颈概率,从而实现未来某时刻瓶颈设备的漂移预测。
1.1 瓶颈设备预测模型
假设作业 车间有m台设备 , Aj表示设备j(j=1,···,m)为瓶颈事件,Bj代表设备j发生故障事件,根据贝叶斯推理理论,建立瓶颈设备预测模型如下:
其中, P ( Bj/ A j)表示设备j发生故障的条件概率;P (B tj)表示设备j在运行时刻t发生故障的概率; P ( Atj)表示设备j在运行时刻t成为瓶颈的先验概率; P ( Atj/ B tj)表示设备j在运行时刻t成为瓶颈的后验分布概率。
公式(1)表示设备j为瓶颈时发生故障的条件概率,公式(2)表示在任意时刻t设备j为瓶颈的后验分布概率,公式(3)表示t时刻取后验瓶颈概率最大者对应的设备为瓶颈。
在上述瓶颈设备预测模型中,关键要进行t时刻各设备的先验瓶颈概率P ( Atj)、故障条件概率P ( Bj/ A j)及故障率P ( Btj) 的计算。
1.2 先验瓶颈概率计算
文献[8]提出了一种静态的基于正交试验的瓶颈设备识别方法,该方法根据正交表为每台设备分配不同的调度规则,以构造多次正交试验,通过分析正交试验结果获得作业车间在既定生产任务下的瓶颈设备。
本文在正交试验瓶颈识别法的基础上,在分析正交试验结果过程中,提出极差转化法获得各设备成为瓶颈的概率,并作为作业车间瓶颈预测的初始先验瓶颈概率。具体为:将生产系统的所有机器对应为正交试验的各个因素;将各机器所采用的多种调度规则对应为正交试验各因素的水平;各因素采用相应的调度规则后得到的作业目标值对应为正交试验的试验指标,建立正交试验,通过分析正交试验结果可以获得各机器对作业目标影响程度的极差值。假设设备j在正交试验完成后的极差为Rj,则设备j的初始先验瓶颈概率为:
由于本文研究的是动态瓶颈漂移预测问题,当作业车间运行一定时间后,本文将各设备在上一瓶颈漂移决策窗的后验瓶颈概率,作为紧邻下一瓶颈预测窗的先验瓶颈概率,进行瓶颈预测,即:
1.3 设备故障条件概率计算
根据公式(1),要计算设备j为瓶颈时发生故障的条件概率,首先需要进行设备j为瓶颈与发生故障的联合概率P ( A j , B j)的计算,本文采用故障模拟仿真方法来求解。
通过MATLAB仿真软件模拟作业车间作业环境、作业设备、作业任务与工艺信息,并多次随机给各设备在任意时刻加载故障事件,在此基础上利用正交试验进行设备故障已知情况下的瓶颈识别,获得已知设备故障情况下瓶颈设备识别样本空间,利用概率统计方法,计算各设备为瓶颈与发生故障的联合概率:
式中, N (A j∩B j)为设备j发生故障并且为瓶颈的次数,N(Ω)为仿真次数。
将公式(6)带入公式(1),即可获得设备j为瓶颈时发生故障的条件概率。
1.4 设备故障概率计算
作业车间的设备运行一定时间后,需要进行预防性维修以减少故障发生次数,因此作业车间设备故障概率与设备预防性维修周期紧密相关。威布尔分布是电子与机械产品故障规律的常用描述[15],其表达形式为,
其中,m为形状参数,η为尺度参数。
设备维修活动使故障设备的功能得到恢复,设备性能得到改善,如同设备役龄向前推移一定量,通过引入役龄回退因子α ,可以获得设备j在第i个预防性维修周期内的故障率[15]:
其中,Tjk为设备j第k次预防性维修周期;αjk为设备j第k次预防性维修的役龄回退因子。
1.5 瓶颈漂移预测流程
依据设备预防性维修周期,本文将作业车间瓶颈漂移预测过程分为多个滚动窗,各滚动窗的长度与设备预防性维修周期相同。在各滚动窗内利用上述瓶颈设备预测模型进行瓶颈决策,相邻滚动窗间通过设备后验瓶颈概率到先验瓶颈概率的转换相连接,获得各滚动窗内各设备的后验瓶颈概率,识别出各滚动窗内的瓶颈设备,从而得到瓶颈漂移预测结果。整个作业周期内瓶颈设备漂移预测过程如图1所示。
在初始瓶颈预测滚动窗内,采用1.2节提出的正交试验及极差转化法,获得各设备成为瓶颈的初始概率,并作为初始滚动窗的先验瓶颈概率;根据1.4节的设备故障威布尔分布形式与役龄回退因子获取滚动窗内设备的故障概率;依据1.3节提出的设备故障过程模拟仿真,获得各设备发生故障的条件概率;依据1.1节所提的瓶颈预测模型,获得该滚动窗内各设备成为瓶颈的后验概率,其中概率最大者对应的设备为该滚动窗的瓶颈设备。如果瓶颈预测周期尚未到达,则进行下一个滚动窗的瓶颈预测,将上一滚动窗内各设备的后验瓶颈分布概率作为该滚动窗的先验瓶颈概率,重复以上瓶颈识别过程,获得该滚动窗的瓶颈设备,直到瓶颈预测周期到达,瓶颈预测过程结束,输出瓶颈预测结果。
2 瓶颈漂移预测实例分析
2.1 测试算例
以西安某航空发动机制造企业数控加工车间一主制工段为例,对本文所提瓶颈漂移预测方法进行测试和分析。该工段具有9台设备M={M1, M2, ... , M9},按批次加工12种工件J={J1, J2, ... , J12},各工件的批次及工艺路线如表1所示,各工件的工序工时信息如表2所示。假设各设备的故障时间服从的威布尔分布,预防性维修周期为48h,每次设备故障维修的时间服从[1.5h 4h]均匀分布,役龄回退因子服从[0.90 0.96]均匀分布,本算例的瓶颈预测周期为1个月(720h)。
该工段是典型的Job Shop作业,具有设备多,制造链长,各工件工艺路线相似性不强、生产无固定节拍等特点,因此在加工过程中,很容易出现瓶颈设备,阻碍生产过程的流畅性。而提前预测瓶颈设备的位置,预先做好生产准备及瓶颈优化,能够缓解制造链的拥堵现象,从而提高生产效率。
2.2 瓶颈漂移预测实现
针对2.1节的算例,采用第1节所述瓶颈设备预测模型,取作业目标为makespan,通过正交试验瓶颈识别法及极差转换法,计算各设备在初始瓶颈预测窗内的先验瓶颈概率,再根据1.3所述的设备故障条件概率计算方法以及1.4节所述设备故障率计算方法,计算初始滚动瓶颈预测窗内各设备的后验瓶颈分布概率。计算结果如表3所示。
将初始滚动瓶颈预测窗的后验瓶颈分布概率作为第二个滚动窗的先验瓶颈分布概率,同时利用1.1节的瓶颈设备预测模型,依据图1的瓶颈预测流程,计算出各滚动窗内各设备的后验瓶颈概率如表4所示。
取各滚动瓶颈预测窗内的最大后验瓶颈概率所对应的设备为瓶颈,获得2.1节算例的瓶颈漂移结果如图2(横坐标为瓶颈预测滚动窗编号,纵坐标为瓶颈设备编号)所示。该图给出了仿真周期内15个滚动瓶颈预测窗的瓶颈设备识别结果,可以看出,瓶颈设备在加工任务完成过程中确实发生了漂移;并且由瓶颈漂移预测模型可知,瓶颈设备与设备故障的分布概率紧密相关,随设备故障率、加工任务的变化而发生漂移。而以往传统的瓶颈识别方法大都侧重于任务加工前的静态识别,以固定的瓶颈设备提升系统性能,具有一定的片面性。
3 结论
本文针对作业车间瓶颈设备随设备故障的发生而漂移的现象,提出了基于贝叶斯推理理论的瓶颈设备漂移预测方法,建立了瓶颈设备漂移预测模型。该方法以设备预防性维修周期为一个滚动瓶颈漂移预测窗,利用正交试验及极差转换法确定初始滚动窗内各设备的先验瓶颈概率,通过模拟设备故障过程确定各设备发生故障的条件概率,依据贝叶斯推理理论计算各滚动窗内各设备成为瓶颈的后验概率,并将滚动窗内各设备的后验瓶颈概率作为紧邻下一滚动窗内各设备的先验瓶颈概率,依次循环,预测作业车间运作过程中瓶颈设备漂移趋势。
本文将传统TOC中的瓶颈事后识别转为事前预测,能够提前指导车间作业人员进行生产准备和资源平衡,以便消除瓶颈设备或降低设备瓶颈程度,缓解制造链拥堵现象,提升生产系统的运作效率,尤其适用于产品种类繁多,产品工艺复杂、制造链资源分配难均衡的JobShop车间。
贝叶斯公式的应用 第8篇
设试验E的样本空间为S。A为E的事件, B1, B2, …, Bn为S的一个划分, 且P (A) >0, P (Bi) >0 (i=1, 2, …, n) , 则:
2 贝叶斯公式的应用
2.1 在产品检测中的应用
例1某汽车制造厂所用的汽车离合器是由四家不同的汽车零件制造厂提供的, 根据以往的数据分析得以下数据:
已知在汽车制造厂的零件储藏室里由这四家汽车零件制造厂提供的离合器是均匀的混在一起放置的, 且外观没有任何区别。
1) 随机在储藏室里取一个离合器, 求此离合器为次品的概率。
2) 随机在储藏室里取一个离合器, 若取到的离合器是一件次品, 请分析此次品出自何厂的几率最大。
解:设A表示“取到的是次品”。
Bi表示“取到的产品是第i家汽车零件制造厂提供的”, i=1, 2, 3。
则有P (B1) =0.2, P (B2) =0.3, P (B3) =0.3, P (B4) =0.2,
1) 由全概率公式:
故随机在储藏室里取一个离合器, 求此离合器为次品的概率。
2) 由贝叶斯公式得:
根据计算得的结果分析得, 此次品出自第二家汽车零件制造厂的几率最大。
2.2在日常生活中的应用
例2某人下午5:30下班, 他所积累的资料表明:
某一天他掷一颗骰子来决定乘地铁还是乘汽车回家, 掷出骰子结果若是小的数 (1, 2, 3) , 他就乘汽车, 若是大的数 (4, 5, 6) , 他就乘地铁, 已知他是6:47到家的, 求此人是乘汽车回家的概率。
解:设A表示“乘汽车”;B表示“乘地铁”;C表示“6:45-6:50到家”。
由贝叶斯公式有:
2.3 在医疗检测中的应用
例3某地被测验的居民中有0.6%是癌症患者, 利用某种诊断癌症的试验来检测有如下效果:试验反应呈阳性的患病概率为0.94, 而未患病且试验反应呈阴性、假阴性、假阳性的概率为0.94。若当地一名居民的试验结果呈阳性, 那么该居民的患病概率有多大?
解:设事件A表示“试验结果呈阳性”;事件B表示“被试验者患有癌症”。则有:
由贝叶斯公式得:
故该居民的患病概率约为0.086。
2.4 在概率推理中的应用
例4已知一个位于英国的发报台分别以概率0.6和0.4发出信号“0”和“1”, 由于通讯系统收到了某些信号的干扰, 当发出信号“0”时, 收报台未必收到信号“0”, 而是分别以0.8和0.2的概率收到“0”和“1”;同样, 发出信号“1”时分别以0.9和0.1的概率收到“1”和“0”.如果收报台收到“0”, 求它没收错的概率是多少?
于是,
由贝叶斯公式, 得:
即收报台没收错信号的概率为0.923。
3 总结
在解决一些医疗检测、产品检测、概率推理、日常生活等一系列复杂的问题中, 贝叶斯公式为我们提供了更有价值、更快捷有效的决策信息, 成为我们解决复杂概率问题的有效工具。
参考文献
[1]王君.贝叶斯公式应用教学的一种新设计[J].新疆师范大学学报:自然科学版, 2011, 4 (4) :71-74.
[2]张丽, 闫善文, 刘亚东.全概率公式与贝叶斯公式的应用及推广[J].牡丹江师范学院学报:自然科学, 2006, 01:15-17.
贝叶斯理论 第9篇
摘要:采用聚类分析法将多专家的动态综合评价转换为静态综合评价;引入横向拉开档次法对各指标客观赋权,结合指标主观权重,运用数学规划法得到指标的集成权重;采用贝叶斯网络模型对24项科技成果进行分类评价,对每一项成果获得某一等级奖项的可能性给出测度,并对每一类内的项目排序。实证分析表明:我国科研成果大部分具有研究价值,且成果丰硕,但突破性、创造性的研究成果较少。
关键词:贝叶斯网络;集成权重;拉开档次法;聚类分析法
中图分类号:G311 文献标识码:A
与2013年、2012年相比,2014年度国家科学技术奖授奖项目明显减少。对此,国家科技部奖励办表示,优化奖励结构、减少奖励数量,是为了突出鼓励自主创新成果和重大的发明创造科技成果。科技成果的评价作为科技奖励的前期工作,对科技奖励的最终决策有着举足轻重的作用,也是保证真正的重大创新项目获得应有奖励、鼓励科研人员进一步有所突破的关键。
目前,学者们对科技奖励综合评价体系的研究做了大量工作,部分研究成果已经投入实际应用。张立军等构建了基于路径系数权重体系的科技奖励评价模型。王瑛等提出了基于模糊多属性投影法的科技奖励模型和E-BP神经网络的科技奖励评价模型。黄卫春等提出了一种基于云模型的科技奖励评审模型,利用云模型描述项目评分在各属性下的分布情况,通过计算云模型参数来确定云模型数字特征图或云滴分布情况,并以此确定评价等级。王瑛、蒋晓东等提出了改进CRITIC法和云模型的科技奖励评价模型,既考虑评价过程中专家评分的模糊性和随机性,又考虑了定性语言与定量语言之问的转换。王瑛、王娜等提出了基于随机森林赋权和改进的ELECTRE-Ⅲ方法的科技奖励评价方法,既提高了权重估计的精确度和可信度,又解决了难以给定门槛值和不能完全排序的问题。朱紫巍等针对国内外科技评价方法,进行比较分析,提出了改革我国科技评价方法的建议。
针对科技奖励评价涉及多专家、多项目、多指标的特点,此前,学界的研究主要集中在评价指标的客观赋权法与主观赋权法的单方面研究,没有将这两方面有机结合起来;在评价方法上主要集中在数理统计和人工智能等方面,但对于评价结果的可靠性没有给出科学的测度。对此,本文提出一种集成权重的方法对科技奖励的评价指标进行综合赋权;应用概率论中的贝叶斯网络模型进行科技奖励综合评价,该方法不仅可实现对科技成果的分类评价,而且可对每一项科技成果获得某一等级奖项的可能性给出概率测度,并在分类评价的基础上,对每一类内的项目进行排序。
1集成权重的理论
评价指标权重的确定可分为主观赋权法和客观赋权法,两者各有千秋。本文采用一種主、客观权重集成的方法,计算各评价指标的综合权重,该方法既能满足决策者的主观偏好,又能实现决策的客观性、真实性。
1.1基于聚类分析的专家权重理论
聚类分析方法是一种作为模式识别的分类方法,它常常被用来判断样品质量的好坏。把评审专家的个体排序向量看作是待识别的样品,对其进行聚类分析并判别其客观可信性,再根据聚类结果给专家赋权。
动态专家赋权坚持的是简单多数的基本原则,即一个评审结果体现的是整个专家群体的综合意见。因此,一个专家的个人评审意见和大多数专家的评审结果的吻合程度决定了该专家在整个综合评价中所占的分量。如果他的评价结果与大多数专家的结论基本一致,就可以给这一类专家赋以较大的权重;反之,其意见就值得怀疑,可以给这一类专家赋以较小的权重。
通过聚类分析,可以将个体排序向量划分成不同的类别,即将k个评审专家分成s类(s≤k),假设第l类(l≤s)内包含φl个个体排序向量,那么,第k位专家的权重ηk应该和他所在的类别中包含的专家人数φk成正比,其具体计算公式为:
(1)对ηk进行归一化处理,即可得到基于聚类分析的动态专家权重:
(2)
1.2拉开档次法的指标赋权理论
拉开档次法就是在使得各被评价对象之问的整体差异尽量拉大的条件下确定评价指标权重的方法。
对于静态综合评价问题,一般解决办法是取线性综合评价函数:
(3)式中:ωi为评价指标权重。
(4)式中:
当指标权重矩阵W为对称矩阵H的最大特征值对应的特征向量时,σ2取最大值。此时权重系数W最大可能地体现了各评价对象问的差异。
1.3基于数学规划法的集成权重理论
本文应用数学规划法在非线性约束条件下,求解线性目标函数的极值问题。该方法在科技奖励综合评价中的具体应用如下。
(5)
解得:
(6)
(7) (8)
(9)
(10)
由式(10)即可求得评价指标的集成权重。
2贝叶斯网络模型的理论
(11)式中:P(A|Bi)为条件概率;P(Bi)为事件Bi的概率。
结合科技奖励评价的特点,Bi为科技奖励的等级集,元素yji表示第j个指标在第i等级时的标准值;A表示科技奖励的指标集,元素xjk表示第k项科技成果的第j个指标的实际值;i为标准级别,i=1,2,…,s;j为指标,j=1,2,…,m;k为科技成果编号,k=1,2,…,n。据此式(11)可改写为:
(12)
算法步骤如下:
1)计算P(yji)。在没有任何信息的条件下,某项科技成果究竟属于哪一等级,这在许多应用中难以确定。结合科技奖励的特点,在没有获取科技成果相关信息的情况下,人们最能接受的是获得某等级奖励的概率相等,即取:P(yj1)P=(yj2)=…=P(yjs)=1/s。
2)计算P(xjk|yji)。现有研究成果表明,P(xjk|yji)的估计是贝叶斯网络模型的核心。本文从抽样误差角度估计P(xjk|yji)。根据统计理论,当科技成果属于i类时,由于抽样缘故获得的样本指标值和总体指标值总是存在一定的抽样误差,其分布可用正态分布表示。基于以上考虑,将抽样误差正态分布原理用于估计P(xjk|yji)。以科技成果评价指标j各等级标准值作为正态分布的均值aj,基于aj和标准差σj获得某一等级某一指标完整的正态分布。
(13)
(14)
(15)式中:aj,σj和Cj分别为指标j各等级的均值、标准差和变异系数。
由式(13)~(15)计算变异系数Cj,Cj表示指标j在各类之间相对变化情况。而某类指标j抽样值的相对变化亦与之类似,因此采用Cji=Cj,即以各类等级变异系数估计某一类指标抽样值的变异系数。
基于抽样误差正态分布原理估计P(xjk|yji)的计算步骤归纳如下:
①由式(13)~(15)估计Cji,并采用Cji=Cj;
②将第i类指标j的标准值yjk作为该类指标均值;
③计算第i类的标准差σji=Cjiyji;
④将抽样值(检测值)xjk标准化,
(16)
⑤以标准化正态分布计算
(17)
用标准正态分布函数求取,|tjk|为tjk坤的绝对值。
3)由式(12)计算P(yji|xjk)。
4)多指标下(ωj为指标权重)科技成果评价后验概率Pi的计算。
(18)
5)以最大概率原则决策最终的级别Ph。
(19)
6)以分类结果为基础,在每一类内根据概率大小进行排序。
3实证分析
以国家科学技术进步奖(技术开放项目)评选中25位专家对24项科技成果的评分数据(资料来源:科技部国家科技奖励办公室,原始数据略)为例,该奖项的5个评价指标是:技术创新程度、技术经济指标的先进程度、技术创新对提高市场竞争能力的作用、已获经济效益、推动科技进步的作用。国家科技奖励办赋予5个评价指标的权重为:ω'=(0.2,0.2,0.2,0.25,0.15),将该权重作为评价指标的主观权重。具体步骤如下。
步骤1基于聚类分析法的专家权重的计算。
运用SPSS19.0对原始数据进行聚类分析,将25位专家分为5类,即:
第一类包含10,16号2位专家;
第二类包含1,2,4,12,15号5位专家;
第三类包含3,6,8,9,14,25号6位专家;
第四类包含5,7,11,13,18,19,20,21,22,23,24号11位专家;
第五类:含17号1位专家。由式(1)(2)计算专家权重,结果见表1。
由表1求得的专家动态权重,采用简单线性加权法,计算25位专家对每个项目的5个评价指标评分的加权平均值,计算结果见表2。
表2的数据组成的矩阵,即为式(4)中的矩阵X,应用Matlab7.0计算XTX的最大特征值及归一化的特征向量(即权重系数)分别为:
步骤3科技成果评价标准体系的构建。
根据国家科技奖励办公布的国家科技进步奖(技术开发项目)评价指标体系和奖励办法,建立国家科技进步奖(技术开发项目)评价标准。按照“从严把关,严肃评审,宁缺毋滥”的原则,在分类上设置5个等级,在各等级标准设定中采取5分制原则,采用随机生成数的办法,得到5个指标各等级的评价标准,见表3。
步骤4
基于贝叶斯网络模型的科技奖励评价。
3)由式(12)可知,求P(yji|xjk)的过程就相当于P(xik|yji)的归一化过程,计算结果略。
4)由式(18)计算该项目分属各等级的概率。
同理,计算24个项目分属各等级的概率,结果见表5。
5)由式(19)确定项目1所属类别,属于三等,抽样误差标准正态分布以0.366的概率保证其获得三等奖。
6)同理,可以得到所有项目的所属类别,并根据同一类内概率的大小,进行排序,结果见表6。
从分类评价结果看,大部分科技成果都属于二等和三等,一等和四等的项目较少,五等的项目完全没有;从评价结果的可靠性看,获得一等奖的项目分别以0.408,0.426,0.469的概率给予保障,获得二等、三等项目的可靠性测度维持在0.382,获得四等奖的可靠性则以0.320的概率给予保障;每一个等级内的排序可以為决策部门在授奖指标一定的情况下提供参考。通过实证分析可以得出:高等级获奖项目较少,大部分属于二等和三等,低等级获奖项目极少,这表明我国科研成果绝大部分具有研究价值且成果丰硕,但突破性、创造性的研究成果较少。
4结论
采用集成权重和贝叶斯模型相结合的方法进行科技成果综合评价,方法的特点表现在:
1)聚类分析将多专家的动态评价转化为静态评价。从一般线性函数的评价结果出发,用拉开档次法对评价指标客观赋权,该赋权过程科学、客观、透明,可操作性强。
2)数学规划法将主、客观权重相结合,构成评价指标的集成权重,使科技奖励综合评价结果同时反映了主、客观因素,弥补了单纯采用主观赋权法或客观赋权法的不足。
预案分析的贝叶斯网络方法 第10篇
预案是指根据评估分析或经验,对潜在的或可能发生的突发事件事先制定的应急处置方案。目前我们在编制预案时最常用到的方法是关键路径法,在预案实际应用过程中常会受到各种原因造成的不确定性问题影响,使得预案的执行结果偏离预期结果。尤其是在大型复杂的预案执行过程中,因其各个活动之间存在很多错综复杂、关联耦合的相互关系,不确定因素及不确定信息充斥其间,使得这种偏离预期会更明显。面对不确定性问题对预案执行的影响,使得我们有必要对预案制定是否科学、内容是否完备等进行评估,对在现有资源情况下预案偏离预期结果的可能性进行分析。目前对预案进行评估分析时,人们常会考虑用预案演练的方式来进行,但是并非所有的预案都可以通过演练的方式进行检验,同时演练的高成本在一些预案中也难以承受。同时由于关键路径法是一种处理纯粹确定性问题的方法,这种方法本身没有试图处理或量化不确定性问题,所以我们必须引入一种其它的方法来进行预案分析。
本文推荐的基于概率推理的贝叶斯网络法是为解决不确定性、不完整性问题而提出的,因其对于解决复杂项目的不确定性问题和活动之间的关联性引起的不确定性问题有很大的优势,而被广泛使用于一系列的决策支持应用,将其应用于预案分析中还是一种较新的尝试。
1 贝叶斯网络法
1.1 贝叶斯网络
贝叶斯网络(也称为信念网络,因果概率网络,因果网,图形概率网络,概率因果模型和概率影响图)为很多涉及不确定性和概率推理的问题提供决策支持。贝叶斯网络是一个有向图,连同相关的概率表。
图1由节点、箭线和概率表构成。该图显示了在某项目中那些特定任务延迟原因构成的简单贝叶斯网络。这些节点代表不确定性变量,每个节点都有一组状态(例如“合同签订”节点的“按期”和“逾期”)。箭线代表变量之间的因果关系或影响力(例如“合同签订”和“工人技能”可能会影响“按期完工”)。概率表代表每个节点变量状态的概率。因为变量没有前因(称为起点节点),概率表只包含事前分布(例如,合同签订节点PA1=0.95和PA2=0.05)。这也被称为先验分布用以表示之前的信念。对于每个有前因的变量,概率表对每个前因状态有条件概率的组合(例如图1,按期完工的概率表)。这也被称为似然函数,表示前一特定状态引起某一结果的可能性。
贝叶斯网络是将概率统计应用于复杂领域进行不确定性推理和数据分析的工具。当一些变量已经被观测到时,我们可以据此推断其它未被观测变量的概率。这些观测值代表了后验概率并通过贝叶斯规则作用于每个受它影响的节点,因此其影响就可以传播到贝叶斯网络上的其它节点并修改这些节点的概率分布。
1.2 贝叶斯网络的活动时间
图2所示是一个按不确定性来源和其对某项活动持续时间影响为模型建立的贝叶斯网络原型,模型中包含使得活动持续时间不确定的那些变量。其中初始时间估计是活动的第一期估计,是根据历史数据,过去的经验或专家判断进行的初始估计;资源包含对活动时间带来影响的任何因素,资源水平可以从“成本”,“人员经验”和“技术水平”这些可直接观察的“指标”节点中推断出来。通过显示各种情况下运行该模型的结果,可帮助项目管理人员对各种“指标”节点对活动的影响认识得更加深刻。
2 贝叶斯网络法在预案分析中的应用
为说明如何通过贝叶斯网络的活动时间模型对一个活动进行分析,假设在一个预案中某项活动的贝叶斯网络时间模型如图2所示,“成本”、“人员经验”及“现有技术水平”为“指标”节点,“指标”节点和“资源”的等级简单的分为低、中和高三种情况。未观测到各“指标”节点情况时,假设各“指标”节点三种情况出现的概率均等,根据历史数据,过去的经验或专家判断,就可以通过贝叶斯网络法计算得到活动时间的概率分布,结果如图3所示。
根据得到的概率分布还可以计算出活动时间累计概率。在图4中可以看到,应用贝叶斯网络法我们可以通过计算得到任务在多少天内完成的概率是多少,可通过计算的结果来验证。例如按照上述假设在未能观测到“指标”节点的情况下,有90%的可能性在11天15小时内完成该项活动。据此,我们可以通过计算得出的结果来分析应用关键路径法制定的预案中各个活动的活动周期的合理性。
贝叶斯网络法用于处理不确定性问题的优势还体现在可以应用后验概率来修订已得到的结果。在上例中如在我们已知“资源”等级为高的情况下,被修订后的“活动时间”应如图5所示。这时活动有90%的可能性在4天7小时内完成该项活动。这样使得我们可以在预案执行过程中实时的修订原有“估计”,使得预案执行者在预案实际执行过程能更好的调配资源,以实现预案执行效果最优。
贝叶斯网络法在预案分析中另一个重要的应用是,在“活动时间”有约束的情况下,可通过计算得到“资源”的所需等级。如我们在已知“活动时间”需控制在4天半以内的情况,“资源”所需等级如图6所示。
3 示例
为了说明如何将贝叶斯网络引入预案的映射过程,同时避免由于引入贝叶斯网络后使原有活动网络变得过于复杂,图7所示的保障预案是一个用关键路径法制定的最为简单的保障预案。
如图7所示,某产品承制单位针对使用单位用关键路径法编制的一个简单保障预案。该预案由4个活动A、B、C和D组成。用关键路径法的计算结果如表1。可以看到活动A,B和D的总时差=0,整个保障活动需要20天。
将贝叶斯网络法引入原有的保障预案后可得到如图8所示保障预案贝叶斯网络图。在该网络图中节点表示活动A、B、C和D的“活动时间”,箭线尾代表上一活动的结束,箭线头表示下一活动的开始。活动A、B、C和D的“活动时间”、“资源”和“指标”节点等都可以用贝叶斯方法进行单独的分析,也可在对每一活动分析基础上对整个保障预案进行分析。
4 结论
综上所述,可以看到利用贝叶斯网络法分析预案中的不确定性问题的优势是:能明确量化不确定性和模型变量间的因果关系;使人们有可能用新的数据(如一些观测值)推翻原有概率分布;可用不完整数据进行预测。但我们也必须认识到引入贝叶斯网络会使活动网络变得复杂,在大型的工程项目中这种影响尤为突出,这个问题需进一步分析研究加以解决。
摘要:在对预案进行评估分析和执行过程中常会涉及不确定性问题,传统的预案编制工具关键路径法(Critical Path Method,CPM)不具备处理不确定性问题的能力。本文推荐的贝叶斯网络法(Bayesian Networks)因其处理分析不确定性问题的能力已经被广泛应用于一系列的决策支持应用,但对预案评估分析的应用是新颖的。本文介绍了用贝叶斯网络法分析传统关键路径法编制的预案。
关键词:预案分析,不确定性问题,贝叶斯网络
参考文献
[1]Pan H P,Liu L.Fuzzy Bayesian Networks—a General Formalism forRepresentation,Inference and Learning with Hybrid Bayesian Networks.Internationa Journal of Pattern Recognition and Artificial Intelligence,2000,14(7):941-962.
[2]PEARL J.Bayesian networks[R].Tech Rpe:R-277,11,2000.
[3]DEVIREN M,DAOUDI K.Structural Learning of Dynamic BayesianNetworks in Speech Recognition[R].Euro speech,2001.
[4]姚玉玲,刘靖伯.网络计划技术与工程进度管理[M].北京:人民交通出版社,2008,27-35.
贝叶斯理论范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。


