电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

贝叶斯知识库论文

来源:盘古文库作者:开心麻花2025-09-161

贝叶斯知识库论文(精选8篇)

贝叶斯知识库论文 第1篇

一、归纳法问题

假说通常都有一个与之想要阐释的经验观察相联系的一般特征。若信息都来源于经验观察, 如何确定每个特称解释都是正确的问题是归纳法问题。有时被否认的是从经验观察中得到的现有信息是有限的观点, 许多哲学家认为, 能够采取演绎推理的方法来弥合观察与科学推理之间的鸿沟。然而, 依据科学理论不能依据此原则来构建为“真”。第一, 按照其观点, 由于此原则疏于揭示“未来就是假定类似的过去”, 缺乏真实性。第二, 只要“自然的统一性原理”能够确切把给定的观察与特定的一般规律连接在一起, 那么它作为科学推理的缺陷也就显现出来了, 因为其所被认定为真的内核就像是事先设定确证科学理论为真一样变得不可靠了。此后没有了“绝对地”解决归纳问题, 即没有任何人的特殊解释理论能够给予结论性证明为真的解答。

二、卡尔?波普尔对归纳法问题的探究

20世纪80年代人们开始转向接受保罗?费耶阿本德的方法, 在其看来, 所有的理论都处于同一水平, 例如, 规范科学的主张比起那些一般被斥为外行人的怪异思想的主张几乎是一样的。卡尔?波普尔拒斥这种怀疑论, 他认为理论仍然有值得认识的重要地位, 在认识理论上的某些问题时, 理论作为更高于其匹敌者的形式构建起来, 此假设的优越性作为客观特征, 独立存在。费耶阿本德指出两个事实:第一, 当理论不能在经验观察上得到逻辑证明时, 它们有时被否定其真实确定性。第二, 它们演绎推理的结果能在观察中检验和证实。但此尝试没成功。通过否认理论的真实性, 一个理论能够排除推测和猜想变为一个真实性理论, 这是正确的。但就其自身来说, 这在实践上是无用的。因为, 假使注意力被限定于无可辩驳的理论上, 那么这将面临极大的选择范围, 所有的理论都是“可证实”的, 而问题则变成了如何在众多理论中选择被看做是最具真值性的理论。

为解决此困难, 就要考虑决定天鹅颜色一般性规律的传统归纳问题。如果你考虑命题的真值性, 那么就得考虑理论的概括性问题。假使总的天鹅数保持不变为n, 并有m种不同的颜色, 那么天鹅的颜色组合数是mn。对于有关天鹅所有的颜色数推论表现出更低化。如果进一步把天鹅随时随地不断地选择变换颜色并具有多彩性的概率考虑进去, 可以看出简单假设“所有天鹅都是白色”的例外命题是无限多, 且事实上也是无穷多。对此, 许多人已提过批判的意见。事实上, 详尽描绘出每一只天鹅的颜色理论 (依靠时时观察这些天鹅的颜色仍未提出过异议) 是可以被证实的。在诸多假设中选择最佳的问题仍未被看做比波普尔的方法更技高一筹。

三、实践中的科学方法

波普尔的观点没有被证伪。在波普尔的描述性命题中, 能够迅速地做出科学推理的两个特征。第一, 当在一些科学工作的实验数据中科学理论被证伪时, 科学家们通常是修改原有理论或完全放弃理论。第二, 当科学家研究一个决定性理论时, 通常会引出其结果, 并依据相应的实验对它们进行检验, 如果证明是正确的, 那么通常就可以断定该理论已被证实, 我们对该理论的信念度也愈加巩固。

尽管这都是正确无误的, 但是仍有两个因素制约波普尔描述解释性仍不能得到更为深远的成功。其一, 他在解决归纳法的问题时, 所持有的原则显得不充分而无法缩小可选择性假说的范围, 而且在实践中, 科学家会依据他们自己的价值观和思索来构建假说的等级系统。其二, 只关注于理论的逻辑结果, 而许多科学家们认为赞成或反对理论的证据不属于这种范畴。这就呈现出许多方式。波普尔想把证伪的理念拓展到数据统计范围, 但这很困难。R?A?费希尔认为, 证据可能对统计性假说有一种决定性的消极影响, 而这个启示倾向于其证明为假。他对处于“无用假说”之下的统计性假说作了以下表述:“无用假说从来不需要证明或者构建, 但是在实验过程中可以被证明为假。每一个实验都可说是证明现存无用假说为假的事实。”

费希尔在意义判定理论中规定了统计性假说如何被判定的理论引起诸多学者的诟病, 许多学者对其理论进行了批判。特兹?内曼和埃贡?皮尔森对判定理论意义修正。尽管他们拒斥费希尔的许多方法, 但应对费希尔的某些理论时尤其是在技术性结果方面仍欠妥当。他们坚持统计判定的思想, 认为证据只能决定两个可能性结果中的其中一个, 即要么接受假说, 要么拒斥假说。

四、概率归纳:贝叶斯定理的方法

应当而且必须有一种方法论能够就其“概率论”问题给予科学理论的评价。大多数科学家都持有“以证据来说, 理论应当联系其概率进行判定”的观点。乔恩?都灵在《贝叶斯人本主义》中就已观察到, 在最近的三百年间, 当为自己思想辩护或审视其他人思想时很少有人关注其概率论思想。从17世纪的詹姆斯、伯努利, 到20世纪的卡尔纳普、杰弗里斯、芬特里和拉姆齐, 诸多哲学家都对直观的归纳概率论思想进行了阐述和诠释。

纵观其理论, 在直观的归纳概率论问题上表现为两种主要立场。从独立于我们主观世界且能在逻辑上证实方面来说, 第一种是:把概率论看做是客观性的, 其期望确立理论为真的概率, 因此可以把“竞争解释的相对评价”摆在客观位置上。如果这个能实现的话, 他将为归纳问题提供一些解决方法并能为科学建立“合理”的基础。然而, 遗憾的是这种观点设想却遇到了理论缺陷的羁绊, 仅仅根据随意的不可靠条件便敷衍了事、偃旗息鼓了。第二种立场则把概率论问题看做是主观性问题。在他们看来概率论大致可以说是一种可测的“信念度”, 被称“主观主义者”或“人格主义者”的解释。因为是以贝叶斯定理的概率计算方法而闻名遐迩的, 因此这种思想的科学方法通常被称作“贝叶斯主义”的方法。由于贝叶斯方法对常规方论暴露出的弱点进行了合理性的补充, 因此, 贝叶斯主义近年来在统计学和哲学领域有了悄然复兴。

五、对贝叶斯方法及其客观理念的评价

通常对贝叶斯定理方法进行诟病的是其把某种主观因素看做与理论科学性的评价有关。若承认贝叶斯定理方法中的主观因素首先是尽可能少的, 其次是确切正确的。然而, 这样却与一个极具影响的学派产生了矛盾性抵触, 即完全否定理论评价中的主观因素。依据该学派的观点, 评价应当是完全客观上的。诸如波普尔、拉卡托斯、费舍尔、内曼和皮尔森及其学派都坚持标准科学价值的思想, 这种价值诉诸于客观性和说服力而拒绝概率论。坦然地讲, 他们已经在该领域获得了卓越的成就, 尤其在意义判定和评价方面, 他们的理论由许多称做传统统计推理的方法组成。他们所提出的实验设计和数据分析的程序已被许多科学家看做是判断正确的标准。

尽管这种方法在哲学家和科学家之中产生了很大影响, 但是这种传统方法在现代科学理论评价体系中不再占有主流地位, 而显得黯淡无光。笔者认为, 以上诸多哲学家所坚持的这些总体客观思想是无法获得的, 且作为该思想保护外壳的传统方法论事实上每次转换中也违背了它。实际上, 没有大量个人的判断和臆造假设的情况下, 这些方法具有缺陷性和无效性。在依据概率计算进行的科学推理中, 贝叶斯定理的方法成为一种有效的尝试。

参考文献

[1]Colin Howson.Scientific Reasoning:the Bayesian Approach[M].Open Court Publishing Company, third edition, 2006.

[2]Kant, I.Prolegomena to any Future Metaphysics[M].Edited by L.w.Beck, .Indianapolis:Bobbs-Merrill, 1783:9.

[3]L.A.Selby-Bigge.An Enquiry Concerning Human Understanding[M].Oxford:Clarendon, 1777:32.

[4]Fisher.The Design of Experiments[M].Fourth edition.Edinburgh:Oliver and Boyd, 1947:16.

贝叶斯决策 第2篇

学习指南

主要内容是说明分类识别中为什么会有错分类, 在何种情况下会出现错分类?错分类的可能性会 有多大?在理论上指明了怎样才能使错分类最少? 不同的错分类造成的危害是不同的,有的错分类 种类造成的危害更大,因此控制这种错分类则是 更重要的.为此引入了一种“风险”与“损失” 概念,希望做到使风险最小.要着重理解“风险” 与“损失”的概念,以及在引入“风险”概念后 的处理方法.

武汉大学电子信息学院

贝叶斯知识库论文 第3篇

当电网故障时大量保护与断路器动作等故障信息通过数据采集与监控 (SCADA) 系统上传到调度中心, 给调度员及时有效处理它们带来困难。专家系统、因果网络、Petri网、粗糙集、贝叶斯网络、0-1优化等人工智能方法已被用于电网故障诊断[1,2,3,4,5,6,7]。但它们易受信息缺失、畸变等影响, 没有充分利用故障信息时序属性。已有文献提出计及时序的处理方法[3,8,9], 但在对故障事件与保护动作、各级保护动作与对应断路器跳闸之间的时序约束关系定量表达方面, 还需要做进一步研究。时序贝叶斯知识库 (temporal Bayesian knowledge bases, TBKB) 对贝叶斯网络做了改进[10], 能够显式表达事件变量的各个状态, 增加了时序因果关系 (temporal casual relationship, TCR) , 能够定量表达各发生事件之间的时序约束关系[11,12,13]。

本文利用TBKB, 描述元件故障与保护动作、各级保护动作配合、保护动作与断路器跳闸等之间的逻辑关系与时序约束, 构造相应的诊断模型, 同时考虑其通用性与适应性。给出电网故障在线诊断方法, 设计了原型系统, 研究了TBKB诊断模型自动生成、基于TBKB的诊断算法实现、分层因果图构造与显示等关键技术。

1 TBKB基本原理

TBKB模型是有向关联图, 包括两类节点:状态实例节点 (instantiation-node, 简称I节点) 代表一个随机变量的状态;支持节点 (support-node, 简称S节点) 表示一个或多个I节点向某I节点的转移关系。每个I节点时间点T=[t-, t+], t-和t+分别为时间点区间的起点、终点时刻。

在每个S节点上定义了状态转移条件概率w与时序因果关系TCR。w定量表达前继I节点 (指向S节点的I节点) 到后继I节点 (该S节点指向的I节点) 的条件概率。TCR表达了前继I节点与后继I节点动作事件之间的时序约束关系。

2 基于TBKB的电网故障诊断模型

2.1 电网故障诊断TBKB模型的基本原理

利用TBKB构造电网元件故障时元件故障与保护、断路器动作的因果关系, 用模型中S节点的TCR描述各动作之间的时序约束关系, 进而建立本文的电网故障诊断分层TBKB模型。

对于线路、母线, 其电网故障诊断TBKB模型包括元件故障层、保护动作层及断路器动作层、失灵保护动作层及断路器动作层、远后备保护动作层及断路器动作层等。

模型中每个I节点一般有两个状态节点。如元件Fi有元件故障状态I1节点 (Fi=1) 与元件正常状态I0节点 (Fi=0) 。保护Pi有保护动作I1节点 (Pi=1) 与保护不动作I0节点 (Pi=0) 。断路器Bi有跳闸I1节点 (Bi=1) 与不动作I0节点 (Bi=0) 。一般地, 从元件故障 (或元件正常) 节点出发, 指向保护动作 (或不动作) 节点, 再由保护动作 (或不动作) 节点指向断路器动作 (或不动作) 节点。

2.2 线路的电网故障诊断TBKB模型

2.2.1 线路的故障诊断TBKB模型构造

构造电网中每个元件的TBKB诊断模型, 需根据电压等级, 分级考虑其保护的配置及其通用性, 选取各厂家通用的保护, 使得这些保护既能充分反映元件的故障发生, 同时又无需依据各厂家的保护设备进行专门诊断模型的定制。

根据目前电网继电保护的典型配置[14], 220kV线路选取两套全线速动差动保护为主保护, 由相间距离保护Ⅱ段、接地距离保护Ⅱ段作为短延时近后备保护, 相间距离保护Ⅲ段、接地距离保护Ⅲ段作为本线路的长延时近后备保护及相邻元件的远后备保护, 并配置断路器失灵保护。当配有失灵保护的某断路器拒动时, 模型中由元件故障节点和断路器不动作节点指向失灵保护动作节点。当母联断路器跳闸失灵时, 经失灵保护延时跳开双母线上所有断路器。当线路断路器失灵时, 经短延时跳开母联断路器, 经长延时跳开母线上连接的所有断路器。当本元件主保护、近后备保护、失灵保护 (如果配有) 及其对应断路器未能成功切除故障时, 模型中由元件故障节点与断路器不动作节点指向相邻元件的远后备保护动作节点, 跳开相应断路器。

S节点的状态转移条件概率w反映元件故障引发保护动作、保护动作引发断路器跳闸的条件概率, 有元件故障概率、保护正常动作概率、误动及拒动概率等, 根据文献[5]的2.3.3节设置w值。

2.2.2 时序的表达

在S节点上构造的TCR反映了元件故障引发保护动作、保护出口动作到断路器跳闸等时延。根据文献[14]假定220kV线路主保护动作时延为10~40ms, 断路器跳闸时延为20~40ms, 近后备保护相对元件故障时刻的动作时延设定为0.5~1s, 远后备保护的动作时延设定为4~5.5s。

TCR还能表达各保护动作之间逻辑约束关系。如远后备保护应在相邻元件故障、其断路器未跳开情况下动作, 否则为误动。在保护I1节点与其前继节点集合中I0节点之间建立TCR, 表达远后备保护正确动作的前提条件。如TCR={tL2Rs=1=tB1=1+4 000 ms, t+L2Rs=1=t+B1=1+5 500 ms∧t+L2Rs=1

2.3 母线的故障诊断TBKB模型构造

母线的TBKB模型中把母差保护作为主保护, 由失灵保护、相邻元件的保护作为后备保护。

根据一个典型电网结构 (如附录A图A1所示) , 建立线路L1、母线B1的TBKB诊断模型, 如附录A图A2、图A3所示, 图中白色椭圆表示I节点, 黑色实心圆表示S节点。

3 基于TBKB的电网故障诊断主要方法

3.1 基于TCR的时序约束一致性检查方法

由于在电力系统故障发生中可能存在保护与开关误动、报警信息内容和时标出错、信息缺失等情况, 使得溯因推理无法形成完整的事件链与结果。因此需要利用TCR对报警信息中各动作信息之间的逻辑与时序约束一致性进行检验。

获得来自SCADA中保护与断路器动作及其时标信息后, 对每个疑似元件, 若报警信息中动作保护、断路器在某疑似元件m的TBKB模型的保护、断路器节点中, 则将该保护、断路器节点符号存入元件m的动作保护与断路器集合Am。根据Am中保护与断路器动作事件 (状态变量b=1) 的时标t, 给出对应I1节点的时间点[tb=1=t, t+b=1=t], 给出闭合状态的I0节点的时间点为[-∞, t]。对于Am以外未动作的保护与断路器, 认为其处在闭合状态, 其相应I1节点的时间点不存在, 其相应I0节点的时间点为[tb=0=-∞, t+b=0=∞]。

利用TBKB模型中前继与后继I节点之间的时序约束关系, 可计算出模型中任意两个I1节点之间的时序关系, 具体计算方法见附录A中A1节。

以Am中每个节点i为基节点, 检查Am中其他节点j (目标节点) 与基节点i之间是否满足TCR约束。具体做法是先根据基节点i的时标、已定义节点j与节点i之间的TCR, 求出目标节点j的期望时间点区间, 再检查目标节点j的实际时标是否落在该期望区间内, 并检查它们之间是否满足保护配合逻辑。如果是, 则目标节点j与基节点i满足TCR约束, 将节点j的节点符号存入基节点i的中间集合U (i) 。

对集合Am中每个节点做时序一致性检查, 得到各自U集合, 找到包含I1节点个数最多的U集合作为该元件的TCR满足集合Rm。将Am中未通过TCR检查的I1节点, 存入约束不满足集合Tm, Tm=Am-Rm。将不包含在报警信息中处于不动作状态的节点, 存入不动作状态节点集合Cm。

通过时序约束一致性检查, 能够得到TCR满足集合R、约束不满足集合T (含时标出错、误动的保护、断路器) , 并且对于分别包含在不同元件下的TCR约束满足集合R中的某个远后备保护, 可判断出它的动作归属于哪个元件。

3.2 信息缺失节点的状态组合假设

1) 主保护动作, 本元件断路器动作切除元件, 对应图1中元件故障状态节点到主保护动作节点, 再到断路器动作节点通路。

2) 主保护拒动、近后备保护动作跳开断路器切除故障, 对应图1中元件故障状态节点到近后备保护动作节点、再到断路器动作节点通路。

3) 本元件下断路器未能及时切除元件, 由失灵保护、远后备保护动作控制相关断路器动作切除。对应图1中元件故障状态节点到主 (近后备) 保护动作 (不动作) 节点, 再到断路器不动作节点。由元件故障状态节点与断路器不动作节点指向失灵 (远后备) 保护动作节点, 再指向相关断路器动作节点。

上述通路中, 若部分中间保护动作节点或底层断路器动作节点的名称不包含在故障报警信息中, 则该保护、断路器的动作信息有可能缺失。

对于信息缺失情况, 对信息缺失节点的两种状态 (0或1) 分别进行假设, 组合形成假设状态组合集合S。针对集合S中每种组合, 进行贝叶斯反向推理, 计算故障概率, 判断元件是否故障, 再做正向推理, 识别误动、拒动保护、断路器数量。

借鉴文献[7]中将故障元件数、误动与拒动保护数及断路器数之和作为异常事件数θ。θ值越小, 对应元件实际故障可能性越大。将最小θ值对应的诊断情况, 作为该元件的诊断结果输出。

3.3 贝叶斯推理与故障判断

若不存在信息缺失, 则以保护与断路器动作集合A与不动作集合C的节点状态为证据值, 利用贝叶斯反向推理计算出疑似元件的故障概率。

若存在缺失信息, 针对假设状态组合集合中每组假设状态组合s, 以A∨C∨s中节点的状态值做贝叶斯反向推理公式中证据值, 求取元件的故障概率。若它大于0.6, 则该元件故障。再通过贝叶斯正向推理求得该假设状态组合下保护、断路器的期望发生概率。若其大于0.5, 认为保护 (断路器) 的期望状态为动作, 否则为不动作。保护、断路器节点的实际状态为SCADA报警信息中的状态值。若保护 (断路器) 的期望状态为动作, 实际状态为不动作, 则为拒动;若期望状态不动作, 实际状态动作, 则为误动。

将误动的保护与断路器节点从约束不满足集合T中去掉, 就得到时标出错的保护、断路器。

由于TCR约束满足集合R中元素的时标信息是可信的, 根据R中保护动作时标, 可反推出故障元件的故障时刻所在时间区间。

4 原型系统的设计

4.1 原型系统的工作原理

本诊断软件原型系统首先对SCADA中电网拓扑信息进行数据提炼, 得到最新的电网拓扑结构。从变电站的继电保护信息系统中获得元件下属保护、断路器的配置关系。

根据SCADA中保护、断路器动作报警信息, 获得疑似元件。由提炼的拓扑信息自动生成疑似元件的TBKB诊断模型。针对每个疑似元件, 通过时序约束一致性检查、反向与正向贝叶斯推理等步骤做故障诊断。根据报警信息、故障诊断结果, 以分层因果图表达元件故障的具体演变过程。本软件包括数据收集、TBKB模型自动构造、TBKB的故障诊断推理、分层因果图四大模块。

本文用VC++实现诊断软件原型系统, 构建本地诊断用数据库, 存放提炼后的SCADA数据。使用ADO数据库访问接口访问数据库。Smile是由匹兹堡大学决策系统实验室开发的贝叶斯推理分析开源软件。本系统通过调用Smile的接口函数可高效建立诊断模型, 实现贝叶斯推理。

4.2 原型系统的主要功能

诊断软件原型系统的功能树如图2所示。

1) 软件初始化:检查本地诊断用数据库中电网拓扑信息的内容是否为空。若为空, 调用SCADA接口函数将SCADA数据库中的电网拓扑信息提炼后写入本地诊断用数据库中。

2) 数据获取与建模功能:通过周期扫描保护信息系统数据库, 发现有保护、断路器动作信息后, 启动告警时间窗。将动作时标在该时间窗内的所有保护、断路器的动作信息及时标输入诊断系统。若某电网元件中保护与断路器动作, 则该元件为疑似元件。针对每个疑似元件自动生成TBKB故障诊断模型, 并构造出时序因果关系TCR加以存储。

3) 故障诊断功能:运用基于TCR的时序一致性约束检查方法, 初步划分出时标出错、误动或信息异常的保护、断路器集合。若存在信息缺失情况, 对信息缺失节点做假设状态组合。针对每种组合, 进行贝叶斯反向、正向推理, 判断元件是否故障, 识别误动、拒动的保护、断路器。

4) 图形化显示功能:用文字描述诊断结果;通过分层因果图展示故障的演变过程。

4.3 主要类的设计

TBKB诊断软件原型系统由以下4个类组成。

1) 诊断模型生成类TbkbNet中, 生成元件诊断模型函数CreateNetwork () 构建疑似元件的故障诊断模型, 诊断模型以.dsl的文件格式存储。

2) 故障诊断类TbkbDiag, 包含3个函数:

CheckTcr () 对某可疑元件的动作保护、断路器的时标做TCR检查, 找到满足TCR约束的保护、断路器节点集合。ReasonBayes () 对某一可疑元件做贝叶斯正向、反向推理概率计算。GetFlttime () 根据保护、断路器时标反推出元件故障时刻。

3) TBKB诊断类TBKB, 包含3个主要函数:

构造函数TBKB () 在软件初始化时被调用。CreateChangedTBKB () 在电网拓扑变化或设备检修时被调用, 它读入最新的电网拓扑信息, 通过子函数FindSpCompcode () 根据故障信息找到疑似元件, 再调用类TbkbNet的函数CreateNetwork () 对疑似元件建立TBKB诊断模型。

针对每个疑似元件, 调用TBKB诊断函数DiagComp () , 它依次调用类TbkbDiag中的CheckTcr () , ReasonBayes () 与GetFlttime () 函数。获得诊断结果:故障元件个数、故障元件编号集合、故障元件故障时刻、故障概率;各故障元件下缺失保护、断路器节点编号集合、误动节点编号集合、拒动节点编号集合与时标出错节点编号集合及这4种集合的节点个数。DiagComp () 将诊断结果写入本地数据库以便查询。

4) 图形化显示类Graph的绘制因果图函数PaintGraph () 在DiagComp () 后被调用, 对故障元件分母线、变压器、线路3种类型绘制因果图。

整个软件的数据流如图3所示。

5 原型系统的关键技术

5.1 故障诊断TBKB模型的自动生成方法

TBKB诊断模型构造由网络拓扑结构与变化自动生成、模型中支持节点权重的自动赋值、时序因果关系TCR的自动构建等组成。

根据诊断模型, 将母线作为边bi, 线路及变压器作为节点xi, 断路器作为连接边和节点的连接点ci, 形成电网的母线/支路拓扑图。

TBKB模型节点关系自动生成的步骤如下。

步骤1:获得贝叶斯知识库模型根节点root。

步骤2:通过数据库拓扑表的存储结构查询, 输出root的所有保护作为本级的父节点及root的所有连接点c作为本级的子节点。

步骤3:搜索、遍历与步骤2中得到的连接点相邻的下一级节点xi, 若root与xi不为同一支多重回路, 则输出节点xi根节点侧对应保护作为本级的父节点, 连接点c作为本级的子节点。

步骤4:在失灵保护作用的连接点后插入失灵保护作为本级父节点, 其断路器作为子节点。

步骤5:根据以上步骤的输出结果, 生成TBKB模型节点关系, 并存入本地诊断用数据库。

从本地诊断用数据库中得到TBKB模型节点关系, 针对每个疑似元件, 依次生成元件模型的每层状态节点、支持节点及权重, 构造各层之间的时序约束。具体做法如下。

1) 扫描本地诊断用数据库, 通过元件编号找到疑似元件及其下属的保护、断路器信息。针对该元件, 本软件调用Smile接口为其定义网络模型对象theNet, 分元件层、本元件保护层、本元件断路器层、远后备保护层、远后备断路器层等, 逐层生成模型。调用Smile的AddNode () 函数创建节点, AddArc () 函数构建节点之间的有向连接。

2) 为每个节点构造条件概率值对象theCpt, 用来存放该节点与前继节点之间转换的权重值, 可根据本地诊断用数据库中权重, 配置表格中的内容与节点之间的动作逻辑自动赋值。

3) 根据本地诊断用数据库中TCR时序约束配置表格中的内容, 为模型中层与层之间构造时序约束, 存入该元件的时序约束数组中。

4) 构造拓扑关系与权重的电网诊断模型, 通过Smile的WriteFile () 接口以.dsl文件格式输出。

5.2 TBKB电网故障诊断算法的软件实现

1) 时序约束一致性检查。将动作保护与断路器存入动作集合数组A[], 通过TCR时序约束一致性检查处理故障信息, 获得TCR约束满足集合数组R[]、时序约束不满足集合数组Twrong[]。

2) 对缺失信息的状态进行假设。对信息缺失集合数组Miss[]中保护、断路器的动作状态进行假设与组合, 形成假设状态组合集合数组S[][]。

3) 判断故障元件。首先通过调用Smile接口ReadFile () 读入已建立的电网故障诊断模型, 进而用SetEvidence () 接口设置证据集合中保护、断路器状态值, 用UpdateBeliefs () 根据贝叶斯概率计算公式更新网络中连接到元件节点下的概率值矩阵, 读取元件的故障概率。在贝叶斯正向推理时, 用SetEvidence () 接口为故障元件赋状态1, 根据证据集合为该保护或断路器的前继节点赋值, 用UpdateBeliefs () 更新网络后, 读取保护、断路器的期望动作概率, 根据报警信息中保护与断路器的实际动作信息及它们的期望动作概率, 判断出拒动、误动或信息异常的保护、断路器。

5.3 以因果图图形化表达诊断结果的设计

本文根据TBKB诊断模型, 对其改造, 提出了一种分层因果图对诊断结果可视化表达。该因果图将TBKB诊断模型中两个I节点经由S节点的连接方式改为它们直接连接, 不显示S节点, 只显示某I节点的一个状态节点 (I1或I0节点) 。

第1层为元件故障状态I1节点。

第2层为本元件保护层。元件故障时保护正常动作或拒动的逻辑。元件故障时主保护正常动作, 后备保护误动的动作逻辑。第2层各个I节点的前继节点都为元件故障状态I1节点。

第3层为本元件断路器层。本元件保护正常动作或误动作情况下, 断路器正常动作或拒动的动作逻辑。第3层断路器I节点的前继节点为触发其跳闸的第2层保护动作I1节点。

第4层为远后备保护层。元件故障, 断路器拒动下远后备保护动作的动作逻辑;断路器切除故障, 远后备保护误动作;第5层远后备断路器误动, 远后备保护不动作。第4层的前继节点为拒动的第3层断路器I节点。

第5层为远后备断路器层。远后备保护正常动作或误动作下断路器动作的动作逻辑;远后备保护未动作, 断路器误动的动作逻辑。该层只显示断路器跳闸I1节点。第5层的前继节点为触发其动作的第4层远后备保护I节点。

设母线B3故障、断路器CB13拒动、CB32误动、CB19时标出错, B3的因果图如图4所示。

图4中第1层为母线故障状态I1节点。第2层为元件故障时正常动作主保护动作I1节点。第3层为正常动作跳开的各断路器动作I1节点及拒动I0节点“CB13=0”。第4层为CB13拒动下动作的远后备保护I1节点。线路L1左侧远后备L1Ls动作跳开CB7, 线路L6右侧远后备L6Rs动作跳开CB31。在CB19正常跳开但时标出错情况下, 线路L5右侧远后备保护L5Rs不应该动作, 其控制的CB32动作属于误动或信息异常。

本软件通过对I节点的背景色揭示其在演变中实际状态与判断结果。对保护与断路器节点, 正常动作背景为白, 信息缺失为网格, 误动或信息异常为绿色, 拒动为红色, 时标出错为黄色。

6 诊断软件的运行结果

算例1:单重故障, 含保护、断路器拒动、误动及时标出错。

报警信息中保护、断路器动作及其相对于基准时间的时刻为:B3m (120ms) , CB12 (150ms) , CB14 (151ms) , CB15 (152 ms) , L1Ls (4 480 ms) , L6Rs (4 490 ms) , CB7 (4 510 ms) , CB31 (4 520ms) , CB32 (4 540 ms) , CB19 (5 000 ms) 。基准时刻为2012-10-18T15:03:50:000。

该算例推理过程见附录A的A2节。运行诊断软件原型系统, 在主界面读取SCADA系统中保护、断路器动作信息及时标, 具体诊断如附录A图A5所示。

点击诊断按钮获得本次故障的诊断结果, 如保护、断路器诊断信息、故障元件因果图, 见附录A图A6至图A8。图A6显示故障元件名、其故障概率以及故障可能发生的时间区间的起点时刻与终点时刻。在本例中故障元件为母线B3, 故障概率0.999, 故障时刻为2012-10-18T15:03:50:080至15:03:50:110。

附录A图A7显示某故障元件下信息缺失、保护与断路器的误动或异常、拒动、时标出错等诊断结果的文字描述。本例中, 在母线B3故障下断路器CB13拒动。断路器CB19正确动作, 但是其时标出错, 断路器CB32属于误动或信息异常。

附录A图A8为B3被判为故障元件的因果图显示界面, 可在界面上选择不同类型元件, 显示诊断后元件故障、保护、断路器动作之间关系与演变。

点击界面清空按钮, 将本次诊断结果显示清空, 以便下个故障诊断。每次诊断结果都写入本地诊断用数据库加以存储, 方便以后查询。

算例2:多重故障, 含多个信息缺失与拒动保护、断路器。

保护、断路器动作相对时刻:B1m (0 ms) , L1Lm (10 ms) , CB4 (30 ms) , CB5 (31 ms) , CB6 (32ms) , CB7 (35 ms) , CB7 (35 ms) , L1Rp (760ms) , CB9 (-1ms) , CB11 (-1ms) , -1ms表示信息缺失。基准时刻为2012-10-22T19:03:50:000。

诊断结果为CB9, CB11信息缺失, 母线B1故障, 故障时刻为2012-10-22T19:03:49:960至19:03:49:990。线路L1故障, 故障时刻为2012-10-22T19:03:49:970至19:03:50:000, L1Rm拒动。软件运行结果如附录A图A9至图A13所示。

运用本文原型系统对有保护与断路器误动、拒动、信息缺失的多组单一故障、多重故障情形进行诊断, 都得到了正确结果。

该原型系统运行在主频为2.1GHz双核CPU、内存2GB的PC机, 诊断耗时约为50ms。根据电网结构变化自动更新模型实现在线诊断。

7 结论

本文针对TBKB电网故障诊断算法, 定义时序约束与一致性检查有效提高了故障诊断的准确性。考虑故障诊断、运行实施与图形化显示等需求, 开发了一套计及时序在线电网故障诊断原型系统。该软件各项功能运行正常, 可用于较大规模电网故障诊断。

附录见本刊网络版 (http://www.aeps-info.com/aeps/ch/index.aspx) 。

摘要:为了在故障后辅助调度员准确定位故障元件, 揭示故障发展过程, 文中利用时序信息设计了一种基于时序贝叶斯知识库 (TBKB) 电网故障诊断方法的原型系统。该诊断方法利用元件故障与保护动作、保护动作与相应断路器跳闸等之间的因果关系与时序关系, 建立电网故障诊断模型, 通过时序约束一致性检查方法, 检查保护、断路器动作的时序。针对信息缺失情况进行状态假设, 形成假设状态组合。通过贝叶斯推理, 判断故障元件、误动与拒动的保护与断路器。根据此原理设计的原型系统, 包括数据获取、TBKB模型建立、故障诊断推理、分层因果图显示等模块, 给出了TBKB诊断模型自动生成、诊断算法实现、分层因果图的构造与显示等关键技术的实现。该原型系统为电网故障诊断的工程应用提供了参考。

贝叶斯公式的应用 第4篇

设试验E的样本空间为S。A为E的事件, B1, B2, …, Bn为S的一个划分, 且P (A) >0, P (Bi) >0 (i=1, 2, …, n) , 则:

2 贝叶斯公式的应用

2.1 在产品检测中的应用

例1某汽车制造厂所用的汽车离合器是由四家不同的汽车零件制造厂提供的, 根据以往的数据分析得以下数据:

已知在汽车制造厂的零件储藏室里由这四家汽车零件制造厂提供的离合器是均匀的混在一起放置的, 且外观没有任何区别。

1) 随机在储藏室里取一个离合器, 求此离合器为次品的概率。

2) 随机在储藏室里取一个离合器, 若取到的离合器是一件次品, 请分析此次品出自何厂的几率最大。

解:设A表示“取到的是次品”。

Bi表示“取到的产品是第i家汽车零件制造厂提供的”, i=1, 2, 3。

则有P (B1) =0.2, P (B2) =0.3, P (B3) =0.3, P (B4) =0.2,

1) 由全概率公式:

故随机在储藏室里取一个离合器, 求此离合器为次品的概率。

2) 由贝叶斯公式得:

根据计算得的结果分析得, 此次品出自第二家汽车零件制造厂的几率最大。

2.2在日常生活中的应用

例2某人下午5:30下班, 他所积累的资料表明:

某一天他掷一颗骰子来决定乘地铁还是乘汽车回家, 掷出骰子结果若是小的数 (1, 2, 3) , 他就乘汽车, 若是大的数 (4, 5, 6) , 他就乘地铁, 已知他是6:47到家的, 求此人是乘汽车回家的概率。

解:设A表示“乘汽车”;B表示“乘地铁”;C表示“6:45-6:50到家”。

由贝叶斯公式有:

2.3 在医疗检测中的应用

例3某地被测验的居民中有0.6%是癌症患者, 利用某种诊断癌症的试验来检测有如下效果:试验反应呈阳性的患病概率为0.94, 而未患病且试验反应呈阴性、假阴性、假阳性的概率为0.94。若当地一名居民的试验结果呈阳性, 那么该居民的患病概率有多大?

解:设事件A表示“试验结果呈阳性”;事件B表示“被试验者患有癌症”。则有:

由贝叶斯公式得:

故该居民的患病概率约为0.086。

2.4 在概率推理中的应用

例4已知一个位于英国的发报台分别以概率0.6和0.4发出信号“0”和“1”, 由于通讯系统收到了某些信号的干扰, 当发出信号“0”时, 收报台未必收到信号“0”, 而是分别以0.8和0.2的概率收到“0”和“1”;同样, 发出信号“1”时分别以0.9和0.1的概率收到“1”和“0”.如果收报台收到“0”, 求它没收错的概率是多少?

于是,

由贝叶斯公式, 得:

即收报台没收错信号的概率为0.923。

3 总结

在解决一些医疗检测、产品检测、概率推理、日常生活等一系列复杂的问题中, 贝叶斯公式为我们提供了更有价值、更快捷有效的决策信息, 成为我们解决复杂概率问题的有效工具。

参考文献

[1]王君.贝叶斯公式应用教学的一种新设计[J].新疆师范大学学报:自然科学版, 2011, 4 (4) :71-74.

[2]张丽, 闫善文, 刘亚东.全概率公式与贝叶斯公式的应用及推广[J].牡丹江师范学院学报:自然科学, 2006, 01:15-17.

基于贝叶斯网络的试卷分析 第5篇

1 贝叶斯网络与因果推理

贝叶斯网络又称为置信网络, 是基于概率分析、图论的一种不确定性知识的表达和推理模型。一个典型的贝叶斯网络由两部分组成: (1) 有向无环的图, 其中每一个节点代表一个变量、属性、状态或其他的实体, 节点之间的弧反映了变量间的依赖关系, 指向节点X的所有节点被称为X的父节点。 (2) 与每个节点相联系的条件概率表列出了此节点相对于其父节点所有可能的条件概率。贝叶斯网络约定以节点Vi的父节点为条件, Vi与任意非Vi子节点条件独立。

2 利用BNT软件包分析试卷

在此次的试卷分析试验中, 以过去学生的期末考试成绩为依托, 随机抽取了一部分学生的考试信息作为此次试验的原始数据。利用软件筛选、整理这些数据, 然后通过基于MATLAB语言开发的关于贝叶斯网络学习的BNT软件包建模, 主要完成建立贝叶斯网络的工作, 以此来反映选定因素对试卷成绩的影响。影响试卷成绩的因素主要有:A——作业提交率、B——上课出勤率、C——否是留级生、D——主观题得分率和E——客观题得分率。

2.1 为试卷分析筛选数据

第一步:把影响试卷的因素作为变量, 即贝叶斯网络模型中的节点, 得到的候选数据集如表1所示。其中, R (is pass) 标记为该样本的状态值, “1”表示成绩及格, “0”表示成绩不及格。

第二步:由于贝叶斯网络是用离散型变量, 因此, 对原始数据进行处理, 数据离散处理结果如表2所示。

例如离散处理“上课出勤率”这一变量。根据教学经验, 一般同学的出勤率都在90%以上, 如果低于70%, 学习成绩很可能不理想, 所以, 将变量B分为3段——小于70%为low, 70%~90%为mid, 大于90%为high。

第三步:数据格式转换。

根据MATLAB的特点, 将数据集转换为矩阵的形式, 而且所有属性的取值全部依次编号为1, 2, 3.

以由此得到的样本数据集作为模型数据集来构造模型。

2.2 贝叶斯网络的建模

接下来的工作就是以得到的数据建立贝叶斯网络, 然后对得到的贝叶斯网络进行参数学习。从得到的贝叶斯网络和学习得到的参数中可以看出选定的因素对试卷的影响。

经过实践, 笔者得到的结果是:“上课出勤率”和“作业提交率”是影响其他因素的原因, 而“上课出勤率”又可以影响到“作业提交”, 这是与限制了父节点个数的结果相同的部分, 不同的是: (1) “是否是留级生”又影响了“客观题得分率”和“主观题得分率”两项。如果出现这样的结果, 不难看出, 留级生在考试分数上和正班生还是有一定差距的。 (2) “主观题得分率”影响了“是否及格”这一项。出现这种结果是因为在统计数据时, 主观题分值占了60%.

从以上试验结果的数据中可以看出, 作业提交率和上课出勤率对其他三个因素的影响。

3 结论

对试验结果分析后发现, 得到的结果基本符合实际情况。学生的“上课出勤率”和“作业提交率”是影响其学习成绩的重要因素。由此可见, 知识是平时一点一滴积累起来的, 即便是在大学校园, 在日常教学过程中, 也应加强对学生的纪律管理, 督促学生按部就班地学习。

参考文献

贝叶斯算法实现文本分类器 第6篇

上世纪九十年代以来, 计算机和信息技术发展迅速, 各类信息以级数倍的速度在Internet上广泛传播, 尤其是种类繁多的文本信息。因此如何在众多文本中掌握最有效的信息始终是信息处理的目标。基于人工智能技术的文本分类系统能依据文本的语义将大量的文本自动分门别类, 从而帮助人们更好地把握文本信息。近年来, 文本分类技术已经逐渐与搜索引擎、信息推送、信息过滤等信息处理技术相结合, 有效地提高了信息服务的质量。

贝叶斯分类器是基于贝叶斯学习方法的分类器, 其原理虽然较简单, 但是其在实际应用中很成功。贝叶斯模型中的朴素贝叶斯算法有一个很重要的假设, 即属性间的条件独立。

(二) 贝叶斯相关理论

1. 条件概率

条件概率定义为:设A, B是两个事件, 且P (A) >0称为在条件A下发生的条件事件B发生的条件概率。

乘法公式:设P (A) >0则有P (AB) =P (B|A) P (A) 。

2. 全概率公式和贝叶斯公式

设S为试验E的样本空间, 为E的一组事件, 若则称为样本空间的一个划分。

全概率公式定义为:设试验E的样本空间为A, A为E的事件, B1, B 2, ....Bn为A的一个划分, 且, 则。

贝叶斯公式定义为:设试验E的样本空间为A, A为E的事件, 为A的一个划分, 则。

其中i, j均为下标, 求和均是1到n。

(三) 贝叶斯分类器设计

贝叶斯文本分类模型是一种典型的基于统计方法的分类模型, 它利用先验信息和样本数据信息来确定事件的后验概率。

1. 贝叶斯分类描述

根据贝叶斯公式:

可知贝叶斯文本分类的任务是将表示成为向量的待分类文本归类到与其关联最为紧密的类别中去。其中为待分类文本Xq的特征向量, 为给定的类别体系。求解向量属于给定类别的概率值, 其中pj为属于Cj的概率, 则max所对应的类别为文本X所属的类别, 因此分类问题被描述为求解方程 (2) 式的最大值。

其中——训练文本集中, 文本属于类别cj的概率;——如果待分类文本属于类别cj, 则类别cj中包含向量的概率;——给定的所有类别的联合概率。

显然, 对于给定的所有类别, 分母是一个常数, 所以求解 (2) 式的最大值转化为求解下式的最大值, 即

又根据贝叶斯假设, 文本特征向量属性x1, x2, ......xn独立同分布, 其联合概率分布等于各个属性特征概率分布的乘积, 即

所以 (3) 式变为:

即为所求解的用以分类的分类函数。

尽管推导出了分类函数, 但是分类函数中的概率值还是未知的, 因此, 为了计算分类函数的最大值, (5) 式中的先验概率值分别估算如下。

其中, ——训练文本中属于cj类别的文本数量;N——训练文本集总数量。

其中, ——类别cj中包含属性xi的训练文本数量;N (C=cj) ——类别中的训练文本数量;M——训练文本集合中经过踢出无用词去除文本预处理之后关键字的数量。

2. 朴素贝叶斯分类器算法

朴素贝叶斯分类器算法假定各待分类文本特征向量相互独立。相互独立表明所有特征向量之间的表述没有关联, 有利于计算。以下为朴素贝叶斯分类器算法步骤。

(1) 待分类文本利用分词工具形成待分类文本特征向量, 利用常用词向量净化待分类文本特征向量, 使其消除冗余和常用词, 形成新的待分类文本特征向量。

(2) 通过对属性在C1类训练文本集中进行查找, 计算出属性在C1类训练文本集中出现的次数集属性分别除以C1类训练集总文本数和训练文本集中经过踢出无用词去除文本预处理之后关键字的数量之和, 得到在C1类训练文本中出现的概率集。把中的属性相乘得到在C1类训练文本集中出现的先验概率P (x|c1) 。

(3) C1类训练文本集中的文件数量除以整个训练文本集的总数得到先验概率得到在C1类训练文本集中的后验概率。

(4) 重复2、3步骤计算出所有类别的后验概率。

(5) 根据步骤4得出的结果比较出最大的后验概率P (cj|x) , Cj类就是所属类别。

3. 朴素贝叶斯分类器

根据朴素贝叶斯分类器算法使用Java为开发语言, Tomcat为服务器, 采用B/S模型进行实现。以下是得到待分类文本向量后验概率的主要实现代码。

(四) 测试数据和实验结果

作为测试, 本文选用Sogou实验室的文本分类数据, 并使用了mini版本。迷你版本有10个类别, 共计100篇文章, 总大小244KB。

使用的测试文本:

东方网10月8日消息:华盛顿时报6日报道称, 中国最近秘密进行了一次远程导弹飞行试验。据中国军事专家称, 9月25日的试验再次凸显北京远程和近程弹道导弹、巡航导弹及新式导弹防御拦截弹所能够造成的威胁越来越大。

报道称, 一名美国官员证实, 中国军方从北京西南方约320英里处的太原导弹中心向西部约1800英里处的库尔勒市试射了一枚导弹。中国官方未提供详细信息, 称试验数据属于机密。

亚洲和美国的中国观察者于9月23日意识到了此次试射活动, 当时中国政府发布了“飞行通告”, 警告飞机在9月25日前远离从太原到库尔勒的空域通道。

使用mini版本的测试结果:

结果显示, 军事类别的后验概率为2.532662E-2, 是所有类别中最大的, 所以测试文章属于军事类别。最后经过400篇不同文章测试, 分类器分类结果正确率达到83%以上, 实现文本分类作用。

(五) 结语

通过贝叶斯算法实现文本分类, 是一种简单而有效的方法。根据测试的结果, 已基本实现简单文本分类。但是, 通过对大容量的文章测试, 会得到大量的分词单元, 严重的影响系统的处理能力, 使系统效率严重低下。

参考文献

[1]Tom M Mitchell.机器学习[M].曾华军, 等译.北京:机械工业出版社, 2003.

[2]梅馨, 刑桂芬.文本挖掘技术综述[J].河北大学学报, 2003, 24 (5) .

[3]韩家炜, 等.数据挖掘概念与技术[M].北京:机械工业出版社, 2001.

[4]王灏, 黄厚宽, 田盛丰.文本分类实现技术[J].广西师范大学学报, 2003, 21 (s1) :173-179.

实例讨论朴素贝叶斯模型及其缺陷 第7篇

一、两种模型

想要知道一只羊是绵羊还是山羊,可以从判别模型的方法来分析,从数据中来判别,然后通过观察这只羊的特征来预测这只羊是哪一种羊的概率。也就是说我们可以根据山羊的特征来学习一个山羊模型,再根据绵羊特征学习一个绵羊模型。最后从这只羊的特征中进行提取,放到山羊模型中看概率是多少,再放绵羊模型中看概率是多少,谁的概率大就是谁.

常见的判别模型有线性回归、对数回归、线性判别分析等等.常见的生成模型有朴素贝叶斯模型,高斯混合模型等等.

接下来我们重点介绍朴素贝叶斯模型.

二、朴素贝叶斯模型

假设要分类正常邮件和垃圾邮件,分类邮件是文本分类的一种应用.

假设采用最简单的特征描述方法,首先找一部英语词典,将里面的单词全部列出来。然后将每封邮件表示成一个向量,向量中每一维都是字典中的一个词的0/1值,1表示该词在邮件中出现,0表示未出现.

比如一封邮件中出现了“a”和“b u y”,没有出现“aardvark”、“aardwolf”和“zygmurgy”,那么可以形式化表示为:

假设字典中总共有5000个词,那么x是5000维的。这时候如果要建立多项式分布模型(二项分布的扩展).

某随机实验中有k个可能结果A1,A2,…,AK,它们概率分布分别是k,,,ppp21(43),那么在N次采样的结果中,A1出现n1次,而A2出现n2次,……,AK出现nk次,这个事件出现的概率公式为:

我们看出朴素贝叶斯假设是约束性很强的假设,“buy”一般来讲与“price”有关系,而我们假设条件独立.

于是建立模型的形式来表示:

想要数据上概率的乘积能最大,求最大似然估计为:

联合概率分布乘积最大,说明朴素贝叶斯是生成模型.

最后的式子是表示y=1的样本数占全部样本数的比例,前两个表示在y=01或的样本中,特征=1yX的比例.

而我们的要求是:

求出分子或分母,结论都是一样的。

如果把朴素贝叶斯方法扩展到x和y都有多个离散值的情况,对特特征是连续值的情况,可以采取分段的方式将连续值化为离散值,再采用信息增益的度量方法来转化为最优,这里不再叙述.

三、朴素贝叶斯的缺陷(拉普拉斯平滑)

朴素贝叶斯方法有个很明显且致命的缺陷,那就是对数据稀疏问题太敏感.

例如前面提到邮件分类,如果现在来了一封新邮件,标题为“NIPScallforpapers”。使用更大的网络字典(数目由5000变成35000)来分类,假设NIPS这个词在字典中的位置是35000。然而NIPS这个词没有在数据中出现过,这封邮件第一次出现了NIPS.那我们计算概率:

由于NIPS在以前的两种邮件(垃圾与正常)都没出现过,那么结果就是0.显然最后条件概率也是0.

因为我们特征概率条件独立,使用的是相乘来得到结果.

为了解决这个问题,给未出现的特征值,赋予一个小的值,而不是0.

具体的平滑方法:

假设离散型随机变量z有(1,2,3……k)个数.我们用来表示每个数的概率.假设有m个训练样本,z的观测值是,其中每一个观察值对应k个数中的一个.则根据原来的估计方法得到:

回到邮件分类的问题,则修改后的公式为:

案例式贝叶斯公式教学研究 第8篇

在“概率论与数理统计”课程中,贝叶斯公式是重要的公式之一.在医学、信息传递、生产、侦破案件、个人信用、诉讼与网络安全等方面贝叶斯公式有着非常广泛的应用,具有广泛的研究前景.公式涉及条件概率公式、全概率公式与乘法公式等重要公式,复杂难记、与全概率公式难于区分,是概率论课程教学中的一个重点,同时也是一个难点.学生短时间内难以理解,为使学生掌握公式并能很好的运用公式解决问题,不少教师对其进行了教学方法上探讨.案例式教学是一种有效的教学方法,它以案例为基础,在特定的情境中,引导学生积极分析问题与解决问题,并促使学生充分理解问题的复杂性与多样性.本文从基于史实的案例出发,逐步深入,由案例导入贝叶斯公式,并利用贝叶斯公式对相关模型和应用进行分析求解.

2.案例导入与分析

1968年5月22日,美国“天蝎号”核潜艇失事沉没.为了寻找天蝎号的位置,美海军基于“贝叶斯公式”制定了搜索方案,最终找到了“天蝎号”核潜艇.

基于这一史实,简化问题,考虑如下案例

如果现搜索甲区域后未找到核潜艇,“天蝎号”沉没于甲区域的概率是多少?

设事件A表示搜索甲未找到核潜艇,事件B1,B2,B3分别表示核潜艇沉没在甲、乙、丙三个区域.因此由案例中的两组数据可知:

现需要知道事件A发生条件下,事件B1,B2,B3发生的概率.这是一个条件概率,依据条件概率公式,

由讨论可知,当一个事件已经发生时,可以利用条件概率公式、乘法公式和全概率公式,去求导致这一事件发生的各种诱因的可能性大小.一般化(1)式便得到贝叶斯公式.

3.贝叶斯公式引入与应用

定理1设试验E的样本空间为S,A为E的事件,B1,B2,…,Bn为样本空间S的一个划分,且P(A)>0,P(Bi)>0,(i=1,2,…,n),则

(2)式称为贝叶斯公式或逆概公式.

由案例的讨论可知,Bi(i=1,2,…,n)是导致事件A发生所有的各种不同诱因,P(Bi)(i=1,2,…,n)是在没有进一步信息(事件A没有发生)的情况下各事件Bi(i=1,2,…,n)发生的概率,即在试验以前(事件A发生前)就已经知道的概率,所以称它们为先验(先于试验)概率.P(Bi|A)(i=1,2,…,n)反映的是在试验以后,即从事件A的发生获得新的信息或者经验后,人们对各事件Bi(i=1,2,…,n)发生概率的再认识,通常称为后验概率.人们可以利用后验概率的大小,作出新的判断,推测在新的信息条件下最有可能是哪一个诱因导致事件A发生的,此即为贝叶斯推断.

利用贝叶斯公式讨论如下的可靠性问题.

例1某无人设施安装有自动报警装置,工作人员调试后,称自动报警装置工作正常的可能性为98%.已知工作正常的装置误报警的可能性为0.05,工作不正常的装置误报警的可能性为0.96.该装置连续两次误报警,那么该装置工作正常的可能性是多少?

解设事件A装置误报警,事件B表示自动报警装置工作正常.由已知有

由(2)式,在第一次误报警后

即第一次报警后,对该装置工作正常可能性的可能性有了新的认识,即正常工作的可能性约为0.7184.

将其作为新的P(B),第二次误报警后,再一次应用(2)式,可得新的P(B|A)≈0.1173.

即第二次报警后,对该装置工作正常可能性的可能性又有了新的认识,即正常工作的可能性约为0.1173.装置正常工作的可能性大大降低了.实际上,如果该装置再误报警一次,由(2)式可类似求得此时装置正常工作的可能性约为0.0069,几乎可以确定该装置不能正常工作了.

4.结语

基于史实引入案例,激发学生的参与讨论学习的兴趣.通过案例分析自然导入贝叶斯公式,结合案例与贝叶斯公式,揭示了贝叶斯公式本身蕴含了深刻的思想,帮助学生深刻理解了先验概率与后验概率的相互转化.通过应用,加深了学生对贝叶斯公式的理解与认识,使其掌握住公式的实质.“由因索果”的全概率公式,是贝叶斯公式的一部分;在已知一事件发生的情况下,需要对导致该事件发生所有的各种不同诱因进行再认识时,则用“由果索因”用贝叶斯公式.

参考文献

[1]李国华.贝叶斯公式的应用[J].牡丹江大学学报,2011,20(7):95-96.

[2]宇世航.贝叶斯公式的教学方法[J].高师理科学刊,2011,31(6):87-89.

[3]王君.贝叶斯公式应用教学的一种新设计[J].新疆师范大学学报,2011,30(4):71-74.

[4]刘罗华,汤琼.工科院校大学数学的案例式教学探讨[J].湖南工业大学学报,2010,24(2):80-82.

[5]杨欣.美“天蝎号”核潜艇的沉没[J].大科技,2000,9:30-31.

贝叶斯知识库论文

贝叶斯知识库论文(精选8篇)贝叶斯知识库论文 第1篇一、归纳法问题假说通常都有一个与之想要阐释的经验观察相联系的一般特征。若信息都来...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部