电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

决策规则范文

来源:火烈鸟作者:开心麻花2025-12-201

决策规则范文(精选10篇)

决策规则 第1篇

Pawlak提出的粗糙集理论 (RSA) [1,2]是一种处理不确定性问题的新型数学工具, 其理论核心是不可区分关系, 目前为止, 已成功应用到图像识别, 数据处理, 智能模拟等领域。

但是在实际背景下, 往往需要基于条件属性对对象进行比较或者排序, Greco等提出优势关系粗糙集模型 (DRSA) [3,4]。DRSA的一个重要研究领域是序决策信息系统的优化规则获取。骆公志等[5]定义了限制扩展优势关系, 给出粗糙近似, 进而获取分类决策规则;谢军等[6]提出了二种描述子的概念, 讨论了利用定义相对约简及获取优化决策规则的问题;宋笑雪等[7]利用定义的相容关系和优势关系, 提出了广义决策约简的概念, 用来获取广义的优化决策规则。杨习贝等[8]在不完备序信息系统中提出了相似优势关系, 而后利用相似优势关系定义了相应的知识约简以获取优化决策规则, 并给出了最优可信决策规则的获取方法;钱宇华, 梁吉业等[9]通过引入新的排序方法, 研究了区间值序决策信息系统的优化规则获取问题;杜蕾, 管延勇等[10]通过定义模糊近似, 讨论了模糊目标序信息系统的优化决策规则获取问题。

极小决策规则的获取对于信息系统的分析意义重大。目前对于DRSA而言, 极小决策规则获取的主要途径是利用启发示算法, 但是启发示算法只能找到决策信息系统中的部分极小决策规则。本文将研究序决策信息系统中利用区分函数及属性约简来导出极小决策规则的问题。首先, 定义初等极小对象集来获取序决策信息系统的初等极小决策规则, 而后通过构造区分函数及属性约简来优化初等极小决策规则, 最后, 利用向量来定义决策规则, 通过向量运算来获取极小决策规则。

2 基本概念

定义2.1[1]信息系统可记为S= (U, AT, V, f) , U={x1, x2, xn}称为论域;AT为属性集且AT≠覫;V=∪a∈ATVa, Va表示a的取值范围;f:U×AT→V是信息函数, 即坌x∈AT, f (x, a) ∈Va。亦记f (x, a) =a (x) 。

一般来说, 在一个信息系统S中, 若AT=C∪D, 则S称为决策信息系统。在这决策信息系统中, C={c1, c2, …cm}表示条件属性, D表示决策属性, 且满足C∩D=覫。不失一般性, 设D={d}, Vd={1, 2, …, r}。由d确定的U的划分一般记为{D1, D2, …, Dr}。

定义2.3[3,4]在序决策信息系统S= (U, C∪{d}, V, f) 中, 对于B哿C,

称[x]B≥和[x]B≤分别是x关于条件属性B的支配集和被支配集。

3 初等极小决策规则的获取

定义3.1[4]令S= (U, C∪{d}, V, f) 表示序决策信息系统, 极小决策规则可用蕴含式来定义, 在S中找不到任何其他的决策规则能够蕴含它的规则。初等极小决策规则可定义为前件包含所有条件属性, 在S中找不到任何其他的决策规则能够蕴含它的规则。

定义3.3在序决策信息系统中, 对t∈T=Vd, 且2≤t≤r-1, 记

若y≥Cx, 则d (y) ≥t, 或∧c∈C (c, ≥, c (x) ) → (d, ≥, t) 。

下面, 通过定义属性约简及构造区分函数来获取优化的决策规则。

对x, y∈U, 记a (y, x) ={c|c∈C, c (y) <c (x) }。

下面构造优势关系区分函数计算上面定义的约简, 首先给出判定定理3.1。

例3.1求下表所示的信息系统的初等极小决策规则并优化。

由A2C={x1, x4}可导出如下的初等极小决策规则:

(3) 对于x∈min A3C, x∈min A2C, 利用区分函数得到Δx。

(4) 由Δ (x3) =a1∨a2∨a3可导出如下的优化决策规则:

由Δ (x1) =a3∨a4可导出如下的优化决策规则:

由Δ (x4) = (a1∧a4) ∨a3可导出如下的优化决策规则:

为了清除得到的优化决策规则之间的蕴含关系, 获取极小决策规则, 将决策规则用向量来表示, 例如:决策规则 (a1, ≥, 0.90) →d≥3可用向量 (0.90, *, *, *|3) 表示。 (0.90, *, *, *|3) 称为一个规则向量。因此, 例3.1导出的优化初等决策规则可表示为:

定义3.6假设μ和ν是二组规则向量, 若对于ui≠*, 有νi≠*, 且ui≤νi, 并且dμ≥dν, 则称μ蕴含ν, 记μ→ν。否则, 记μ→ν。若μ和ν互相之间无蕴含关系, 则记μ圮ν。

例如: (1, *, 3|3) → (1, *, 5|3) , (1, *, 3|3) → (1, *, 5|2) , (1, *, *|3) → (*, *, 3|3) 。

根据上面的定义3.7, 例3.1决策表中导出的优化的决策规则生成的七组规则向量, 消除规则向量之间的蕴含关系, 得极小规则向量: (0.85, *, *, *|3) , (*, 0.95, *, *|3) , (*, *, 0.90, *|3) , (*, *, *, 0.90|2) , (0.60, *, *, 0.50|2) , (*, *, 0.40, *|2) 。

根据规则向量与决策规则之间的对应关系, 可以得到例3.1的极小决策规则:

4 结论

文章通过定义初等极小对象集获取序决策信息系统的初等极小决策规则, 利用区分函数优化初等极小决策规则。为获取极小决策规则, 引用向量来定义决策规则, 将获取极小决策规则的问题转化成求极小规则向量的问题。后续工作中, 将讨论不完备序信息系统的极小决策规则的获取问题。

参考文献

[1]PAWLAK Z.Rough sets.International Journal of Computer and Information Science[J].1982, 11:341-356.

[2]PAWLAK Z.Rough sets:Theoretical aspects of reasoning about data[M].London:Kluwer Academic Publishers, 1991.

[3]GRECO S, MATARAZZO B, SLOWINSKI R.A new rough set approach to evaluation of bankruptcy risk.In:C.Zopounidis (ed.) , Operational tools in the management of financial risks[C].Dordrecht:Kluwer Academic Publishers, 1998, pp:121-136.

[4]GRECO S, MATARAZZO B, SLOWINSKI R.Rough approximation by dominance relation[J].International Journal of Intelligent Systems, 2002, 17:153-171.

[5]骆公志, 杨晓江, 周德群.基于限制扩展优势关系的粗糙决策分析模型[J].系统管理学报, 2009, 18 (4) :391-396.

[6]谢军, 杨习贝, 孙怀江等.序值决策系统中基于描述子的可信规则获取[J].系统工程理论与实践, 2009, 29 (7) :105-112.

[7]宋笑雪, 解争龙, 张文修.集值决策信息系统的知识约简与规则提取[J].计算机科学, 2007, 34 (4) :182-191.

[8]YANG X B, YANG J Y, WU C et al.Dominance-based rough set approach and knowledge reduct in incomplete ordered information system[J].Information Sciences, 2008, 178:1219-1234.

[9]QIAN Y H, LIANG J Y, DANG C Y.Interval ordered information systems[J].Computers and Mathematics with Applications, 2008, 56:1994-2009.

党委议事决策议事规则 第2篇

为坚持和健全党的 民主集中制原则和集体领导制度,更好的发挥党委会在处理日常工作中的决策和保证监督作用,根据党内有关法规和党的十五大精神,结合学校的实际,特制订本议事规则。

一、议事原则

1、坚持认真贯彻党的基本路线和基本方针、维护大局的原则。在重大问题上同党中央保持一致,保证上级组织政令畅通。

2、坚持解放思想、实事求是的原则。注意运用马克思主义的基本立场和方法分析和解决问题,创造性地开展工作,讲实话、讲真话,在充分发表意见的基础上,形成符合实际的正确决策。

3、坚持民主集中制原则。坚持民主基础上的集中和集中指导下的民主相结合,防止个人说了算和极端民主化的两种倾向。对重大问题实行一人一票表决制,允许发表各种 不同的意见,严格按少数服从多数的原则作出决定。

4、坚持集体领导和个人分工负责相结合的原则。凡属党委会职责范围内决定的问题,必须由集体讨论决定,任何个人或少数人无权决定重大问题。个人对集体作出的决定如有不同意见,在坚决执行的前提下,可以保留意见,也可以向上级组织报告。每个成员对分管的工作要敢于负责,切实履行职责;对不属于自己分管的工作也要关心,主动提出意见和建议。

5、坚持保密原则。对应该保密的会议内容和讨论情况,与会人员必须严守秘密,不得泄露。

二、议事内容

1、贯彻执行党的路线、方针、政策和上级党组织指示、决议的主要措施;2、加强党的建设的规划措施及重要问题;

3、加强精神文明建设的规划措施;

4、坚强和改进党的思想政治工作的重要措施;

5、学校党员大会的组织筹备;

6、学校干部的管理、奖惩等重要制度的制定、修改和废除;

7、报请上级任免的干部,后备干部的确定;

8、学校党风廉政建设的重要问题;

9、校党委和工会、团的机构设置及定员编制;

10、工会工作有关重大问题,主要有:(1)贯彻上级党委对工会工作的重要指示和上级工会的重要决议的意见;(2)学校职代会的有关事宜;(3)报上级表彰命名的劳模、先进工作(生产)者和学校表彰的先进工作(生产)者;(4)工作计划、总结;

11、团委工作有关重大问题,主要有:(1)团代会的有关事宜;(2)工作计划、总结;(3)工作中的重要问题。

12、干部审查中的重要问题;

13、学校党委表彰决定和报请上级表彰的先进党组织和优秀个人;14、党委的工作计划、总结,向上级报送的重要请示、报告;15、党委重要制度的制定、修改、废除;

16、组织发展工作,主要有:发展计划、各支部发展党员工作;17、综合治理、统战工作中的重要问题;

18、其他应由学校党委会议研究的重要问题。

三、议事程序

1、会议组织

(1)党委会一般每月召开一次,遇有重要情况可随时召开;

(2)党委会必须有半数以上成员到会方可召开。讨论干部问题时,应召开党委扩大会(党政领导班子全体成员),必须由党委成员和应到会总人数分别达到三分之二以上方能召开;

(3)党委会由党委书记主持,书记不能参加时,可由书记委托副书记召集并主持。

(4)党委会议应明确议题,议题由会议主持人确定;议题确定后,一般不予变动或临时动议。

2、会前准备

(1)党委有关部门,按照党委会议的议事范围,提出提交党委会议讨论的议题,并由党委办公室指定专人进行收集和整理,送交会议主持人确定。

(2)议题确定后,应提前两天将议题和开会时间、地点通知党委成员和列席人员,并将会议有关材料一并送达。党委成员因故不能参加会议,应在会前请假,其意见可由书面形式表达。

3、召开会议

(1)会议主持人介绍出席和列席人员情况,通报会议议题和开法,按议题顺序逐项进行。

(2)会议讨论问题时,既要充分讨论,集思广益,又要提高议事效率和质量。汇报人要突出重点,简明扼要,实事求是;发言要开门见山,紧扣议题充分发表意见,表明自己的态度。

(3)根据工作需要,会议主持人可确定有关人员(或部门)列席党委会议。列席人员在其议题讨论完毕后,即可退席。

(4)会议进行表决时,赞成票超过应到会人数的半数为通过。召开党委扩大会议讨论决定干部任免时,要逐个表决;赞成票超过与会党委成员半数和与会全体人员半数方可为通过;如原拟人选被否决,应按规定程序重新提出人选,下次会议再议,不得在本次会议临时动议,决定其他人选。

(5)决定重大问题,如发生分歧,双方人数接近时,除了在紧急情况下必须按多数意见执行外,应暂缓作出决定,需进一步调查研究,交换意见,下次再表决。在特殊情况下,可将争论情况向上级组织报告,请求裁决。

(6)党委会由党委办公室指派专人记录,决定有关事项应编发会议纪要。4、组织落实

(1)党委成员要根据会议决议,对自己分工的工作,要制定具体措施,积极组织落实。

决策规则 第3篇

关键词:关联规则算法;新疆高职院校;录取决策

中图分类号:TP311.12 文献标识码:A文章编号:1007-9599 (2011) 15-0000-02

The Research Application of Association Rules Algorithm in XinJiang College Admit Decision

Lu Haiyan,Sha Hongmei

(Yili Vocational Technical College,Yining835000,China)

Abstract:The purpose of this paper is to research the report rate of collage students in XinJiang.The algorithm of association rules was used to mine knowledge in student information databases,with that obtain the rules about factors which influence student’s report rate,and predicted the new classification of the new case report.It has important realistic significance to improve the report rate.

Keywords:Association Rules algorithm;XinJiang college;Admit Decision

每年9月,各新疆高职院校都对新生报到率关心备至,因为新生报到率偏低会影响学院招生计划的完成,造成教学资源的极大浪费。将数据挖掘技术中的关联规则算法应用于录取决策中,挖掘影响学生报到率的规则,预测考生报到可能性,可以为高院院校录取决策提供有效帮助。

一、关联规则的定义

关联规则挖掘算法是一种在许多数据中找出隐藏的关联规则的方法。关联规则常常用一个蕴涵式来表示,如“啤酒=>尿布”。

一个事务数据库中的关联规则挖掘可以描述如下[1]:

设I={i1,i2,…,im}是一个项目集合,事务数据库D={t1,t2,…,tm}是由一系列具有唯一标识TID的事务组成,每个事务ti(i=1,2,…,n)都对应I上的一个子集。

定义1-1设I1 I,项目集(Itemset)I1在数据集D上的支持度(Support)是包含I1的事务在D中所占的百分比。

定义1-2一个定义在I和D上的形如I1=>I的关联规则的置信度(Confidence)是指包含I1和I2的事务数与包含I的事务数之比。其中I1,I2 I,I1∩I2= 。

关联规则就是支持度和置信度分别满足用户给定阈值的规则。

二、关联规则挖掘的一般过程

关联规则挖掘就是通过用户指定的最小支持度,在全部事务数据库中挖掘出满足支持度不小于最小支持度的频繁项目集,再通过用户指定的最小置信度,在全部频繁项目集中挖掘出置信度不小于最小置信度的强关联规则。关联规则挖掘过程由这两部分共同组成。在这两部分中,关联规则挖掘是否成功主要取决于第一部分,即挖掘频繁项目集。

三、挖掘影响新生报到率的规则

以新疆某高职学院新生注册信息库中的样本数据为例,挖掘新生基本属性(性别、考试语种、考生类别、毕业类别、科类、考生生源、高考成绩)与学生报到之间的规则。并根据此规则制定出有效的录取决策,指导录取人员进行录取。经过数据清洗,得到有效数据2989条。

根据近几年该学院的新生报到率,将最小支持度设为0.01,最小置信度设为54%。

表1.各属性人数

属性

录取人数报到人数

男性1288774

女性1701929

汉语言1454737

民语言1535966

城镇应届893458

城镇历届296219

农村应届1268642

农村历届532384

普通高考26311412

“三校生”高考358291

理科20151105

文科974598

生源:疆内外地21231193

生源:疆内本地605404

生源:疆外261106

考分:100-199204156

考分:200-299685401

考分:300-39919731081

考分:400-49912664

考分:500-59911

(一)找出所有频繁项目集

(1)根据Apriori算法,在所有报到学生信息中挑选支持度不小于最小支持度的项目集组成1-频繁项目集L1。L1={性别∈{男,女},考试语种∈{汉语言,民语言},考生类别∈{城镇应届,城镇历届,农村应届,农村历届},毕业类别∈{高中,三校},科类∈{文,理}、考生生源∈{疆内外地,本地,疆外},高考成绩∈{[100-199],[200,299],[300,399],[400-499]}。为了理解方便,将以上集合简写为{男,报到}、{女,报到}、{汉语言,报到}、{民语言,报到}、{城镇应届,报到}、{城镇历届,报到}、{农村应届,报到}、{农村历届,报到}、{高中,报到}、{三校,报到}、{理,报到}、{文,报到}、{疆内外地,报到}、{本地,报到}、{疆外,报到}、{100≦高考成绩<200,报到}、{200≦高考成绩<300,报到}、{300≦高考成绩<400,报到}、{400≦高考成绩<500,报到}。(2)根据Apriori的改进算法-Partition算法,将学生数据库进行划分,每块包含两个属性或一个属性。据此,将学生数据库划分为含有项目{性别,授课语言}、{考生类别,毕业类别}、{科类,考生生源}和{高考成绩}的四个块。根据块中包含的属性,将上一步计算出的项集依照块的属性进行合并,组合成每块的频繁项集。计算合并后的项集的支持度,将支持度不小于0.01的项集挖掘出来。(3)重复(2),两两进行分块。此时学生数据库被分为含有{性别,授课语言,考生类别,毕业类别}和含有{科类,考生生源,高考成绩}的两块。同样的,将上一步中计算出的项集依据分块内容再进行组合,计算它们的支持度。将支持度不小于0.01的项集挖掘出来。(4)重复(3),此时,只剩下一个块,包含了所有的属性值。此时,这个块的频繁项目集就是最终的频繁项目集。

(二)计算频繁项目集对应的规则的置信度

(1)confidence{男,民语言,农村历届,三校,理,本地,200≦高考成绩<299}=>报到=91%;(2)confidence{男,汉语言,城镇应届,高中,理,疆内外地,300≦高考成绩<400}=>报到=45%;(3)confidence{女,汉语言,城镇应届,高中,理,疆内外地,300≦高考成绩<400}=>报到=44%;(4)confidence{男,汉语言,农村应届,高中,理,疆内外地,300≦高考成绩<400}=>报到=48%;(5)confidence{男,民语言,农村应届,高中,理,疆内外地,300≦高考成绩<400}=>报到=65%;(6)confidence{女,汉语言,農村应届,高中,理,疆内外地,300≦高考成绩<400}=>报到=46%;(7)confidence{女,民语言,农村应届,高中,理,疆内外地,300≦高考成绩<400}=>报到=46%;(8)confidence{女,民语言,农村历届,高中,理,疆内外地,300≦高考成绩<400}=>报到=58%;(9)confidence{女,汉语言,城镇应届,高中,文,疆内外地,300≦高考成绩<400}=>报到=58%;(10)confidence{男,民语言,农村应届,高中,文,疆内外地,300≦高考成绩<400}=>报到=54%;(11)confidence{女,汉语言,农村应届,高中,文,疆内外地,300≦高考成绩<400}=>报到=69%;(12)confidence{女,民语言,农村应届,高中,文,疆内外地,300≦高考成绩<400}=>报到=63%;(13)confidence{女,民语言,农村历届,高中,文,疆内外地,300≦高考成绩<400}=>报到=77%。

(三)生成强关联规则

根据事先确定的最小置信度50%,得到8个强关联规则。分别为:(1){男,民语言,农村历届,三校,理,本地,200≦高考成绩<300}=>報到;(2){男,民语言,农村应届,高中,理,疆内外地,300≦高考成绩<400}=>报到;(3){女,民语言,农村历届,高中,理,疆内外地,300≦高考成绩<400}=>报到:(4){女,汉语言,城镇应届,高中,文,疆内外地,300≦高考成绩<400}=>报到;(5){男,民语言,农村应届,高中,文,疆内外地,300≦高考成绩<400}=>报到:(6){女,汉语言,农村应届,高中,文,疆内外地,300≦高考成绩<400}=>报到;(7){女,民语言,农村应届,高中,文,疆内外地,300≦高考成绩<400}=>报到;(8){女,民语言,农村历届,高中,文,疆内外地,300≦高考成绩<400}=>报到。

(四)结果说明及验证

根据以上8个强关联规则,可知基本信息与规则左边属性值相同的学生,报到可能性大。将此规则应用于今后的录取现场时,录取人员可在同等条件下可优先录取具有以上属性值的学生,以提高新生率。

四、关联规则挖掘的分类预测

在关联模型中,如果列用于输入,那么该列的值只能在频繁项集中和关联规则的左边使用。如果列用于预测,则可以在频繁项集中以及关联规则的左边和右边使用该列的状态。如果列是逻辑型的,则它的状态可以出现在频繁项集中及规则的右边。

在新生报到表中,“是否报到”列的值是逻辑型,可以出现在频繁项集中及规则的右边,因此,“是否报到”列的状态就可以用于预测。例如,有一个频繁项目集{性别=‘男’,考试语种=‘民’,毕业类别=‘三校’,是否报到=‘是’},和由此产生的一个强关联规则{性别=‘男’,考试语种=‘民’,毕业类别=‘三校’}=>报到,那么,可以预测出,性别为男性,考试语种为民语言,毕业类别为三校的新生将会来报到,或者说,他前来报到的可能性非常大。

利用关联规则算法进行关联推测的方法:(1)给定一系列项,找出左边匹配给定项集或者任何给定项集的子集的所有规则。应用这些规则来获取推荐列表。(2)如果没有合适的规则,或者可推荐的项太小,则应用边缘统计学来预测和返回出现最频繁的N个项。(3)基于概率对来自步骤1和步骤2的项进行排序。

根据以上方法,本文对该院2011级录取的新生数据进行了深入分析。将出现频率较高的项集预测为“会报到”,其它项集预测为“不会报到”,将所有频繁项集按概率大小顺序挖掘出来。将此挖掘结果应用于录取现场,可以指导录取人员按此顺序录取考生,提高考生的报到率。

五、结论

通过关联规则算法,在已有学生数据库中挖掘出学生信息与报到之间的规则,再将此规则应用于报考考生数据库,预测哪类考生报到可能性高,可以为高职院校录取人员提供有用信息,有效提高新生报到率。

参考文献:

[1]毛国君,段立娟,王实,石云.数据挖掘原理与算法[M].北京:清华大学出版社,2005,11-65

[2]于莉.基于高校学生信息库的数据挖掘[D].内蒙古:内蒙古大学,2004

[3]安淑芝等.数据仓库与数据挖掘[M].北京:清华大学出版社,2005,2-16

[4]彭松涛.数据挖掘技术在高校就业管理系统中的应用研究[D].浙江:浙江工业大学,2005

[5]刘玉文.数据挖掘在高校招生中的研究与应用[D].上海:上海师范大学,2008

[6]谢长卫.高校学生信息的数据挖掘研究[D].安徽:安徽理工大学,2008

[7]李万武.基于贝叶斯理论的数据挖掘在高校信息管理的应用研究[D].黑龙江:哈尔滨工程大学,2005

[作者简介]芦海燕(1974-),女,新疆伊宁市人,讲师,工程硕士,主要研究方向:数据挖掘、计算机辅助设计;沙红梅(1972-),女,新疆伊宁市人,助理讲师,本科,主要研究方向:计算机应用。

基于可信度的决策规则处理 第4篇

人类之所以有区别于一般动物的智能行为,在于人类掌握了知识。人类获取知识的过程就是要从大量的原始数据中分析提炼发现有规律性的信息的过程,然后将这些归纳提炼的一般性知识用于未来的行为中。从实质上讲,就是一个从归纳到演绎,或者说从特殊到一般,再从一般到特殊的过程。

近些年,知识发现和数据挖掘成为研究的热点,原因在于信息时代带给我们方便获取数据的同时,也带来了一系列的问题如数据量过大超过了人可以控制的能力,同时人们认识到隐藏在大量数据背后存在一些对我们非常有用的知识。知识发现可以帮助我们从大量数据中找到有效的、新颖的、潜在有用的、最终可被理解的知识[1]。实际上,知识发现是采用归纳的方法,利用数据挖掘技术,从我们掌握的数据中提炼出有价值的知识

“Rough集理论是一种研究不完整、不确定知识和数据的表达、学习和归纳的理论方法”[2],近年来成为数据挖掘领域中一种重要的工具。利用Rough集理论,从包含大量实例的数据记录出发,通过数据预处理、信息表的属性约简、信息表的值约简等手段,最终可得到一个包含大量决策规则的逻辑推理系统[2,3,4,5]。

利用Rough集工具可以得到数据背后隐含的决策规则知识,这些知识的可信度主要依赖于数据。一般来说,数据的来源是复杂的,其中有些数据是由特殊时期的特殊事件产生的,有些数据是在数据预处理阶段采用补齐决策表等人为手段产生的,另外在数据处理过程中采用的算法也可能存在一定的边界放松,因此最终得到的决策规则知识可能有违人类常识,也可能和现实发展相矛盾,其可信度值得考虑,决策者若不加思考地按照这些知识进行决策无疑是危险的。鉴于此,提出了决策规则的可信度这一概念,把专家的经验判断应用于决策规则的评价。

1 决策表决策规则

决策表是Rough集中一个重要的概念。一个决策表就是一个信息表知识表达系统,表中包含了大量的领域样本(实例,对象)信息。为了说明方便,我们把一个信息表知识表达系统记为S=〈U,R,V,F〉,“这里U是对象的集合,也称为论域,R=C∪D是属性的集合,子集C和D分别称为条件属性集和决策属性集,V=r∈∪RVr是属性值的集合,Vr表示属性r∈R的属性值范围,即属性r的值域,f:UR※V是一个信息函数,它指定U中的每一个对象x的属性值”。“通常,决策表包含了某一领域中的大量历史数据记录,是领域的实例数据库”[2]。决策表记录了大量实例的属性值和决策情况,是领域知识的载体,本文就是要在分析这个实例库的基础上获取领域中有用的、规律性知识。

从决策表中分析到的知识通常用决策规则的形式记录下来,在未来的决策过程中作为对未知的观察实例进行决策判定的依据。决策规则是这样一类形式的公式:A※B,“A称为规则前件,B称为规则后件,它们表达了一种因果关系”[2],也就是说,如果事实A满足,那么可以得到B事实这样一个结果。一般来说,决策规则是隐含式,A和B是由基原子公式(属性,值)对通过命题连接词∧、∨、┐组合而成[6],如(头疼,是)∧(体温,很高)※(流感,是)就是一个决策规则。利用Rough集理论和决策表我们可以得到一组以决策规则形式表示的知识形成一套逻辑推理系统,应用于未来的决策过程中。

2 数据支持度与专家支持度

正如在本文引言中提到的,在对大量数据处理的基础上,虽然最终获得了一组可以理解的决策规则,但这些决策规则可能有较大的缺陷,如果不加判断地应用,很可能造成巨大的损失。因此在应用于逻辑推理系统之前,有必要对这些决策规则的可信度进行分析。为此,首先引入决策规则的数据支持度和专家支持度两个概念。

一条形如A※B的决策规则的数据支持度是论域U中满足公式A∧B的对象数量和论域U中对象的总数量之比,记为DataSupport(A※B),即:

显然,数据支持度取值在(0,1]区间内,我们用max(DataSupport)表示所有规则中最大的数据支持度,用min(DataSupport)表示决策规则中最小的数据支持度。为了使规则的数据支持度具有可比性,在计算规则的可信度之前,还要对规则的数据支持度进行归一化处理,方法如下:

上式[7]中,DataSupport(A※i B)表示第i条规则的数据支持度,DataSupporti是归一化后的第i条规则的数据支持度,这时最小数据支持度的规则的归一化后的数据支持度为0,最大数据支持度的规则归一化后的数据支持度为1,在不引起误解的情况下,下面用DataSupporti来表示第i条规则的数据支持度。

决策规则的专家支持度是利用专家的经验和知识对决策规则的可信性进行判断,然后根据一定的决策规则将专家的意见集中起来形成专家群体对该决策规则的信任度,用ExpertSupport(A※B)表示规则A※B的专家支持度。为了得到一组决策规则的专家支持度,首先获得专家对每一条决策规则可信性的评分(按百分制),如表1所示。

在表1中,我们用rulek(k=1,2,,m)表示有m个形如A※B的决策规则,有n个专家,aij(0aij100;i=1,2,,m;j=1,2,,n)表示第j个专家对第i条规则的评分,ExpertSupportl(l=1,2,,m)表示第l条规则的专家支持度。专家支持度的计算公式如下:

显然,规则的专家支持度取值范围在[0,1]之间。如果专家支持度为0,表示所有专家都不相信这条规则;如果专家支持度为1,表示所有专家都相信这条规则。

3 计算决策规则的可信度

从数据支持度和专家支持度的定义上,可以看出数据支持度反应了数据源对于规则的信任度,专家支持度反映了专家对于规则的信任度。在得到决策规则的数据支持度和专家支持度后,就可以确定规则的可信度了。为了计算规则的可信度,可以建立如下计算表,具体如表2所示。

Confidencel(l=1,2,,m)表示第l条规则的可信度,计算公式如下。

这里采用简单的加权平均法,其中w1是为数据支持度赋的权,w2是为专家支持度赋的权,w1+w2=1(0w1,w21),w1和w2的取值可以根据实际情况选取可信度计算公式中乘上是为了将规则的可信度转换为百分制,适应我们的习惯。

在得到所有规则的可信度后,可以按照可信度从大到小的顺序对决策规则进行排序。为了使进入逻辑推理系统的决策规则具有良好的可信性,可以通过设定合适的阈值,把可信度低于设定阈值的决策规则放弃,只把高于阈值的决策规则放入逻辑推理系统,为未来的决策判断提供依据。

4 结束语

利用含有大量实例数据的信息表,通过一定的数据挖掘方法获得有价值的、可理解的决策规则知识,无疑是一项振奋人心的智能信息处理技术。但决策信息表中的大量数据可能是由过去特殊原因或特殊事件造成的,完全依赖于仅有数据支持的决策规则来进行逻辑推理可能会出现很大的问题。通过上述方法得到的决策规则既建立在数据支持的基础上,又建立在专家的经验判断上具有良好的可信性

摘要:在Rough集理论中,利用信息表通过数据预处理、属性约简、值约简等处理后,可以得到一组决策规则知识,其应用能够大大提高决策水平,但这些获取的知识完全建立在数据源的支持上。数据源在产生和处理的过程中容易受到一些事件或人为因素影响,因此所得到的规则知识可能和现实存在一定的偏差,如果不加处理将其直接应用于逻辑推理系统,可能影响决策的质量和效果。为此,提出了数据支持度、专家支持度和规则可信度的概念,引入专家的经验判断,利用专家的知识对获取的规则知识进行评价,形成规则知识可信度的排序,然后去除不可靠的规则知识,得到了具有较高可信度和实际应用价值的决策规则知识。

关键词:决策规则,数据支持度,专家支持度,规则可信度

参考文献

[1]李雄飞,李军.数据挖掘与知识发现[M].北京:高等教育出版社,2003:1-3,118-119.

[2]王国胤.Rough集理论与知识获取[M].西安:西安交通大学出版社,2001:17-22,53,117.

[3]袁芳,王黔英,费颖,等.基于Rough集和概率统计方法的决策规则提取[J].南昌大学学报:工科版,2007(6):152-155.

[4]杜茜,杜晓.基于粗集理论的决策规则提取方法[J].科技信息:科学教研,2007(29):61.

[5]朱意霞,姚力文,段隆振,等.基于Rough集的决策规则提取[J].计算机与现代化,2006(10):4-6.

[6]刘清,等.带Rough算子的决策规则及数据挖掘中的软计算[J].计算机研究与发展,1999,36(7):800-804.

重大事项决策议事规则 第5篇

为深入贯彻落实科学发展观,推动集团领导班子民主决策、规范决策,提高科学决策水平,为集团发展提供有力的制度保证,更好地履行工作职责,结合雄峰集团工作实际,制定本规则。

一、重大事项决策的机制和人员组成

(一)重大事项决策机制

集团领导班子成员参与集体决策,对重大问题,通过综合部公会行使决策权。特殊情况可适当扩大参与决策人员范围。

(二)参与重大事项决策的人员组成

出席综合部公会的正式成员为领导班子成员,包括总公司副总经理以上人员和分公司负责人,根据工作需要,由总经理确定,可以邀请有关部门的负责同志在讨论相关议题时列席会议。在担保没有解除之前,**担保公司可以派有关人员列席综合部公会或将重大决策有关事项书面告知**担保公司。

二、重大事项决策内容

凡涉及集团改革、发展和稳定,关系职工切身利益的重大问题,均属于重大事项决策的范围,主要内容包括:

1、集团发展方向、经营方针,中长期发展规划等重大战略的制定和调整;

2、集团总体生产经营计划、季度情况通报,决算、预算的制定和调整;

3、集团机构的设置、调整及人员编制,集团各项规章的制定、修改和废除;

4、集团薪酬分配、工资待遇、医疗、劳动保障等涉及职工切身利益的重大事项;

5、重大人身伤亡、责任事故、突发事件的处理;

6、基础设施、设备引进等资源的配置和重大调整;

7、集团中层以上管理人员的选聘、任免、奖惩;集团后备干部的推荐、选拔;

8、对外投资、对外担保的有关事项;

9、集团需向上级单位请示的重要工作;

10、领导班子认为应当集体研究决定的其他重要问题。

三、重大事项决策机构议事规则

(一)认真贯彻民主集中制原则,充分听取与会人员意见,确保决策的科学化、民主化、制度化。

(二)会议出席人数超过应出席人数的半数,会议表决有效。

(三)集体决策议决事项,分为通报和表决两个方面,通报情况一般由集团总经理负责。表决一般采用口头方式进行,应坚持少数服从多数的原则,表决结果记录在案。

(四)会议决定的事项,应明确落实部门和负责人。

(五)与会人员在会上应充分发表意见,如有不同意见,不得在背后议论。在尚未正式公布的会议决策和需保密的会议内容,与会人员不得擅自向外传播和泄漏,否则将严厉追究其责任。

(六)重大事项决策的情况,包括决策参与人、决策事项、决策过程、决策结论等,要以会议纪录、纪要等形式留下文字性资料,参会人员签字后存档备查。记录人员要做好详细记录,特别是要详细记录不同意见。

四、重大事项决策的实施

(一)分工组织实施

会议决定的事项,由集团领导班子成员按照分工组织实施,任何个人不得擅自改变或拒绝执行。

(二)加强监督检查健全决策后评价和纠错机制

综合部公会决定的事项,由分管责任人负责催办,并及时将落实情况向总经理进行汇报,集团办公室、财务、审计等部门根据职责权限对决策执行情况进行监督检查,发现问题,及时报告,提出纠正建议。

(三)通过对决策执行情况进行跟踪、反馈,对决策结果的综合评价,及时发现和纠正决策中的失误并及时调整、完善决策方案。

五、责任追究

(一)凡属下列情况给集团造成重大经济损失和严重影响的要追究责任:

1、不履行或不正确履行重大事项决策程序,不执行或擅自改变集体决定的;

2、未经集体讨论决定而个人决策,事后又不通报的;

3、未向领导集体提供真实情况而造成错误决定的责任人;

4、执行决策后发现可能造成损失,能够挽回而不采取措施纠正的;

5、其他因违反本实施办法而造成失误的。

(二)责任追究主要依据本人职责范围,明确集体责任、个人责任或直接领导、主要领导责任。

关联规则在招生决策中的应用分析 第6篇

关键词:关联规则,招生决策,应用分析

1 概述

自教育部提出高等教育要从精英式教育转向大众教育以来,高等学校都在扩大办学规模,招生规模也呈不断上升的趋势,但近几年生源量却在逐年减少,很多学校的很多专业的报到率逐渐降低,这使得院校之间出现了前所未有的生源竞争。很多高校都在做盲目的招生宣传,这种无的放矢的做法不但浪费资源还不见成效。我们可以利用数据挖掘算法中的关联规则从近几年招生系统中的历史数据中挖掘出有用的信息,给高校决策者在招生宣传和录取工作中提供良好的决策依据。

2 数据挖掘中的关联规则

数据挖掘技术是随着信息技术的广泛使用的产物,信息技术中产生的数据虽多信息却很匮乏,如何从大量的数据中归纳总结提取出有效的信息就是数据挖掘技术的任务。数据挖掘(Data Mining),常被称作数据库中的知识发现(Knowledge Discovery in Da-tabase—KDD)。是指从海量的、随机的、有噪声的大型数据中提取隐涵的、事先未知的、具有一定价值意义的知识的过程[1]。关联规则是数据挖掘技术中的一种挖掘信息的技术,是从海量的数据中区找到项与项之间有用的关联关系[1]。最早始于对购物篮的分析,通过对顾客的交易信息进行挖掘分析,找出顾客经常一起买的商品有哪些。

关联规则有数据项},数据项集A  I,事务T=(TID,A),TID是唯一标识一个事务的事务号。假设事务T中有数据项集M、N,且T。关联规则就可以表示为形如的蕴涵式。

Apriori算法是关联规则中应用最广泛的一种方法,是基于关联规则的基础,首先找到频繁集,再由频繁集推出关联的规则。它采用的搜索策略是广度优先,也就是先一层一层搜索,再用迭代的方法来对项集之间的关联关系进行探索,也就是k项集是被(k-1)项集探索得到。

Apriori算法的基本过程分为两大步:第一步,对数据库进行依次扫描,第一次扫描,搜索频繁1项集Ll,即所有支持度数满足最小支持度阈值的项集,扫描得到的候选1项集记作C1。就这样,依次搜索迭代,一直到不再有新的候选集产生为止,k次扫描后,得到的候选k项集记作Ck。。第二步,修剪掉候选项集Ck中不频繁的项集,得到频繁项集Lk。第三步,由找到的频繁项集中推出关联的规则。

3 学生报到信息的关联规则分析

根据关联规则,可以将学生报到的数据设置为这样的项目集:I={生源种类,生源地地区,成绩分数段,录取专业是否如意,是否报到}。其中,生源种类为:城市应届,城市往届,农村应届,农村往届;生源地地区分为:东部沿海发达地区,中部发展地区,西部欠发达地区;成绩分数段分为五段,用罗马数字表示各项目的分类:Ⅰ、重点线上10-30分,Ⅱ、重点线上30-50分,Ⅲ、重点线上50-70分, Ⅳ、重点线上70-90分,Ⅴ、重点线上90分以上。事务T是是项目集I的一个子集,I,考生号用来区分每个事务。每次扫描得到的频繁项集用Lk表示。报到与否是要分析的属性。

选取近两年学生录取情况和报到情况作为分析样本,事务数180000条。第一次扫描样本数据,得到频繁1项集Ll,如下表。由于“报到”是我们要分析的目标,所以我们只分析关于报到的频繁集,为了便于求得信任度,在支出数的后面添加了条件数。18000的样本事务中,报到人数为17248,报到率为95.82%。所以分析时,Ll的最小支持度设为97%。

由Ll得出:农村往届生、西部考生、成绩在重点线上10-30分的和对录取专业满意的考生基本会来报到。

连接Ll得到C2,扫描C2项目集,由于本样本数据不是很多,不进行剪枝,将所有数据联接得到L2,设L2的最小支持度为96%下表为满足最小支持的几项。L

上图所示的项集都是通过L2可以推出的规则。

联接L2后得到C3,扫描C3得到L3。设L3的最小支持度为96%下表为满足最小支持的几项。

再联接L3后得到C4,扫描C4得到L4。设L4的最小支持度为96%下表为满足最小支持的几项。

所有上述满足最小支持的项目集就是最终生成的关联规则。以此作为依据便能帮助投放招生计划等相关决策,招生宣传也因此有的放矢。

4 结束语

决策规则 第7篇

决策树的整个构造过程如下:第一要开始初始的分裂。决策树它是由整个训练集产生的, 必须是完成分类后才产生每个训练集记录的。在分类指标的选择上是由目前最好的属性域 (Field) 来决定[3]。常用的做法是对属性域进行穷尽, 使用事预先约定好的量化指标来对每个属性域分裂的结果好坏做出评价, 可以根据评价的结果来选择当中一个最好的分裂过程。在不同的算法里属性域分裂评价标准也是不近相同。再一个是, 重新来回到第一步, 一直到同一类记录都处在一样的叶节点的内部, 最终让它生长成一棵结构完全的树。我们构造决策树的最终目的是为了找出类别与属性之间的关系, 可以用它来将来未知的类别记录进行预测。使用决策树算法的分类器便是一种能够进行预测操作的系统。

1. 决策树算法的核心技术

决策树是通过得到训练样本集来建立相关的模型, 可以使用模型的预测目标变量和关于各输入的变量分类情况, 进一步实现目标变量和输入变量在取值不相同的情况下数据分组结果, 从而对新数据对象来进行预测和分类[4]。当我们使用决策树来分析一个新的数据对象时, 应该对应目标变量的取值或分类可以由决策树来根据变量取值输入来做出相应的推断。决策树技术中存在不同种类的算法, 每种算法有自身的优点和缺点。

1.1 决策树的生长过程

对训练样本集进行不断的分组的过程就是决策树的生长过程。不断的对数据来进行分组的过程中逐渐的生长出决策树上的各个分枝。如何选择测试属性的问题便是决策树的生长过程中的核心技术。

最初的ID3算法对需要检验的属性进行选择时使用增益标准来完成, 它来源于信息论中熵概念。

在决策树中来使用C4.5算法的选择各级结点的属性时, 它的属性选择标准可以来使用增益比率 (gain ratio) 。

在SLIQ, SPRINT, PUBLIC算法中, 通常使用gini指标 (gini index) 来取代信息量 (Information) 作为选择属性的标准。信息量与gini指标相比, 后者的性能更好, 并且计算的时候更加方便。

1.2 决策树的修剪

为了解决训练数据间过分近似的问题决策树的修剪被提出来, 利用统计的方法删除最不可靠的分支是最常用的修剪方法, 修剪后分类识别新数据的能力和识别速度得到了提高。将异常和噪声从训练集中消除是修剪最终的目标。

修剪树枝通常采用的方法有以下两种:

1.2.1 事前修剪 (prepruning) 方法。

分支生长过程通过这种方法被提前停止, 经过在当前的节点上来判断训练集是否需要被继续划分来实现。分支的生长一旦被停止, 含有训练集的当前节点就转变成为一个新的叶节点, 可能会有许多不同类别的训练集样本被包含在该叶节点中[5]。在一个决策树的建造过程中, 统计学上的信息增益或重要性检测等等方法可以用来评估分支的生成情况。当节点中样本数量低于选定的阈值时则要立即停止在当前节点上继续划分样本的集合。但比较困难的是如何合理的确定一个这样的阈值, 阈值过大或过小分别会诱导决策树生长得过于简单或过于复杂而无法修剪。

1.2.2 事后修剪 (postpruning) 方法。

当一个决策树能够充分的生长完成后, 接着对其它多余树枝来进行修剪。一种事后修剪的方法是考虑它代价成本的修剪算法, 那些修剪过的节点它就能成为一个新的叶节点, 并且在它所能包含的样本中将会标记为类别个数最多的类别[6]。然而对于树中的每一个非叶节点, 可以计算出可能就是发生的预期的分类错误率, 当该节点被修剪后;并且根据出现在每一个分支上的权重, 以及每一个分支的分类错误率, 计算出来预期的分类的错误率当没修剪该节点的时侯;如果预期的分类错误率是由于修剪来导致变大, 这样则会将修剪放弃, 从而选择将把对应节点上所有的分支保留, 要不就修剪删去相应的节点上面的分支。

2. SPRINT算法及其改进

内存限制在SPRINT算法中因为使用不同的数据结构而被消除, 且在该算法中并行化更容易实现, 可伸缩性也被进一步增强, 同时它还吸取了SLIQ算法中的预排序技术。而剪枝算法SPRINT它所采用的将与SLIQ相同。这是因为建树是决策树的算法中关键项目, 然而建树阶段它所需时间将远远大于剪枝的阶段所需的时间, 并且实验表明:我们的剪枝阶段SLIQ的算法所要花费的时间这还不到整个的算法所用时间的1%。接下来下面将详细的阐述SPRINT算法中比较关键的几个步骤。

2.1 SPRINT算法

节点的分裂方法:

计算最佳分裂。通常gini指数会在SPRINT算法中被来用作对节点的分裂质量来进行评价得参数。最佳的分裂寻找方法就是:属性表将在每个节点上来被遍历, 并且对每一个属性表它的分裂价值来进行评价, 完成遍历后, 就会在分裂点属性中来包含gini索引的最低的将会被选成最佳分裂方案[8]。

SPRINT算法对于数值型属性使用与SLIQ算法相同的分裂方法, 在将两个数值型的属性值他们的中间将会出现分裂点。用类直方图来记录如下变化:开始时, 初始化类直方图的Cabove为零, 而所有记录被初始化为Cbelow, 在初始化排序时就可以获得类在根节点的分布情况, 在执行分裂创建新节点时将会得到其他节点的类分布。当一个属性表被遍历时, 将同时改变Cabove和Cbelow, 分裂方案的gini指数值使用Cabove和Cbelow就可计算得到。当我们找到该属性最佳分裂的方案后便可以存入节点, 并且同时再次的初始化Cabove和Cbelow, 在处理下一个属性时使用。

在遍历属性表时只需统计每个属性值以及计数矩阵中的每种类标号, 在一起组合成的个数便就是离散型属性。在遍历完成后, 将属性值所有的子集被考虑成为分裂方案, 在计算gini指数的时候需要来根据相应计数矩阵, 并且找到gini指数的最小的最佳分裂方案之后, 相应属性表来进行分裂时, 计数矩阵同样也将会随之发生改变。

执行节点分裂。当节点被创建之后再来执行分裂的节点的时候, 划分节点的每个属性表成为最主要的任务。当在划分包含所分裂属性的属性表时会非常容易。即通过应用分裂条件去测试所遍历的属性表, 然后在每个子节点属性表中来分别的放入记录下的测试结果。

那么我们如何进行其它属性表的划分呢?哈希表 (hash table) 此时被作为一种数据结构引入并将属性表中的rid利用起来[9]。当分裂属性表被划分时, 在哈希决策树分类算法的研究与改进表中插入每一条记录的rid, 当哈希表中插入所有记录分裂属性的rid后, 对剩余的属性表进行扫描, 同时将每一条与记录相对应的rid从哈希表中搜索出来, 从而可以在相应的子节点中存放该记录。每一个新的叶子节点分裂时还要创建类直方图, 最佳分裂在数值型属性下一步评价时用于初始化Cabove。

算法的剪枝:

MDL剪枝算法它属于SPRINT算法中事后修剪 (post-pruning) 算法。它通常采用训练集的某个子集或者与训练集独立数据集来当成数据源进行事情最后剪枝的操作。其实MDL (Minimum Description Length) 的目标是要生成一棵能够描述长度最小决策树。并且MDL原理认为:在描述的数据代价种最小的模型将是最优的编码模型。

在决策树的语言环境中, 剪枝初始决策树时得到的一系列子树就是指的模型, 训练集就是指的数据。找到能够最好描述训练集的子树就是要进行MDL剪枝。编码的长度在决策树每个内节点上由MDL剪枝算法进行评估, 从而决定将该节点是否转换为叶结点, 或者将其子树删除, 还是将结点保持不变。剪枝算法是一种由下而上的算法, 当某种剪枝策略被选定后, 由下而上来决定是否进行剪枝根据所得到新树的总代价是否在变小, 一直达到根节点为止。

SPRINT算法的评价:

决策树效率受到影响的重要因素就是对数值型属性的分裂, SPRINT算法当中, 在寻找最佳分裂点时, 采用了精确的计算技术, 在先进行排序的工作时涉及每一个数值型属性, 然后再评估每一个属性的值。

SPRINT算法中有明显优点, 所生成的树总是最好。不过, 它在处理这种数值型属性时这种算法也就表现出来明显的不好的一面:

(1) 它是需要预先来对整个的训练集进行我们所说的排序工作;

(2) 它需要使用gini指数对所有的数值型属性的不同值进行评估。

这种方法将会产生比较大的工作量, 尤其是在处理这样超大数据集的时候, 当属性中含有大量的且不同取值的时候, 处理的效率就会变得很低。然而SPRINT算法就是为了减少它的计算量, 来提高算法执行效率, 然而我们对SPRINT算法其实主要从它数值型属性得处理方面来进行改进。

2.2 SPRINT算法的改进

对于其中某个数值型属性, 它如果在区间的V中所有记录都是属于同个类C, 则会称这个区间为C的纯区间。

根据公式推导得知, 类C的纯区间V内的极小值只可能出现在区间的边界点处, 这样就可以只需要通过计算纯区间边界上的gini值, 就可以得到纯区间的极小值了, 同时减小了计算量。

在算法被改进后, 构建决策树将采用宽度优先的策略和评估数值型属性时就使用gini指数。然而我们最主要改进的是我们在构建决策树的阶段来对数值型属性部分进行处理的部分, 上述纯区间归约的方法被提出并且采用来处理数值型属性。

类值属性一般都会服从高斯的分布, 同时在等宽划分的区间中会存在大量的纯区间。

因此, 对于这样纯区间, 我们只要计算在各个纯区间中边界点处的gini值;对于这样非纯区间来进行精确的计算, 这样就能够得到整个属性值相应的最小gini值, 同时找到最佳的分裂点。

改进算法最不同于SPRINT算法之处其实主要是在决策树构建阶段来对数值型属性的处理方法, 需要我们比较分析的就是这两种算法在整个构建决策树的阶段对所耗用的时间和I/O的需求。算法比较过程中可以划分为构建和预处理阶段决策树中每一个结点的阶段。

假设我们的数据集S中有n条记录, 同时c则是互不相关的数量, q是被其划分的区间的数量, n1是每一个区间的记录的数;b在改进的算法中属于非纯区间数。

预处理阶段:

SPRINT算法中一次读和一次写操作来构建属性表所需要的时间代价为O (n) , 两次读和两次写操作来预排序每一个数值型她属性所需要的时间的代价为O (nlogn) 。

构建属性表在改进算法中所需要的操作为一次读和一次写操作, 需要一次读操作来建立分区直方图列表, 下预处理阶段所需花费的时间为O (n) 。

结点构建阶段:

在SPRINT算法中, 对属性表进行一次读操作来计算一个数值型属性的最佳分裂点所耗用的时间代价为O (n) ;一次读的和一次写的操作来的分裂属性表它需要的时间花费其实为O (n) 。

改进的SPRINT算法中, 对每一个区间边界的gini值来进行估算它所耗用的时间其实为O (qc) ;决定每一个非纯区间它的记录, 一次读和一次写操作来建立临时区间属性表需要的时间花费为O (n) ;排序每一个非纯区间并且计算它其中的精确gini值所要耗用的时间为;一次读的和一次写的操作来分裂属性表其实需要的时间的花费为O (n) 。

在SPRINT算法中, 整个处理过程的主要时间都用在对属性表的全部记录进行排序的工作上。而全局排序在改进的算法中被有效地避免了, 只是来对非纯区间来进行局部的排序;同时, 由于它归约了纯区间, 然而将gini值的计算量来缩减到最小。

当改进的算法总体上的运行时间要优于SPRINT算法, 但在改进的算法中, 当记录数增大到一定的程度以后, 运行时间的优势变得越来越小, 其原因在于:在我们的算法执行过程中, 对于每一个属性的分区数是保持不变的, 而随着记录数的增加, 纯区间数量的减少, 区间内的数据局部排序时间也在不断增加。

3. 结束语

目前, 研究机器学习的学者们仍致力于改进现有算法, 或着发现效率更要高的算法。其实总的来说, 这个决策树算法里主要是关注两大问题:第一个, 决策树它的生长的问题, 即使用训练的样本集, 构建这个决策树的过程。第二个, 决策树的它修剪的问题, 即使用检验的样本集, 处理并且优化建立的决策树。

参考文献

[1]黄树成.一种基于信息熵建立决策树的算法[J].常州工学院学报, 2006, 19 (1)

[2]黄树成.数据流上挖掘决策树的的关键技术研究[J].常州工学院学报, 2005, 18 (5)

[3]刘丽.一个在数据流上快速建立决策树的算法[J].连云港职业技术学院学报, 2005, 18 (2)

[4]黄树成, 曲亚辉.半监督学习在研究生调剂中的应用[J].计算机系统应用, 2011, 20 (4) .

[5]Tax DMJ One Class Classification:Concept Learning in the Absence of Counter Examples[J], 2001

[6]Zhou ZH;Li M Tritraining:exploiting unlabeled data using three classifiers[J], 2005 (11)

[7]Cheng JT A Variational expectional-maximization method for the inverse black body radiation problem[M], 2008

[8]Minghua Zhang;Ben Kao;Chi-Lap Yip A comparsion study on algorithm for incremental update of frequent sequences[M], 2002

决策规则 第8篇

1 采用DASL协议对决策系统的重要性

1.1 DASL协议简介

DASL协议是根据决策平台的数学建模所制定的一套算法协议,将decision(决策)、arithmetic(算法)、schema(模式)、language(语言)映射在整个数学建模过程中,并将实现数学建模的流程分为三个层次即模型层,规则层及过程层,通过XML配置文件以清晰严格的方式规范这三个层次内容,并在实现代码中分阶段解析调用相应XML配置文件,以达到对模型的精确性可控性的保证。

1.2 DASL协议的优点

DASL协议以最佳实践为原理,通过三层XML配置文件的迭代式控制,在实现模型的过程中可以及时处理反馈信息,确保计算模型可以严格合理的执行。

2 运用XML数据传输技术的DASL实现方案

2.1 XML技术简介

XML具有可扩展性,允许用户按照XML规则自定义标记,能够更好地体现数据的结构和含义,也使得文件的内容更加的显而易懂,使得网上数据交流更方便。

XML主要特点如下:

可扩展性和开放性。XML允许不同的组织和个人开发与自己特定领域相关的标记,并且该XML标记库可以迅速的投入使用。XML的开放性促使它成为异构系统之间进行交流的媒介,只要各系统装有XML解析工具,便可处理由其他系统传递过来的XML信息,而不必使用特殊的软件。

内容与形式的分离。在XML中,显示样式从数据文档中分离出来,放在样式表单文件中,如果需要改动数据的表现方式,只需要改样式表单,而不必改动数据文档本身。

平台独立性。XML文档是纯文本,独立于各种开发平台。

2.2 三个层次的XML配置文件

对于整个决策系统需要有涵盖整个预测过程的XML配置文件,并在其中设置三个预测模型的键值,当选择相应预测业务时根据对应键值来解析相应模型层XML文件。例:

在模型层XML配置文件中设置此模型的规则层及过程层键值,例:

根据建模的规则及流程设置规则层和过程层的XML配置文件,其中规则层配置文件是对预测模型的数学计算过程中的精度等要求进行配置,而过程层配置文件则是对整个计算流程的配置描述。

2.3 依据DASL协议的决策平台的工作流程设计

决策平台系统的工作流程设计依据最佳实践,遵守DASL协议以实现整个工作流程可控制的阶段化。

(1)一次读取/加载:1)首先由数据库设计人员与界面设计人员确定界面业务的表现,并确定数据库中需要在界面展示的数据字段,而对于决策所需的一些非原始数据即计算过程中产生的中间数据,则不在数据库中存储,而是在XML配置文件设置出哪些需要显示。2)对于数据库表中的数据,每一个数据表对应一个XML文件,并将表中各字段属性,如字段名、字段类型、字段长度及对这张数据表用到的SQL语句写到XML文件里,且将每个XML文件格式规范;对于计算过程中的规则,和每个步骤反馈条件,根据不同模型配置到相应的XML文件里。3)从XML中读取信息后,封装到相应的结构类,当页面进行加载时,创建相应的结构类对象,调用结构类提供的接口,即可取得数据。

注:结构类中封装字段值、类型、长度、字段名。

(2)二次封装/验证:1)在预测功能页面上,需要用户填写数据或选择已给数据,则为了保证数据的合理性及正确性,需要对数据先进行验证(一般是JS验证)。2)在数据正确的情况下,向服务器发出请求,并将数据封装成一个结构类,交给服务类进行处理。

(3)三次计算/组装:1)当服务器接受到客户端的请求后,根据相应的规则层文件对数据进行重新组装,如对结构类中封装的历史数据需要以矩阵的形式进行计算。2)当将所需数据组装成符合配置文件的格式后,调用计算类中方法进行计算(同时对数据进行逻辑验证,如有错误,则重新加载数据)。

(4)四次操作/入库:1)对于计算结果,再次封装,返回给客户端。也包括对结构类对象进行更新。2)调用操作类中的方法,对数据库进行更新。

3 结语

以DASL协议为准则,基于JAVA EE平台实现的决策系统,为解决实现此类系统中存在的数学建模提供了一种可靠有效的途径,运用XML文件数据传输及XML严格的格式规范使的此类问题有更加严谨的解决方式。

参考文献

[1]杨少波.J2EE web核心技术:Web组件与框架开发技术[M].北京:清华大学出版社,2011.07

[2]Khawar Zaman Ahmed.用J2EE和UML开发Java企业级应用程序[M].北京:清华大学出版社,2009.09

[3]Mark Birbeck.XML高级编程.第一版[M].机械工业出版社,2002.

[4]栗松涛.XML程序设计.第一版[M].清华大学出版社,2000.

决策规则 第9篇

最近10多年来, 进化计算方法在解决多目标优化问题上, 体现出极好的优点, 因为其能在一次循环中找出多个Pareto解, 并能很好地收敛到Pareto前沿, 同时分布较均匀。现在进化计算方法与决策理论结合在一起, 在多目标决策中发挥作用, 是一个重要的研究热点。其特点是不再注重于近似整个Pareto前沿, 而是集中于决策者所关心的那些Pareto最优解, 使得搜索的效率更佳。

但多目标进化算法应用于群体决策方面的研究还非常缺乏[4]。文献[4]中介绍了解决群体决策问题的一种遗传算法方法, 决策者的偏好用参考点 (概念详见2.1节) 表示, 再通过分层排序或者距离引导种群向群体解进化。而在决策支持系统中, 有关群体决策的研究已经较为深入。但是其中大部分研究都是基于以下两点不是很符合实际问题的假设:其一, 大部分情况下, 只有少数几个可选方案, 而在这几个方案中必须选择一个作为最后群体解决方案, 而很少关注到如何在一个数量巨大的可选择空间中进行优化;其二, 通常假设群体是同类的, 因此可以整合到一个通用的偏好函数。基于以上假设后, 可以应用名义群体技术、DELPHI方法、层次分析法等方法以类似于单决策者的方式进行决策。但是, 决策群体都同意一个公共的偏好函数, 是不太实际的, 特别是对于群体成员较多的情形, 是非常困难或者根本无法得到公共偏好函数的。

本文的目的, 是将多目标粒子群优化方法应用于群体决策, 决策者的偏好也以参考点表示, 但不再直接使用分层排序或距离方式, 而是在支配概念或者距离阈值下, 使用了群体决策中应用最广的投票规则进行求解。我们的重点在于搜索群体关心的一小集合的Pareto最优解, 并且用ZDT问题进行验证。

1基本的MOPSO

多目标优化问题 (MOP) 一般定义如下:

其中X是Rn空间中的决策变量, D是其定义域, fi:RnR, i=1, 2, , k是目标函数;gi, hj:RnR;i=1, 2, , m;j=1, 2, , q是约束函数。

对于多目标优化问题, 一般没有一个使得所有目标函数均为最优的解, 所以采用的多是Pareto解。

在MOPSO中, 由粒子群到当前为止所发现的非支配解都存储在外部种群档案 (external archive) 中。每个粒子除了向自己所经历的某个非支配历史位置 (pbest) 学习外, 同时从外部种群档案中按照一定规则选择一个解作为引导者 (leader) 。外部种群档案随着计算的进行不断更新, 其所包含的解在运行结束时一般也是最终输出结果。一般MOPSO流程[1]如下:

算法1 一般的MOPSO算法

Begin

Initialize swarm

Initialize leaders in an external archive

Quality (leaders)

Iteration = 0

While (Iteration < max_Iteration)

For each particle

Select leader

Update Position (Flight)

Mutation

Evaluation

Update pBest

End For

Update leaders in the external archive

Quality (leaders)

Iteration++

EndWhile

Report results in the external archive

End

其中“Quality (leaders) ”一般是计算粒子的拥挤距离或适应度或其它粒子密度的评价值, 以便后面有一定规则为每一粒子从外部种群档案中选择leader, 使得粒子在向Pareto前沿飞翔的同时保持较好的分布性。

在MOPSO中, 各种算法不同的地方, 主要在于外部种群档案的设计及剪枝策略、leader的选择方法、pbest的更新方法。

2基于偏好参考点的MOPSO

2.1参考点

在决策者偏好信息方面, 有多种表示方式。决策者不同, 其给出的偏好信息也会不相同。在相关文献中[4,5,6,7], 主要有以下几种方式:目标的重要性优先次序, 目标的重要性权重, 参考点, 参考区域, 参考方向等定义。本文假设群体成员的偏好信息以参考点表示。

偏好参考点表示用户的期望目标, 表现为目标空间中一个点。设群体中有N个决策者, 每个决策者偏好都用一个参考点Rn (Rn1, Rn2, RnNF) , n=1, 2, , N描述, NF是目标函数个数。任一解x与参考点的距离用欧几里德距离公式定义:

dn (x) =1ΝFi=1ΝF (fi (x) -RnifiΜAX-fiΜΙΝ) 2n=1, 2, , Ν (2)

其中fi是第i个目标函数, fimax (x) 、fimin (x) 是第i目标函数的最大值、最小值, 其作用在于进行规范化。

2.2投票机制

收集好群体成员的偏好后, 进行决策时, 就要根据不同的决策方法对其偏好进行整合, 以期找到群体偏好的解。在群体决策中, 应用最广的是投票方法, 群体成员根据每个人自己的偏好, 对决策方案进行投票, 然后进行汇集, 根据约定的规则, 选择最后方案。应用最多的是多数规则, 即多数决策者同意的解是最终群体解, 但也有其它规则。对于以参考点表示的群体成员偏好, 我们定义如下的投票规则, 以应用多目标优化方法进行求解。

(1) 完全一致解

定义1 (基于支配的解定义) 某个解是群体决策的完全一致解, 当且仅当它是非支配解并且它支配所有群体成员的参考点。

定义1对解的要求非常高, 很容易无解。如果某个参考点不在可行域, 则此方法将找不出任何解。此方法也叫一票否决制。

定义2 (基于距离的解定义) 某个解是群体决策的完全一致解, 当且仅当它是非支配解并且它与所有群体成员的参考点的距离都小于阈值δ

(2) 绝对多数决定解

定义3 (基于支配的解定义) 某个解是群体决策的绝对多数决定解, 当且仅当它是非支配解并且它支配多数群体成员的参考点。

定义4 (基于距离的解定义) 某个解是群体决策的绝对多数决定解, 当且仅当它是非支配解并且它与多数群体成员的参考点的距离都小于阈值δ

这里与完全一致是相近的, 只是现在需要满足多数决策者参考点要求, 而不是全部。按规则, 多数可能是1/2或2/3等。

(3) 相对多数决定解

定义5 (基于支配的解定义) 某个解是群体决策的相对多数决定解, 当且仅当它是非支配解并且它相对于其它解来说, 支配更多的群体成员参考点。

此定义不要求支配超过半数的参考点, 只要求其相对其它解而言支配更多的参考点即可。

定义6 (基于距离的解定义) 某个解是群体决策的相对多数决定解, 当且仅当它是非支配解并且它相对于其它解来说, 与更多的群体成员参考点距离小于阈值δ

此定义不要求与超过半数的参考点距离小于阈值δ, 只要求其相对其它解而言与更多的参考点距离小于阈值δ即可。

根据以上定义, 在搜索群体解时, 即是搜索既靠近Pareto前沿而又满足基于支配概念或距离概念下投票规则的解。

2.3基于参考点的MOPSO群体决策方法

以参考点定义用户偏好后, MOPSO所要找到的解除了满足收敛到Pareto前沿并具有分布均匀特点外, 还要靠近群体的偏好域。以下介绍解决群体决策问题的基于参考点和相对多数决定投票规则的MOPSO算法策略:

(1) 基于投票机制的锦标赛选择leader的方法 首先对外部种群档案按其支配的参考点个数 (或距离阈值δ内的参考点个数) 进行排序, 支配参考点 (或距离阈值δ内的参考点个数) 较多的前50%精英粒子作为候选粒子。然后采用锦标赛方式, 从候选粒子中选择支配参考点个数 (或距离阈值δ内的参考点个数) 较多的解为leader。本文采用的锦标赛规模为2。

(2) 嵌入投票机制的pbest更新规则 从当前粒子和历史最优中选择两者中非支配解为pbest;若相互不支配, 则选择支配参考点个数 (或距离阈值δ内的参考点个数) 较多的解为pbest;若相互不支配, 支配参考点个数 (或距离阈值δ内的参考点个数) 又一样, 则随机选择一个为pbest

(3) 外部种群档案leaders更新规则 若当前粒子相对整个外部种群档案中粒子而言为非支配解, 则加入到外部种群档案中。并删除外部种群档案中被新加入粒子支配的解。

(4) 嵌入投票机制的外部种群档案剪枝规则 档案容量超过预设大小时, 如果其中的粒子支配参考点个数 (或距离阈值δ内的参考点个数) 不一样, 则首先删除支配参考点个数 (或距离阈值δ内的参考点个数) 少的粒子。如果每个粒子支配的参考点个数 (或距离阈值δ内的参考点个数) 都一样, 则去除密度较大的粒子, 以达到均匀分布要求。

基于参考点和投票机制的MOPSO群体决策方法, 主要是在各步骤中嵌入了投票规则, 使得粒子向与群体多数决策者偏好的Pareto前沿收敛。因为只用找出部分的Pareto前沿, 在种群规模、进化代数方面可以大大减少, 使得算法的效率更佳。

3仿真实验

3.1ZDT1[3]问题

ZDT1问题具有凸的、连续的Pareto前沿。以下实验均以ZDT1优化问题为例进行说明。多目标粒子群算法的种群大小是100, 最大进化代数为100, 外部种群档案大小为20, 距离阈值δ=0.3。

(1) 参考点均可行及相对多数投票规则群体决策

假设三位决策成员偏好的参考点分别是 (0.2, 0.9) 、 (0.3, 0.8) 和 (0.8, 0.3) , 它们均位于可行域。为了节省篇幅, 基于支配概念和基于距离阈值下应用相对多数投票规则运行的结果显示在一起, 如图1所示。

从图1可以看出, 对于参考点均是可行点而言, 基于支配概念或距离阈值应用投票规则均可以得到群体决策解, 两者解稍有不同, 但对于决策而言影响不是很大。

(2) 参考点均不可行及相对多数投票规则群体决策

三位决策成员偏好的参考点分别是 (0.1, 0.6) , (0.2, 0.5) 和 (0.8, 0.3) , 它们均位于不可行域。结果如图2所示。

从图2可以看出, 对于参考点都在不可行区域的情况, 基于距离与基于支配概念的群体决策结果非常不一样。基于支配概念的解, 分散于整个Pareto前沿, 实际上其支配的参考点数目都是0, 可以认为此时没有找到群体解。但基于距离的方法可以求出与多数参考点相近的部分Pareto前沿, 与多数规则相符合。

(3) 参考点部分可行和部分不可行及相对多数投票规则群体决策

分两种情况讨论。第一种情况是可行参考点较少, 不可行参考点较多, 结果如图3所示。

可以看出, 基于支配概念与基于距离概念的解相差悬殊, 同样可以看出, 基于距离概念所得到的群体解, 与大部分决策成员的意愿较相近, 而基于支配概念的解只与少数参考点在可行域的决策者意愿相近。

第二种情况是可行参考点较多, 不可行参考点较少, 结果如图4所示。结果与图1是几乎一样的。

从以上仿真结果可以看出, 在决策者给出其偏好参考点情况下, 基于距离和投票规则的多目标粒子群优化方法都可以用较小的种群规模和较少的进化代数就可以找出分布较好、与真实Pareto前沿贴近的, 并较符合群体偏好的部分Pareto解, 这对于加快群体决策是非常有益的。而基于支配概念的方法对参考点的要求较高, 只在部分情况下可以求出相应较符合群体意愿的解。所以后面实验只以基于距离和投票规则进行说明。

3.2ZDT3[3]问题

ZDT3问题的Pareto解是非连续的。实验中设置了四位决策者的参考点, 距离阈值δ=0.4, 结果如图5所示。

从图5可以看出, 对于非连续的多目标优化问题, 基于距离和投票规则的粒子群算法, 也可以找出较好的群体解。

3.3绝对多数决定和完全一致决定

对于绝对多数决定和完全一致决定, 算法主要过程与相对多数决定是一样的, 只在最后一步“外部种群档案中的最终leaders为结果”要进行修改, 不能输出全部的外部种群档案粒子, 而要对外部种群档案中的粒子再进行判断, 支配多数或全部参考点的粒子才输出。

4结论

群体决策的关键, 是要融合不同决策者的偏好, 对此, 在决策者偏好以参考点表示的情况下, 提出了基于支配和基于距离阈值两种不同概念下并以投票规则决定的多目标微粒群优化算法, 用较小的成本, 找到满足群体偏好的部分Pareto最优解。实验结果表明, 在给出参考点情况下, 用基于距离阈值的方法更符合群体成员的意愿, 找到的解更与投票规则相符, 可以大大提高群体成员最后决策的效率。

参考文献

[1] Margarita ReyesSierra, Carlos A.Coello Coello.Multi-Objective Particle Swarm Optimizers:A Survey of the State-of-the-Art[J].International Journal of Computational Intelligence Research 2006, 2 (3) :287308.

[2] Coello C A C, Lechuga M S.MOPSO:A Proposal for Multiple Objective Particle Swarm Optimization.in Congress on Evolutionary Computation[C].IEEE Congress on Evolutionary Computation, IEEE Service Center, Piscataway, New Jersey, 2002 (2) :10511056.

[3]Deb K, Agrawal S, Pratar A, et al.Afast and elitist multi-objective ge-netic algorithm:NSGAⅡ[J].IEEE Transactions on Evolutionary Com-putation, 2002, 6 (2) :182197.

[4] Jella Pfeiffer, Uli Golle, Franz Rothlauf.Reference Point Based Multi-Objective Evolutionary Algorithms for Group Decisions[C].Genetic and Evolutionary Compu tation Conference, ACM Press, Atlanta, USA, 2008:697704.

[5]Kalyanmoy Deb, Sundar J.Reference Point Based Multi-Objective Optimi-zation Using Evolutionary Algorithms[C].Genetic and Evolu-tionaryComputation Confere nce, ACM Press, Seattle, Washington, USA, 2006 (1) :635642.

[6]Kalyanmoy Deb, Abhay Kumar.Light Beam Search Based Multi-Objec-tive Optimization using Evolutionary Algorithms[C].IEEE Congress onEvolutionary Computation, IEEE Press, Singapore, September, 2007:21252132.

决策规则 第10篇

对于互斥项目选优决策, 目前却莫衷一是, 难以理清头绪, 本文通过对互斥项目决策规划的现状、存在的问题进行研究, 从而给出互斥项目的决策规则。

一、现行的互斥项目决策指标

互斥项目决策是指对多个相互排斥、不能同时并存的项目, 在每个项目已具备财务可行性的前提下, 比较各个项目的优劣, 利用评价指标从中选出一个最优项目的过程。关于互斥项目决策标准, 无论是在实践上还是在理论上, 都没有切实可行的一致标准, 主要有以下三种观点:一是只注重投资效果, 其标准是净现值大者为优, 理由是企业的经营目标是获取尽可能多的净收益, 而不是尽可能高的收益率;二是只注重投资效率, 其标准是收益率大者为优, 理由是在资源稀缺的当今世界, 为避免资源浪费, 只有投资收益率最高的方案才是可接受的方案;三是将投资效果与投资效率综合起来考虑, 但均是理论上应该怎样而没有能用于实际且切实可行的方法。正因如此, 对同一互斥方案选优, 不同决策者可能会做出截然相反的决策结果。

理论上, 运用静态评价指标和动态评价指标对互斥项目进行决策时, 如果静态评价指标和动态评价指标发生矛盾, 以动态评价指标为准, 已经形成共识。从动态评价指标来看, 人们普遍提到的指标主要有:净现值 (NPV) 、净现值率 (NPVR) 、现值指数 (PI) 、内部收益率 (IRR) 、年均净现值 (UAV) 或年均成本 (UAC) , 此外, 还有差量净现值 (△NPV) 、差量内部收益率 (△IRR) 。上述动态评价指标可以分为以下两类:

1. 反映投资效果的指标:

净现值 (NPV) 、年均净现值 (UAV) 或年均成本 (UAC) 、差量净现值 (△NPV) 、差量内部收益率 (△IRR) 。

可以证明, 净现值 (NPV) 和差量净现值 (△NPV) 、差量内部收益率 (△IRR) 的评价结果总是一致的, 即彼此相互等价, 其本质是净现值最大。由于年均净现值 (UAV) 就是动态的平均一年净现值, 因此, 反映投资效果的最主要指标就是净现值 (NPV) 。

2. 反映投资效率的指标:

净现值率 (NPVR) 、现值指数 (PI) 、内部收益率 (IRR) 。由于NPVR、PI受折现率大小的影响, 而IRR是反映投资项目的预期收益率, 不受折现率的影响, 其作用要大于其他投资效率指标, 因此, 反映投资效率的最主要指标就是内部收益率 (IRR) 。

目前, 从管理会计、财务管理教科书和有关论文来看, 几乎无一例外地以投资效果作为互斥项目选优的标准, 即以NPV、ΔNPV、ΔIRR、UAV或UAC作为主要评价指标, 即只注重投资的效果, 而不注重投资的效率。虽然也使用投资效率指标IRR、NPVR、PI, 但是, 一旦与投资效果指标发生矛盾, 均以投资效果指标为准, 甚至认为净现值 (NPV) 指标没有明显缺陷, 并且将净现值 (NPV) 与内部收益率 (IRR) 进行比较后得出结论:内部收益率 (IRR) 有时会出现错误, 而净现值 (NPV) 总是正确的。

二、互斥项目决策存在的问题

1. 缺乏理性。

(1) 用净现值 (NPV) 指标否定内部收益率 (IRR) 指标。由于决策者以投资效果大小作为决策标准, 即以净现值大的项目为最优项目, 无一例外地均假设有甲、乙两个互斥项目, 甲项目的原始投资大于乙项目的原始投资, 其净现值、内部收益率、差量内部收益率如下页图1、图2、图3。

当△IRR>ic (ic为基准收益率) 时, 由图1, 当然选择净现值大的项目甲, 而不选择内部收益率大的项目乙;同样, 当△IRR

但由此就说净现值法总是正确的, 净现值法较内部收益率法好, 未免有失偏颇, 这并非内部收益率法不如净现值法好, 而是立场使然。如果以投资效率作为决策标准, 即以内部收益率大的项目为最优项目, 则不管基准收益率是多少, 都选择内部收益率大的项目乙, 当ΔIRR>ic时, 由图1, 选择净现值小的项目乙, 而不选择净现值大的项目甲, 如果项目甲是靠浪费大量资源来取得较大的净现值, 选择净现值小的乙项目显然是正确的, 此时应该说内部收益率法优于净现值法。因此, 不能用净现值 (NPV) 指标否定内部收益率 (IRR) 指标, 有时会出现矛盾, 仅仅是因为两种评价标准出发点不同, 一个是看效果, 一个是看效率, 并无优劣之分。

(2) 原始投资不同的互斥项目决策, 采用差量内部收益率法不能解决问题。很多教科书都认为:“对原始投资额相同的互斥项目决策, 采用净现值法;对原始投资额不同的互斥项目决策, 采用差量内部收益率法。”事实上, 这和不管原始投资额是否相同, 都采用净现值法的结论是一样的。前面已经说过, 净现值法与差量内部收益率法是等价的, 实质是净现值最大, 也就是说, 不管原始投资额是否相同, 采用差量内部收益率法和采用净现值法, 就决策结果而言, 没有什么区别, 那种认为差量内部收益率法是解决原始投资额不同的一种有效方法, 仅仅是一种感觉而已。

2. 缺乏现实性。

(1) 假设资金无限量。在资源稀缺的现代社会, 资金是不可能无限量的。以资金无限量为前提条件, 一是脱离客观实际, 二是容易引起靠浪费资源来获取更大收益。 (2) 假设投资机会固定。即假设除讨论的投资项目外, 没有其他投资机会。实际上, 企业除了讨论的投资项目外, 既可以将资金存入银行, 也可以购买股票、债券、基金等金融资产, 以投资机会固定为前提条件, 显然脱离客观实际。在上述任何一个假设条件下, 得出的决策规则显然缺乏现实性。

3. 缺乏可操作性。

(1) 决策规则缺乏可操作性。在讨论互斥项目的决策规则时, 只给出个别情况的决策规则, 而忽略其他情况, 没有基本原则, 难以理清头绪, 因而不具有可操作性。

众所周知, 项目计算期和原始投资额是影响决策结果的最重要因素, 受其共同影响的情况有以下四种: (1) 项目计算期相同, 原始投资额相同。 (2) 项目计算期相同, 原始投资额不同。 (3) 项目计算期不同, 原始投资额相同。 (4) 项目计算期不同, 原始投资额不同。

实际情况是, 在进行互斥项目决策时, 有的只考虑原始投资额是否相同;有的只考虑项目计算期是否相同;有的只考虑上述四种情况中的个别情况, 没有给出其他情况下的决策规则。甚至在讨论互斥项目的决策规则时, 几乎都是讲典型项目的决策, 一般都是就事论事, 没有给出一般情况下的决策规则, 使人不得要领, 不知道如何操作。

(2) 投资项目的风险调整缺乏可操作性。为了有效地考虑风险对投资价值的影响, 要按照投资风险大小适当地调整现金净流量或者贴现率, 基本方法是风险调整现金流量法 (即肯定当量法) 和风险调整折现率法。笔者认为, 项目的投资风险是客观存在的, 在对项目各年的现金净流量进行预计和确定折现率时, 不仅要考虑投资风险, 也要考虑通货膨胀对项目的影响, 也就是说, 在风险和通货膨胀存在的情况下, 先把考虑风险的现金净流量调整为没有风险的现金净流量, 然后再和没有风险的折现率去计算净现值。或者, 把没有风险的折现率调整为考虑风险的折现率, 然后再和考虑风险的现金净流量去计算净现值, 如此等等。

上述调整方法主观因素太多, 实际上很难操作, 如果对不准确的现金净流量或折现率再去进行不准确的调整, 无论怎样调整都不会准确, 风险也不一定降低, 还不如在现实的风险和通货膨胀条件下, 直接对现金净流量和折现率进行预计更现实, 更具可操作性。

4. 理论与实践不一致。

在相关教科书和有关论文中, 几乎都认为, 净现值法优于内部收益率法, 也就是说, 都是从投资的效果出发, 以净现值最大的项目为最优项目。在一份针对美国大型跨国公司运用资本预算方法的问卷调查中, 有63.5%的企业采用内部收益率法, 只有16.5%的企业采用净现值法, 18.2%的企业选择了其他方法。有调查显示, 在中国香港、印度尼西亚、马来西亚、菲律宾等亚太地区, 也有相当多的公司在使用内部收益率法。既然净现值法优于内部收益率法, 为什么还有那么多的企业在使用内部收益率法, 而不使用净现值法呢?显然, 他们更注重资源的有效利用, 如果没有资源, 还哪来的收益更大。

四、互斥项目的决策规则

笔者认为, 在对互斥项目进行选优决策时, 不能只注重投资效果, 而不注重投资效率, 也不能只注重投资效率, 而不注重投资效果, 投资效果和投资效率都是不可忽视的重要方面, 忽视哪一方都有可能使决策失误, 也就是说, 既要考虑投资的效果, 又要考虑投资的效率。由于内部收益率是反映资源利用效率的最主要指标, 净现值则是反映净收益的最主要指标, 因此, 在对互斥项目进行投资决策时, 应分别计算各自的净现值和内部收益率, 以在提高资源利用效率的基础上实现净收益更大化为目的, 进行综合分析, 才能做出比较满意的投资决策。在此基础上, 给出互斥项目决策规则, 只要能计算出每个项目的净现值和内部收益率, 不管是什么类型, 均可按下列规则进行决策。

假设有甲、乙两个互斥项目, n甲、n乙分别表示甲、乙项目计算期, 分别表示甲、乙项目原始投资现值, 以净现值和内部收益率IRR (使的折现率i) 作为主要评价指标, 决策规则如下:

1. 若NPV甲≥NPV乙、IRR甲>IRR乙 (净现值与内部收益率评价结果一致) , 选择甲项目。此为决策规则一。

2. 决策规则二的前提条件是NPV甲≥NPV乙、IRR甲

其中:K为资本成本率 (通常以银行存款或国债利率表示) , ic为行业折现率或投资者要求的最低报酬率。

(4) n甲≠n乙, 分以下四种情况:

3. 净现值与内部收益率的评价结果不一致时, 决策规则的出发点。

此时, 既要考虑投资效果, 又要考虑投资效率, 在提高资源利用效率基础上实现净收益 (利润) 更大化。

(1) 原始投资额不同、项目计算期相同时, 以“剩余净现值”大者为优。所谓“剩余净现值”, 是指原始投资额不同时, 用该项目的净现值减去该项目比另一项目多投资部分机会成本的现值之和, 或项目计算期不同时, 用该项目的净现值减去该项目原始投资与比另一项目多投资年限的机会成本现值之和 (其中, 机会成本的计算, 既不是计算净现值的基准收益率, 也不是内部收益率, 而是银行存款或国债利率, 因为用原始投资或多出来的原始投资再投资, 无法保证能获得基准收益率或内部收益率的利润率, 而得到银行存款或国债利率的利润率, 则几乎没有风险) 。

以“剩余净现值”大者为优, 是因为原始投资额大的项目净现值大, 可能是浪费资源得到的, 因此, 只有减去多投资部分机会成本的现值之和, 净现值大的项目才符合在提高资源利用效率基础上的净收益 (利润) 更大化目标。

(2) 原始投资额相同、项目计算期不同时, 以年均净现值大者为优。这是因为平均每年的净现值最大, 在利用相同项目计算期进行比较时, 其净现值也最大, 又因为原始投资额相同, 不存在浪费资源问题, 因此, 符合在提高资源利用效率基础上的净收益 (利润) 更大化目标。

(3) 原始投资额不同、项目计算期也不同时, 一般以“年均剩余净现值”大者为优。所谓“年均剩余净现值”, 就是动态的剩余净现值的年平均值。以“年均剩余净现值”大者为优, 是因为解决原始投资额不同的办法是计算“剩余净现值”, 解决项目计算期不同的办法是计算“年均净现值”, 当原始投资额不同、项目计算期也不同时, 综合考虑的结果就是“年均剩余净现值”大者为优。举例说明如下。

例:某公司决定新建一个车间, 有甲、乙两个项目可供选择。甲项目需在第一年初投入100万元, 一年后投产, 投产前需垫支流动资金10万元, 项目经济寿命3年, 其现金净流量经测算依次为40万元、56万元、60万元。乙项目需在第一年初投入50万元, 也是一年后投产, 投产前需垫支流动资金10万元, 经济寿命也是3年, 其现金净流量经测算依次为25万元、30万元、32万元, 基准收益率为10%, 机会成本为3%。试对甲、乙两项目做出选优决策。

解:因n甲=4=n乙, 经计算, P甲=109.09万元

NPV甲=6.986万元>NPV乙=5.946万元

属于决策规则二中 (3) 的情况, 还需计算甲项目的剩余净现值:

小于乙项目净现值5.946万元, 故选择乙项目。

本例至少可以说明两个问题:

第一, 如果采用净现值法, 应该选择甲项目, 如果采用内部收益率法, 应该选择乙项目, 投资效果与投资效率发生了矛盾, 而以在提高资源利用效率基础上实现净收益更大化为标准进行权衡的结果是选择乙项目, 而不是净现值法总是正确的。

理由很简单, 甲项目比乙项目多获得1.04万元 (6.986-5.946) 净现值, 是多投入50万元 (109.09-50.09) 资金的代价, 如果将这50万元资金购买国债, 四年利息的现值是4.755万元, 远远高于多获得的净现值1.04万元, 因而选择乙项目。也就是说, 如果有109.09万元资金, 选择甲项目投入59.09万元, 将剩余50万元存入银行, 四年后共获得净现值10.721万元 (5.946+4.755) , 远远高于甲项目净现值6.986万元。更重要的是, 选择乙项目的投资风险远远小于甲项目的投资风险, 因为乙项目亏损最多损失50.09万元, 而50万元国债的风险几乎为零, 从而至少有4.755万元的利息收益;而甲项目亏损最大损失是109.09万元。

第二, “对原始投资额不同的互斥项目决策, 采用差量内部收益率法”, 其结果总是正确的。经计算, 本例差量内部收益率ΔIRR=10.74%, 大于基准收益率10%, 按差量收益率法的决策规则, 应选择原始投资额大的甲项目, 与净现值法结论完全相同。这也说明差量内部收益率法根本就不能解决原始投资额不同的问题。

五、结束语

在互斥项目决策中, 几乎一边倒地认为, 净现值法总是正确的。笔者认为, 对净现值法的过度推崇, 容易引起靠浪费资源来获取更大的净现值, 为了赚取更多的净现值而不惜投入大量资金, 尽管考虑了货币时间价值和投资风险价值, 其结果还是导致大量资源浪费。更不能假设资金无限量, 就认为以较低的投资报酬率, 靠加大投资来取得更大净现值的项目是最优项目, 这无疑是在浪费资源。我国的资源利用效率远远低于西方发达国家, 不能说与这种指导思想没有关系。基于此, 笔者站在提高资源利用效率基础上实现净收益 (利润) 更大化的角度, 试图对互斥项目决策的混乱情况, 理出个头绪来, 给出各种情况下的决策规则, 使其更理性, 更具现实性、可操作性。

参考文献

[1].傅元略.中级财务管理.上海:复旦大学出版社, 2007

[2].宋效中.现代管理会计.北京:机械工业出版社, 2007

[3].杨丹.中级财务管理.大连:东北财经大学出版社, 2010

[4].姚海鑫.财务管理.北京:清华大学出版社, 2008

决策规则范文

决策规则范文(精选10篇)决策规则 第1篇Pawlak提出的粗糙集理论 (RSA) [1,2]是一种处理不确定性问题的新型数学工具, 其理论核心是不可...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部