电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

加权灰关联度范文

来源:莲生三十二作者:开心麻花2026-01-071

加权灰关联度范文(精选4篇)

加权灰关联度 第1篇

建筑业是资源和能源消耗的典型产业,其发展同时面临着增强竞争力和提高可持续水平的挑战。然而目前国内在产业层面上对建筑业的研究多侧重于产业竞争力或可持续发展其中一方面,综合考虑较少。王家远和叶银川用主成分分析法综合评价了北京等6省市的建筑业竞争力[1]。徐燕君从发展水平、发展效率、发展能力、发展协调度、资源消耗和环境效应几个方面研究了上海建筑业的可持续发展[2]。刘星和任夏仪提出了面向房地产企业的可持续竞争力指标体系[3]。国外多以企业为主体研究建筑业企业的可持续竞争力,如Sinem Korkmaz和John I. Messner对美国和土耳其建筑公司的调查比较[4]。

本文研究的建筑业可持续竞争力,是指建筑业按照产业可持续发展的要求,通过在竞争力各个要素上的改善,使产业处于优势竞争地位和可持续发展状态的综合能力。

1 建筑业可持续竞争力指标体系

“可持续发展”的明确定义首次出现在世界环境与发展委员会(WCED)1987年的报告《我们共同的未来》中。产业竞争优势理论则由迈克尔·波特(Michael Porter)提出,他认为“生产要素”“需求条件”“相关与支持性产业”“企业战略、结构和竞争对手”四大关键要素和“政府”“机会”两个不可控变数构成的“钻石体系”决定了产业竞争力[5]。

本文综合分析了产业竞争优势理论和可持续发展理论,并进一步结合我国建筑业实际,建立了建筑业可持续竞争力指标体系,如表1所示。

2 均方根差法基本步骤

2.1 无量纲化

均方根差法立足于客观差异确定权重而不是评价值,因而无量纲化即可满足其数据变换要求。叶宗裕比较了极差正规化、标准化和均值化,认为均值化保留了指标变异程度,更适用于处理客观数据[6]。本文采纳均值化法进行无量纲化。

设有比较对象集C={ci|iN},其中,N={1,2,…,n};指标集D={dj|jM},其中,M={1,2,…,m}。令指标值集为X=(xij)n×m,xij表示第i个对象的第j个指标值,并用Xi表示第i个对象各个指标值的序列,用Xj表示第j个指标在各个对象下的指标值序列,则均值化无量纲化计算公式为:

xij=xijX¯j=xij1ni=1nxij (1)

2.2 计算各指标的均方根差

各指标均方根差的计算公式为:

σ(Xj)=i=1n(xij-E(Xj))2n (2)

根号内的常数分母可在归一化时约去,有时为便于计算,式(2)可简化为:

σ(Xj)=i=1n(xij-E(Xj))2 (3)

E(Xj)=1ni=1nxij (4)

2.3 归一化均方根差得到权重

均方根差的归一化公式为:

ωj=σ(Xj)j=1mσ(Xj) (5)

由以上基本步骤可知,基于均值化的均方根差法重视各比较对象间的属性差异,因而得出的权重具有较好的区分度。

3 加权灰关联分析原理

灰关联分析常用于因素分析、优选排序和优势分析[7]。灰均衡关联度可以修正灰关联度潜在的点关联倾向[8],但仍然没有考虑指标权重。同等看待各项指标不利于充分体现比较对象间的差异,为克服这一缺陷,本文将均方根差法确定的权重与关联系数结合得出加权灰均衡关联度,以之作为比较依据。步骤如下。

3.1 数据变换

对涉及到的极大型指标和极小型指标,本文采纳与文献[9]中一致的思路,先进行数据变换,根据指标极性确定由最理想值构成的参考序列后再进行比较[9]。

为保留信息差异,采用均值化进行数据变换,方式同式(1)。

3.2 确定参考序列

记参考序列为X′0={x′0j|jM},当Xj为极大型指标时:

x0j=maxiΝxij (6)

当X′j为极小型指标时:

x0j=miniΝxij (7)

3.3 计算灰关联系数与加权灰关联度

各比较对象与理想值构成的参考序列的关联系数计算公式为:

γ(x0j,xij)=miniΝminjΜ|x0j-xij|+ξmaxiΝmaxjΜ|x0j-xij||x0j-xij|+ξmaxiΝmaxjΜ|x0j-xij| (8)

其中,ξ为分辨系数,按照最小信息原理,ξ取0.5[9]。

加权关联度计算公式为:

γ(X0Xi)=j=1mωjγ(x0jxij) (9)

关联度计算公式为:

γ(X0,Xi)=1mj=1mγ(x0jxij) (10)

3.4 计算均衡度

建立灰关联系数映射:

ρij=γ(x0jxij)j=1mγ(x0jxij) (11)

则第i个对象的灰关联系数熵为:

Ηi=-j=1mρijlnρij (12)

灰关联系数熵与最大熵的比值即为均衡度:

Bi=ΗiΗmax=Ηilnm (13)

3.5 计算加权灰均衡关联度

加权灰均衡关联度计算公式为:

B′ai=Bi·γ′(X′0,X′i) (14)

灰均衡关联度计算公式为:

Bai=Bi·γ(X′0,X′i) (15)

4 实例分析

根据《中国统计年鉴-2008》和《中国建筑业统计年鉴-2008》中的数据(西藏地区能耗、电耗2指标统计数据缺失,采用均数替代),计算后比较分析我国31个省市区的建筑业可持续竞争力。

用基于均值化的均方根差法得到的指标权重向量为:

W=(0.035,0.031,0.033,0.023,0.016,0.026,0.079,0.083,0.062,0.050,0.038,0.021,0.049,0.047,0.022,0.029,0.030,0.019,0.023,0.026,0.043,0.021,0.039,0.051,0.074,0.030)。

灰均衡关联度以及加权灰均衡关联度的值和排序结果见表2。

从表2可以看出,加权灰均衡关联度与灰均衡关联度得出的两种排序发生了变化,部分比较对象(如河北与西藏)相对位置变动剧烈。对比可知,加权灰均衡关联度的计算结果更符合各省市区的实际差异。造成这种变化的原因可以从权重向量中分析得出:均方根差法尊重了客观信息差异,变异程度大的指标权重较大,因此用该法加权更合理。

5 结语

本文综合考虑竞争优势理论和可持续发展理论,从生产要素资源、发展支持条件、产业结构效益和可持续效应四方面建立了建筑业可持续竞争力指标体系,运用基于均值化和均方根差法的加权灰均衡关联度对我国31个省市区(不含港澳台)进行了比较研究。实例分析验证了该方法符合实际地区差异,较为合理有效。

摘要:将产业竞争优势理论和可持续发展理论结合,建立了建筑业可持续竞争力指标体系,用加权灰关联分析方法衡量比较对象与理想序列的符合程度,实例分析证明该方法的有效性。

关键词:建筑业,可持续竞争力,均方根差,加权灰关联度

参考文献

[1]王家远,叶银川.主成分分析法评价地区建筑业竞争力[J].深圳大学学报(理工版),2009,26(1):92-97.

[2]徐燕君.上海建筑业可持续发展评价体系研究[D].上海:同济大学,2007.

[3]刘星,任夏仪.房地产企业可持续竞争力评价指标体系[J].统计与决策,2005(7):37-38.

[4]S.Korkmaz,John I.Messner.Competitive positioning and conti-nuity of construction firms in international markets[J].Journalof Management in Engineering,2008,24(4):207-216.

[5]迈克尔.波特.国家竞争优势[M].李明轩,邱如美,译.北京:华夏出版社,2002:65-123.

[6]叶宗裕.关于多指标综合评价中指标正向化和无量纲化方法的选择[J].浙江统计,2003(4):24-25.

[7]肖新平,宋中民,李峰.灰技术基础及应用[M].北京:科学出版社,2005:3-9.

[8]张岐山,邓聚龙,邵勇.均衡关联度灰关联分析方法[J].华中理工大学学报,1995,23(11):94-97.

基于空间映射的区间灰数关联度模型 第2篇

灰色关联分析是灰色系统理论的重要组成部分, 是对运行机制与物理原型不清晰, 或者根本缺乏物理原型的灰色关系序列化、模式化, 进而建立灰色关联分析模型, 为复杂系统的建模提供重要的技术分析手段。20多年来, 灰色关联分析无论在理论研究还是在应用领域, 都取得了长足的发展, 成功地解决了生产和生活中的大量实际问题[1]。

随着灰色关联分析在应用领域的不断深入和拓展, 研究者根据实际需要, 以灰色关联四公理为基础, 构造出了一系列的灰色关联度量化模型, 如C型关联度[2] 、斜率关联度[3,4]、灰色绝对关联度[5]、灰色欧几里德关联度[6]、灰色T型关联度[7,8,9]等, 同时对灰色关联度的模型性质进行了研究[10,11,12]。然而, 上述灰色关联模型, 其建模对象仅局限于实数序列, 尚无法对灰数序列的灰色关联度进行有效研究。随着科学技术的发展, 人类所涉及的系统越来越复杂, 表征系统的信息灰度也越来越大, 在这样的大背景下, 以实数序列为对象的传统灰色关联模型, 已经无法满足系统分析的实际需要。

因此, 构建基于“灰数序列”的灰色关联度模型, 更符合人们对系统未来趋势的把握和认识, 对丰富与完善灰色关联分析的理论体系、拓展灰色关联度的应用范围, 均具有十分重要的意义。

然而, 由于目前灰代数运算体系尚不完善, 体现在灰数间的数学运算将导致运算结果灰度增加, 因此, 基于常规的代数方法, 难以对灰数关联度的构造展开有效研究。本文通过建立基于空间映射的区间灰数序列几何表征体系, 将区间灰数序列在二维直角坐标平面体系中进行映射, 挖掘区间灰数所蕴含的几何意义, 提出基于区间灰数序列的灰数带, 以及基于相邻区间灰数的灰数层两个基本概念;然后, 通过计算灰数层的面积以及灰数层中位线中点的坐标, 在不损失已有灰数信息的条件下, 将区间灰数序列转变成实数序列群;最后, 以邓氏关联度为基础, 构造基于灰数序列的灰数关联度模型。该模型充分考虑原始序列的所有灰数信息对灰数关联度模型构造的影响, 体现了灰色系统理论“信息充分利用”的思想;另一方面, 整个建模过程规避了区间灰数之间的代数运算, 降低了灰色关联分析结果的灰度, 有效解决了区间灰数关联度模型的构建问题。

2 基本概念

定义1 由区间灰数⨂ (tk) ∈[ak, bk] (k=1, 2, , n) 构成的序列称为区间灰数序列, 记做X (⨂) = (⨂ (t1) , ⨂ (t2) , , ⨂ (tn) ) , 将区间灰数序列X (⨂) 中的元素在二维坐标平面直角坐标系中进行映射, 顺次连接相邻区间灰数的上界点和下界点而围成的图形, 称为灰数带; 相邻区间灰数之间的灰数带, 称为灰数层; 根据灰数层在灰数带中的位置, 依次记为灰数层1, 灰数层2, , 如图1所示。

定义2 以区间灰数序列X (⨂) = (⨂ (t1) , ⨂ (t2) , , ⨂ (tn) ) (⨂ (tk) ∈[ak, bk], k=1, 2, , n) 为建模对象的灰色关联度, 称为区间灰数关联度。

定义3[5] 设系统行为序列Xi={xi (k) }nk=1, i=1, 2, , m, 对于ξ∈ (0, 1) , 令

γ (x0 (k) , xi (k) ) =minimink|x0 (k) -xi (k) |+ξmaximaxk|x0 (k) -xi (k) ||x0 (k) -xi (k) |+ξmaximaxk|x0 (k) -xi (k) | (1) γ (X0, Xi) =1nk=1nγ (x0 (k) , xi (k) ) (2)

γ (X0, Xi) 满足灰色关联四公理, 其中ξ称为分辨系数;γ (X0, Xi) 称为X0与Xi的灰色关联度。

3 区间灰数序列与实数序列群的转换

3.1 面积转换

设区间灰数序列X (⨂) = (⨂ (t1) , ⨂ (t2) , , ⨂ (tn) ) , 其中Δtk=tk-tk-1=1, ⨂ (tk) ∈[ak, bk], k=1, 2, , n. 根据定义1及图1, 可计算灰数层p的面积 (其中p=1, 2, , n-1) , 根据梯形的面积公式,

S (p) = (bp-ap) + (bp+1-ap+1) 2 (tp+1-tp) (3)

因为Δtk=tk-tk-1=1, tp+1-tp=1, 故

S (p) = (bp-ap) + (bp+1-ap+1) 2 (4)

式 (4) 在形式上表现为灰数层p的面积, 在数值上等于⨂ (tp+1) 与⨂ (tp) 灰数长度的紧邻均值生成 (当且仅当X (⨂) 是1-时距的灰数序列时) 。通过式 (4) , 灰数带中所有灰数层的面积构成实数序列, 记为S= (S (t1) , S (t2) , , S (tn-1) ) 。

为方便, 对基于灰数层面积的区间灰数与实数的转换, 简称为“面积转换”, 通过面积转换而得到的实数序列, 简称“面积序列”。

3.2 坐标转换

区间灰数序列X (⨂) = ([a1, b1], [a2, b2], , [an, bn]) , 其对应的灰数带及灰数层如图2所示。其中, 灰数带中带圈的数字 (①、②、) 表示灰数层编号, 灰数层中与t轴垂直的虚线 (A1B1、A2B2、、An-1Bn-1) 是灰数层的中位线, O1、O2、O3、O4、、On-1是灰数层中位线的中点。

定理1 图2所示的灰数带中, 灰数层p (p=1, 2, , n-1) 的中位线中点纵坐标为:

w (p) =ap+ap+1+bp+bp+14

证明 当p=1时, 从图2可知, 点A1经过 (1, a1 ) 和 (2, a2 ) 两点, 则经过A1的直线为

x= (a2-a1) t+2a1-a2 (5)

又因为A1的横坐标t=1.5, 根据式 (5) 计算得A1的纵坐标x (A1) = (a1+a2) /2。因为A1B1是灰数层①的中位线, 根据梯形的中位线定理, 得A1B1的长度为:

A1B1= (b1-a1) + (b2-a2) 2

O1是A1B1的中点, 故O1点的纵坐标为:A1点纵坐标向上平移A1B1长度一半的距离, 即:

w (1) =a1+a22+ (b1-a1) + (b2-a2) 22=a1+a2+b1+b24

以此类推, 可知灰数层p中位线中点的纵坐标为w (p) = (ap+ap+1+bp+bp+1) /4, 证明完毕。

根据定理1, 经过所有灰数层中位线中点的纵坐标组成一实数序列, 记做W, 则W= (w (1) , w (2) , , w (n-1) ) , 其中, w (k) = (ak+ak+1+bk+bk+1) /4, k=1, 2, , n-1。

为方便, 以下对基于灰数层中位线中点的区间灰数与实数的转换, 简称为“坐标转换”, 通过坐标转换而得到的实数序列, 简称“坐标序列”。

性质1 面积序列与坐标序列含有的信息量与原区间灰数序列相等。

证明 根据式 (5) , 得

S (k) = (bk-ak) + (bk+1-ak+1) 2 (bk+1-ak+1) =2S (k) - (bk-ak) S (k-1) = (bk-1-ak-1) + (bk-ak) 2 (bk-ak) =2S (k-1) - (bk-1-ak-1) S (1) = (b1-a1) + (b2-a2) 2 (b2-a2) =2S (1) - (b1-a1) =const

因此

(bk+1-ak+1) =2S (k) -[2S (k-1) - (bk-1-ak-1) ]=2S (k) -2S (k-1) ++ (-1) k (b2-a2) =A

类似地, 根据定理1, 可知:

(bk+1+ak+1) =4w (k) -[4w (k-1) - (bk-1+ak-1) ]=4w (k) -4w (k-1) ++ (-1) k (b2+a2) =B

所以

ak+1=B-A2bk+1=B+A2

(tk+1) [B-A2, B+A2]

从证明过程可以发现, 根据面积序列和坐标序列中的元素, 可以推导出对应的区间灰数。因此面积序列与坐标序列含有的信息量与原区间灰数序列相等。

4 灰数关联度模型的构建

根据第3节可知, 通过“面积转换”和“坐标转换”, 区间灰数序列可转换成两个实数序列, 且面积序列与坐标序列所含有的信息量与原区间灰数序列相等, 即

X () = ( (t1) , (t2) , , (tn) ) {S= (S (t1) , S (t2) , , S (tn-1) ) W= (w (1) , w (2) , , w (n-1) ) } (6)

现通过系统行为的区间灰数序列, 通过“面积转换”和“坐标转换”, 将区间灰数序列转化成实数序列群, 然后建立的邓氏关联度模型。

设系统行为的区间灰数序列Xi (⨂) ={⨂i (k) }nk=1, i=1, 2, , m, 即

X1 () = (1 (t1) , 1 (t2) , , 1 (tn) ) X2 () = (2 (t1) , 2 (t2) , , 2 (tn) ) Xm () = (m (t1) , m (t2) , , m (tn) )

根据式 (6) , 可得到如下转换关系

定义4 对于ξs∈ (0, 1) , 令

γ (s1 (tk) , si (tk) ) =minimink|s1 (tk) -si (tk) |+ξmaximaxk|s1 (tk) -si (tk) ||s1 (tk) -si (tk) |+ξmaximaxk|s1 (tk) -si (tk) | (7) γ (S1 () , Si () ) =1n-1k=1nγ (s1 (tk) , si (tk) ) (8)

γ (S1 (⨂) , Si (⨂) ) 为X1 (⨂) 与Xi (⨂) 的面积灰数关联度, ξs称为面积灰数关联度的分辨系数。

定义5 对于ξw∈ (0, 1) , 令

γ (w1 (tk) , wi (tk) ) =minimink|w1 (tk) -wi (tk) |+ξmaximaxk|w1 (tk) -wi (tk) ||w1 (tk) -wi (tk) |+ξmaximaxk|w1 (tk) -wi (tk) |γ (W1 () , Wi () ) =1n-1k=1nγ (w1 (tk) , wi (tk) )

γ (W0 (⨂) , Wi (⨂) ) 为X0 (⨂) 与Xi (⨂) 的坐标灰数关联度, ξw称为坐标灰数关联度的分辨系数。

定义6 令

γ (X1 () , Xi () ) =γ (S1 () , Si () ) φ+γ (W1 () , Wi () ) (1-φ)

γ (X1 (⨂) , Xi (⨂) ) 为X1 (⨂) 与Xi (⨂) 的灰数关联度, 其中φ∈[0, 1]。

5 模型应用

某市工业、农业、运输业、商业各部门的行为数据是区间灰数, 如下;

工业: X1 (⨂) = (⨂1 (t1) , ⨂1 (t2) , ⨂1 (t3) , ⨂1 (t4) ) = ([43, 50], [40, 48], [39, 45], [38, 42])

农业: X2 (⨂) = (⨂2 (t1) , ⨂2 (t2) , ⨂2 (t3) , ⨂2 (t4) ) = ([36, 42], [37, 45], [41, 46], [42, 48])

商业: X3 (⨂) = (⨂3 (t1) , ⨂3 (t2) , ⨂3 (t3) , ⨂3 (t4) ) = ([2.3, 4.6], [2.3, 3.2], [2.6, 4.8], [2.6, 4.8])

运输业: X4 (⨂) = (⨂4 (t1) , ⨂4 (t2) , ⨂4 (t3) , ⨂4 (t4) ) = ([5.6, 7.8], [5.7, 7.9], [4.5, 6.5], [3.5, 6.0])

X1 (⨂) 为特征序列, 计算X1 (⨂) 与农业X2 (⨂) 、商业X3 (⨂) 及运输业 X4 (⨂) 的灰数关联度。

Step1: 计算X1 (⨂) 、X2 (⨂) 、X3 (⨂) 及X4 (⨂) 所对应的面积序列与坐标序列, 结果见表1所示。

Step2: 计算X2 (⨂) 、X3 (⨂) 及X4 (⨂) 与X1 (⨂) 的面积灰数关联度、坐标灰数关联度。

γ (S1 (⨂) , S2 (⨂) ) =0.8729

γ (S1 (⨂) , S3 (⨂) ) =0.7475

γ (S1 (⨂) , S4 (⨂) ) =0.7456

γ (W1 (⨂) , W2 (⨂) ) =0.6984

γ (W1 (⨂) , W3 (⨂) ) =0.6494

γ (W1 (⨂) , W4 (⨂) ) =0.7602

Step3: 计算X2 (⨂) 、X3 (⨂) 及X4 (⨂) 与X1 (⨂) 的灰数关联度。

γ (X1 (⨂) , X2 (⨂) ) =0.7857

γ (X1 (⨂) , X3 (⨂) ) =0.6985

γ (X1 (⨂) , X4 (⨂) ) =0.7529

6 结论

区间灰数相对于实数具有更加复杂的数据结构, 而目前由于灰代数运算体系尚不完善, 导致构建灰数关联度模型具有较大的难度。本文通过建立基于空间映射的区间灰数序列几何表征体系, 挖掘区间灰数所蕴含的几何意义, 在不损失已有灰数信息的条件下, 将区间灰数序列转变成实数序列群, 并以邓氏关联度为基础, 构造了基于灰数序列的灰数关联度模型。基于灰数的灰色关联度模型的构建及其性质研究, 是灰色系统理论的一个新课题, 本文的研究成果对灰色关联理论体系的进一步完善具有一定的促进作用。

参考文献

[1]邓聚龙.灰理论基础[M].武汉:华中科技大学出版社, 2002, 122~202.

[2]王清印, 赵秀恒.C型关联分析[J].华中理工大学学报, 1999, 27 (3) :75~77.

[3]Zeng B, Liu S F.A new improved model of thedegree of grey slope incidences based on the changerate of slope[C]//IEEE International Conferenceon Grey Systems and Intelligent Services, 2009:57~61.

[4]李学全.灰色关联度量化模型的进一步研究[J].系统工程, 1995, 13 (6) :58~61.

[5]刘思峰, 党耀国, 方志耕.灰色系统理论及其应用 (第三版) [M].北京:科学出版社, 2004:3~4, 51~53, 55~60.

[6]赵艳林等.灰色欧几里德关联度[J].广西大学学报 (自然科学版) , 1998, 23 (1) :10~13.

[7]孙玉刚, 党耀国.灰色T型关联度的改进[J].系统工程理论与实践, 2008, No.4:135~139.

[8]曾波等.灰色组合预测模型及其应用[J].中国管理科学, 2009, 17 (5) :150~155.

[9]曾波, 刘思峰.基于灰色关联度的小样本预测模型[J].统计与信息论坛, 2009, 24 (12) :22~26.

[10]肖新平等.灰技术基础及其应用 (第一版) [M].北京:科学出版社, 2005:3~5.

[11]谢乃明, 刘思峰.几类关联度模型的平行性和一致性[J].系统工程, 2007, 25 (8) :98~102.

加权灰关联度 第3篇

目前国内外关于变压器故障诊断的方法有很多,主要的方法是基于油中溶解气体分析 ( Dissolved Gas Analysis,DGA) 的国际电工委员会 ( International Electro Technical Commission,IEC ) 三比值法,故障诊断率可以达到80% 以上[1]。但是这种诊断方法还存在以下不足: 1油中气体含量没有达到注意值时,无法利用三比值法进行故障诊断; 2故障诊断得到的编码不在已知编码表范围之内时,IEC三比值法失效。

本文利用收集的DGA数据,将熵权法与加权灰关联度模型相结合用于变压器故障诊断。利用熵权法确定加权灰关联度模型中的权重,属于客观赋权法,可以充分利用DGA数据的信息,消除主观因素的影响。灰色关联分析对于处理小样本、贫信息的系统具有优势,诊断信息不完备的系统准确率较高,因此可以将灰色关联分析应用于变压器故障诊断[2]。一般关联度模型在进行关联度计算时通常采取均权或专家赋权,权重受主观影响较大,熵是随机变量不确定性信息的量度,利用熵权法确定权重可以更加客观地反映系统的状态。

2 灰关联度诊断变压器故障原理

灰关联度诊断变压器故障类型,其实质是比较系统各序列之间几何形状的接近程度。通常几何形状越接近,变化趋势越趋于一致,关联度就越大。变压器在实际运行过程中,油中气体的体积分数会构成一条关于时间的曲线,运行状态不同,运行曲线形状则不同,比较待诊变压器的运行曲线和标准模式下运行曲线的接近程度,就可以对变压器的故障类型进行判断。

具体判断步骤如下: 通过收集DGA数据,建立一组典型的包含变压器各种运行状态的标准故障模式向量; 选取适当的灰关联模型,计算待诊变压器的运行状态向量与标准故障模式向量之间的关联度,并将其降序排列,关联度最大的模式就是待诊变压器的运行状态。如果标准故障模式向量数据越精确,划分越详细,则诊断准确率就越高。

3 标准故障模式建立

待诊故障模式序列为M0,标准故障模式序列为M1~ M9,9种模式分别为正常运行、低温过热、中温过热、高温过热、局部放电、低能放电、高能放电、低能放电过热故障、高能放电过热故障,每种故障类型中分别包含五种油中气体,分别是H2、CH4、C2H6、C2H4、C2H2,利用公开发行的变压器故障气体数据,根据均值生成法对数据进行统计和筛选建立标准谱,均值生成法可以有效解决数据的随机问题,以变压器低温过热故障为例,介绍统计算法,具体过程如下: 变压器发生低温过热故障时,H2和总烃的比值高于27% ,统计全部低温过热故障类型的H2和总烃之比,然后计算平均值; 选择靠近平均值的一个变压器故障的特征气体数据为标准值,将其他变压器特征气体数据中H2和总烃的比值与这个标准值相减,并取其绝对值,剔除所得数据中偏差较大的数据; 再利用上面的方法,对剩余的数据求取平均值,做第二和第三次的剔除工作; 最后得到此故障类型特征气体数据的平均值。其他气体在不同故障类型下的数据都可以通过上述方法得到。根据上述方法得到的变压器标准故障模式是唯一的,它的准确性取决于特征气体数据的数量以及主观剔除工作等因素,但是当样本数据增加时,数据的完备性也会越来越完善。在对特征气体数据不断处理和调整后,最终得到变压器故障诊断的标准谱,如表1所示。表1中的数据表示变压器油中气体含量体积分数。

对表1中的数据进行无量纲化处理,处理的方式是每一种模式下各项气体含量都除以该模式下气体含量的最大值,得到无量纲化处理后的标准谱如表2所示。

4 灰关联模型

4. 1 加权关联度模型

参考文献[3],各点灰关联系数的计算公式为:

式中,ρ为分辨系数; x0( j) ( j = 1,2,…,n) 为一般关联度模型中经过无量纲处理后的参考数据,由此构成的参考数据序列为为系统第i个因素在第j个对象的观测数据,并称为系统中因素xi的指标序列。和第j个对象处的灰关联系数。

式( 1) 可改写为:

则序列{ x0( j) } 和{ xi( j) } 的灰色关联度为:

式中,ωj是第j点的权重系数,且满足条件。在计算关联度时,权重的选择是关键。

4. 2 熵权法

求解指标权重有两种方法: 一是主观赋权法,利用专家经验对指标权重赋值; 二是客观赋权法,利用客观数据之间的关系确定权重。其中应用较为广泛的是熵权法。主观赋权法具有较大的主观随意性,且结果容易受专家知识、经验缺乏的影响,熵可以反映随机变量的不确定性信息量,利用熵权法客观赋权可以对信息进行有效利用,其结果更具有客观性[4]。

熵权法根据各指标包含信息量的多少确定指标的权重,指标权重的大小与熵值成反比,指标的熵值越小,说明包含信息量越多,重要性越明显,则权重越大。

设有m种故障模式,n项指标,xij表示第i种故障模式的第j项指标的数值,则原始的数据矩阵为。对原始数据矩阵进行无量纲化处理得到矩阵

计算在第j项指标下第i种故障模式的比重:

计算第j项指标的熵:

当Pij= 0时,ln Pij无意义,所以需要对其修整,将其定义为:

各指标的权重为:

利用灰关联度诊断变压器故障,不要求DGA数据是否具有典型的分布规律,此特点有利于提高故障诊断的精度。但是观察式( 2) 和式( 3) ,可知分辨系数ρ和权重ωj直接影响着关联度的计算和排序,所以需要对二者进行合理的取值。为了消除平均法赋权和专家赋权所产生的主观因素的影响,用熵权法对权重ωj进行客观赋权,参考文献[5]中分布系数ρ的取值原则和方法,根据标准故障模式向量和待诊模式向量的具体情况进行动态取值,可以更加客观地反映DGA数据的情况,并且灵活性好,抗干扰性强。

4. 3 变压器故障诊断过程

对于待诊断故障的变压器,通过收集变压器油中气体数据,建立待诊故障模式向量M0,根据式( 4) ~ 式( 6) 计算各指标权重ωj,参考文献[6]中的公式,计算分辨系数ρ,再根据式( 2) 和式( 3) 计算灰色关联度γi,并对其降序排列,关联度最大的故障类型即为待诊变压器的故障类型,关联度的排序表示待诊变压器属于各种标准故障类型可能性大小的排列情况。

5 实例分析

参考文献[6-9]给出的变压器油中气体数据,利用文中方法对以下两例故障变压器进行诊断。

例1: 某待诊变压器油中气体组分含量H2、CH4、C2H6、C2H4、C2H2分别是1565、93、47、34、0; 单位: μL/L,无量纲化 处理后的 数据是1、0. 0594、0. 0300、0. 0217、0。

根据文献[5]中分辨系数取值公式,计算得到ρ值为0. 69。根据式( 4) ~ 式( 6) ,得到各指标权重向量ω为:

根据式( 2) 和式( 3) ,计算得到灰色关联度向量Γ为:

则灰色关联度降序排列为:

故待诊变压器模式向量M0与M5关联度最大,所以故障类型为局部放电,结果与实际情况相符。IEC三比值法对应编码为011,无匹配编码,不能进行故障诊断。

例2: 待诊变压器油中气体组分含量H2、CH4、C2H6、C2H4、C2H2分别是334、39. 9、47. 8、5. 4、247. 6,单位: μL / L; 无量纲化处理后的数据是1、0. 1195、0. 1431、0. 0162、0. 7413。各指标权重向量ω为

根据式( 2) 和式( 3) ,计算得到灰色关联度向量Γ为:

关联度降序排列为:

故待诊变压器模式向量M0与M7关联度最大,所以故障类型为高能放电,结果与实际情况相符。IEC三比值法诊断结果为低能放电,与实际不符。

为了充分验证文中方法的诊断性能,将其同三比值法和一般灰色关联度法进行对比,根据网络公开发表的变压器故障气体数据[6,7,8,9,10,11,12,13,14,15]以及从甘肃省电力公司所获取的数据信息,对117组不同变压器油中气体色谱数据进行诊断,结果如表3所示。

6 结论

本文将熵权法和加权关联度模型结合用于变压器故障诊断,避免了一般关联度模型中采用均权或专家赋权带来的主观因素的影响,同时优化了分辨系数,并发挥了灰关联分析利用小样本数据诊断的优势,充分利用了DGA数据,提高了信息的利用率,降低了系统干扰带来的误差,使结果更加客观和科学。

实际应用时,在关联度的降序排列中,当某两个或两个以上的关联度数值相差很小时( 此阈值可根据实际情况进行调整) ,说明变压器发生了两种或以上的故障,此时可以进行多故障诊断识别。同时也可以结合CO和CO2伴生的增长情况,进一步对故障原因进行分析。

摘要:油中气体分析是诊断变压器故障的重要方法,但是传统的三比值法存在缺陷。针对变压器故障诊断时信息不完全的问题,提出了结合熵权法和加权灰关联度模型用于变压器故障诊断。该方法利用熵权法确定指标客观权重,通过计算加权关联度判断变压器故障类型。熵权法和加权灰关联度模型相结合充分利用了油中气体数据的全部信息,且发挥了灰关联度适用于小样本、贫信息系统的优势,避免了局部关联和信息损失的缺陷。实例分析结果表明,该方法具有较好的识别变压器故障的效果。

加权灰关联度 第4篇

关键词:信息检索,查询扩展,项完全加权,关联规则

0 引 言

近年来,将数据挖掘技术应用于信息检索以提高检索性能成为信息检索领域研究的热点,各种基于关联规则挖掘的信息检索模型[1,2,3,4]相继被提出。例如,文献[1]提出了基于关联规则的个性化信息检索系统模型,该模型通过分析用户的访问日志,运用关联规则算法挖掘出用户个性化信息,优化查询请求,然而,文章并没有进行相关的实验。文献[2]提出了基于关联规则的Web信息检索模型,并以逻辑层次、服务域与数据路由为中心,对过去用户访问的各种链接和网页内容进行挖掘,从理论上阐述了所提模型的有效性,但也没有进行相关的实验性研究。文献[3]提出了一种基于关联规则挖掘的个性化智能推荐服务,从访问log文件中挖掘出用户事务模式,采用多种Web挖掘技术和方法,实现在线方式的个性化智能推荐服务,实验结果表明了该方法的有效性。

目前,在信息检索中使用查询扩展得到广泛的关注和研究,成为信息检索领域研究的另一个热点。查询扩展是改善和提高信息检索性能的关键技术之一,它指的是利用计算机多种技术,把与原查询相关的词或者词组添加到原查询,得到比原查询更长的新查询,以弥补原查询信息的不足。传统的查询扩展技术[5]主要有全局分析、局部分析以及基于用户查询日志和基于关联规则挖掘的查询扩展[6,7,8]。文献[4]从全局分析的角度提出了一种基于关联库的查询扩展方法,将关联规则挖掘应用于查询扩展,以提高信息检索性能,但实验部分比较粗糙。

在现有基于关联规则挖掘的信息检索查询扩展研究中,有的是从全局分析的角度进行,有的是基于局部分析考虑的。然而,基于全局的方法要推广到实际应用层次在目前的技术环境下难度很大,因为全局分析下的文档集必然会很大,由于频繁项集的数量是随着数据库中数据项数目的增加呈指数增长,在全局分析下的文本数据库中数据项一般都有数千,甚至到数万,因此,即使采取各种剪枝策略,要处理的候选项集和频繁项集的数量还很多,致使挖掘词间关联规则的效率和时间无法让用户接受,而用户查询信息时都追求速度快、信息全而准。另一方面,现有的研究很少重视关联规则的挖掘技术及其规则质量对信息检索查询扩展检索性能的影响,更没有考虑在挖掘词间关联规则时其特征词在不同的事务文档记录中往往有着不同的重要性而引入完全加权的项权重。

针对上述的缺陷,本文提出了一种新的信息检索模型基于完全加权关联规则挖掘和查询扩展的信息检索模型。该模型实行两次检索机制,在检索中采用基于完全加权关联规则挖掘的查询扩展等关键技术:首先通过传统向量空间模型检索算法(即tf-idf算法)进行初检,提取前列n篇文档组成局部文档集;然后,对局部文档集进行完全加权词间关联规则挖掘,构造规则库,从中提取与原查询词相关的扩展词,并添加到原查询中,组成更长、更准确的新查询,进行第二次检索;最后,返回最终结果给用户。在该模型中,采用了基于完全加权关联规则挖掘的局部反馈查询扩展技术作为实现的关键技术,充分考虑特征词项在数据库里不同的事务文档记录中存在不同的重要性,引入了完全加权的项权值,使所获得的扩展词更加实际、合理,更准确地反映原查询词的语义。实验结果表明,该模型有效,能提高和改善信息检索性能,有很高的实际应用价值和推广前景。

1基于完全加权关联规则挖掘和查询扩展的信息检索模型

1.1 设计思想

基于完全加权关联规则挖掘和查询扩展的信息检索模型的基本思想是:对用户查询实行两次检索机制,即第一次检索是对用户原查询进行初检,提取初检的前列n篇排序文档作为初检局部文档集;第二次检索首先采用基于完全加权关联规则挖掘的局部反馈查询扩展技术对原始查询进行扩展优化,得到查询扩展后的新查询,再进行检索,返回检索结果给用户。

1.2 模型图及其模块功能

根据上述的设计思想,给出如图1所示的信息检索模型结构图。

该模型包括4个数据库(基于向量空间模型的文档数据库、前列初检文档数据库、完全加权关联规则库和停用词库)和6个功能模块。

主要模块功能如下:

(1) 中文语词预处理模块

该模块实现中文语词切分、去掉停用词等功能。对用户查询和测试文档集进行中文语词切分,去掉停用词,提取特征词,用向量形式表示用户查询和每一篇文档,构建基于向量空间模型的文档数据库。

(2) tf-idf算法检索模块

使用基于向量空间模型的检索方法对全部文档集进行检索,通过余弦公式计算文档与原始查询或者查询扩展后新查询的相似度,并按降序排列。

(3) 前列初检文档生成模块

选取初检时原查询与文档的相似度值不低于0.2的前列文档组成关联规则挖掘所需要的相关文档集,生成前列初检文档数据库。

(4) 完全加权关联规则挖掘模块

采用完全加权关联规则挖掘算法[9](即MAWAR挖掘算法)对前列初检文档进行完全加权关联规则挖掘,将含有原查询项的关联规则入库。

(5) 查询扩展与构建新查询模块

按所给的查询扩展模型从关联规则库中提取与原查询相关的后件作为扩展词,计算扩展词权重并排降序,按照所排降序的结果选取前列m个扩展词加入到原查询(原查询权重置为2)集合中组成新查询。通过“tf-idf算法检索模块”对全部文档集进行第二次检索,通过余弦公式计算文档与新查询的相似度,按降序排列,输出到“最终检索结果生成模块”。

(6) 最终检索结果生成模块

按照所要求的输出格式生成查询扩展后第二次检索得到的相关文档集,返回给用户界面。

1.3 信息检索模型中的关键技术

1.3.1 完全加权词间关联规则挖掘

在向量空间模型VSM(Vector Space Model)中,将文档视为事务,将语词看作事务项,即特征词项,这样就可以对VSM的文本数据库进行词间关联规则挖掘。本文信息检索模型利用完全加权词间关联规则挖掘算法[9](即AWARM算法)在初检局部结果集中挖掘与原查询词相关的扩展词,实现查询扩展。针对查询扩展的特点,在挖掘规则时,只挖掘含有原查询项的完全加权关联规则。为此,在AWARM算法剪枝策略的基础上增加了新的剪枝策略,即从候选2_项集起,将不含原查询项的候选项集剪掉,只保留含有原查询项的,这样极大地减少无用候选项集(即不含原查询项的候选项集),提高挖掘效率和查询扩展的速度。

1.3.2 基于完全加权关联规则挖掘的局部反馈查询扩展

基于完全加权关联规则挖掘的局部反馈查询扩展基本思想是:首先对初检获得的前列n篇初检文档进行完全加权词间关联规则挖掘,提取含有原查询项的完全加权关联规则构建规则库,将以原查询词集合为前件的完全加权关联规则后件部分作为扩展词,根据所给的扩展词权重计算方法计算其权值,添加到原查询中组成新查询,实现查询扩展。

在查询扩展中,原查询项永远是最重要的,扩展词的重要性不会高于原查询语词。为了体现这种思想,在进行查询扩展时,原查询和扩展词的权重计算方法如下:原查询的各个查询项权重设为2;扩展词的权值Wexp=(关联规则中原查询项个数/原查询中所有查询项总数)关联规则置信度。

2基于完全加权关联规则挖掘和查询扩展的信息检索算法

算法:Information-Retrieval Algorithm Based on All-weighted Association Rules and Query Expansion (简称AARQEretrieval算法)

输入:原查询Q,minawsup和minawconf(最小完全加权支持度和置信度阈值)。

输出:查询扩展后的检索结果。

算法描述:

3 实验设计及其结果分析

3.1 数据集和评测方法

为了测试本文提出的基于完全加权关联规则挖掘的信息检索模型的检索性能,从网上下载了720篇论文作为原始测试文档集。设计10个实际的查询(Q1,Q2,,Q10)作为查询集供实验用,在原始测试文档集中通过人工检索比较,获得每个查询的相关文档篇数。对原始测试文档集经过分词、去掉停用词等文档预处理,构建基于向量空间模型的文本数据库。对查询集的查询也作类似的预处理,得到查询向量形式。本文采用的主要评测指标是MAP(Mean of Average Precision)[10],它表示查询集中每个查询Q的平均准确率的算术平均值(AvgPrec(Q)),即:

MAP=AvgPrec(Q)=1RQi=1rQi#DocQ(i)(1)

其中RQ为查询Q在语料集中的相关文档总数;rQ 为检索系统针对查询Q共检索出的相关文档数;#DocQ(i)表示检索系统针对查询Q在检索结果中的第i篇相关文档被检出时总共被检索出的文档数。

3.2 实验结果及其分析

编写了实验源程序,将本文的信息检索算法(即AARQEretrieval算法)、基于局部上下文分析的查询扩展[11]的检索算法(即LCAQEretrieval算法)和传统向量空间模型算法(即tf-idf算法)进行检索性能比较。三种算法分别对所设计的10个查询在相同的测试文档集中进行检索,统计这10个查询的平均准确率(MAP),实验结果如表1表示。

从表1可以看出,在测试数据集上,与传统向量空间模型算法相比,AARQEretrieval算法和LCAQEretrieval算法的检索性能都有显著的提高。然而,相比而言,本文AARQEretrieval算法的检索性能(即MAP)提高幅度最为明显,其平均准确率(MAP)比传统的向量空间模型算法(tf-idf)的平均提高了17.02%,而比LCAQEretrieval算法的平均提高了8.27% 。实验结果表明,本文所提出的信息检索模型的检索性能确实获得了明显的提高,比传统的基于局部上下文分析的查询扩展的检索算法效果好,主要原因是本文的信息检索模型采用了基于完全加权词间关联规则挖掘的局部反馈查询扩展等关键技术,对原查询进行了有效的扩展优化。由于对特征词项进行了完全加权,所获得的扩展词更能反映原查询的语义,使得具有明显歧义性的短查询词通过扩展词可以达到消歧作用,同时还能检索到原始短查询中不能检索到的文档,使信息检索性能得到明显的改善和提高。

4 结束语

本文在向量空间模型中将完全加权关联规则挖掘技术和查询扩展融合,提出基于完全加权关联规则挖掘的信息检索模型。该模型采用两次检索机制,首先利用传统向量空间模型对全部文档集进行初检,提取前列的初检文档进行完全加权词间关联规则挖掘,构建规则库,从中提取扩展词实现查询扩展,通过对原始查询进行扩展,组成更长、更准确的新查询来克服原查询信息的不足;然后,对新查询进行第二次检索,并返回最终检索结果。实验结果表明,该模型是有效的,能够提高信息检索性能,具有很高的实际应用价值和推广前景。

参考文献

[1]陈小华,赵捧未.基于关联规则的个性化信息检索系统研究[J].情报科学,2006,24(6):915 918.

[2]关戍,庄成三,陈定涛.一个基于关联规则的Web信息检索模型[J].计算机应用,2002,3(3):88 90.

[3]汪晓岩,胡庆生,庄镇泉.基于关联规则挖掘的个性化智能推荐服务[J].计算机科学,2002,29(7):79 83.

[4]谭义红,李学勇,陈治平.关联规则挖掘在Web信息检索中的应用[J].计算机工程,2006,32(9):57 58.

[5]黄名选,严小卫,张师超.查询扩展技术进展与展望[J].计算机应用与软件,2007,24(11):1 4.

[6]Zhang Chengqi,Qin Zhenxing,Yan Xiaowei.Association-Based Seg-mentation for Chinese-Crossed Query Expansion[J].IEEE IntelligentInformatics Bulletin,June 2005,5(1):18 25.

[7]Qin Zhenxing,Liu Li,Zhang Shichao.Mining Term Association Rulesfor Heuristic Query Construction[C]//Proceedings of 8th Pacific-AsiaConference,PAKDD 2004,Sydney,Australia,May26 28,2004:145154.

[8]Jie Wei,Qin Zhenxing,St啨phane Bressan,et al.Mining Term Associa-tion Rules for Automatic Global Query Expansion:A Case Study withTopic 202 from TREC4[C]//In Proceedings of Americas Conferenceon Information Systems,2000.

[9]黄名选,严小卫,张师超.基于文本库的完全加权词间关联规则挖掘算法[J].广西师范大学学报:自然科学版,2007,25(4):24 27.

[10]丁国栋,白硕,王斌.一种基于局部共现的查询扩展方法[J].中文信息学报,2006(3):118 127.

加权灰关联度范文

加权灰关联度范文(精选4篇)加权灰关联度 第1篇建筑业是资源和能源消耗的典型产业,其发展同时面临着增强竞争力和提高可持续水平的挑战。...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部