电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

分布式概率范文

来源:开心麻花作者:开心麻花2026-01-071

分布式概率范文(精选9篇)

分布式概率 第1篇

光伏发电与一般的能源电厂(比如说火电厂等)有相似之处,例如都是把其他类型的能源改变成电能去使用,并且有着很高的电能质量。但因为太阳能自然波动,光伏发电并网会对电力体系并网造成一些影响:原动力不能控制力、对电能质量有一定的影响,对电网运行调度和系统的可靠性也有不同的影响。

国内外研究人员越来越关注准确地建立光伏电源的输出功率概率模型。目前关于光伏出力模型的研究主要分为两大类:

第一类预测模型基于太阳能辐射强度。首先建立太阳辐射预测模型,再使用当地的气候历史数据得出预测值,然后逆变建模得出光伏发电系统的输出功率预测值。ALEXIADIS等[1]将其建立在对数正态、Weibull函数以及Beta分布的太阳辐照程度的概率模型的基础上,然后根据美国3个地区5年的历史数据,对应使用X2以及K-S等4种检验方式测评其拟合程度,在Beta分布下获得最好的拟合程度。BILLITON等[2]依照欧洲部分区域的历史太阳辐照度信息,使用正态、Weibull函数以及Extreme Value I型分布确立概率模型,并使用极大似然法验证其拟合程度,实际结果能够看出,Weibul以及Value I型分布对一些区域的拟合程度很好,但并没有找到能够使用到任何地方的参数分布。该方法的准确性依赖于详细的气象数据。越精确的预测结果就需要越复杂的模型,同时需要越多的历史数据和越多的数据类型,使得预测过程十分复杂,不利于实际的应用。

第二类直接预测光伏电站的输出功率。文献[3,4]提出了一种方法,该方法具有一定的实用性。文献基于马尔可夫链建立太阳能的转移矩阵,然后预测1天内该光伏发电系统的出力。但是该方法认为太阳能一天中每时每刻的转移趋势相同,使用的是同一个转移矩阵进行预测,忽略了光伏电站输出功率每日变化的特性。

目前,研究电力系统其他不确定性问题(不是光伏发电系统输出功率)主要采用概率分析方法[5,6,7],其中Monte Carlo法能不用延间接地模拟需要获得随机变量的概率分散特点;另有解析法,经过算出半不变量,进行级数可以获得想要获得的概率分布,较多地使用Gram-Charlier级数[8],但必然会出现一定的程度的误差。不管是哪一种方式都需要精准地了解随机变量的随机特点,换句话说就是:第一点需要确立每一个随机变量的分布模型,之后进行有关概率测评。但是由于太阳辐射的特点是随机性和间歇性,先假设分布则无法全面分析各种随机因素的影响,所建光伏电源模型不能够准确反映其特性。因此本文结合概率论基本思想,在太阳能辐射模型的基础上,建立了基于非参数核密度估计的分布式光伏电源并网出力概率模型。

1 光伏电源出力概率模型

1.1 非参数核密度估计

非参数核密度估计方法不受到分布制约,换句话说就是:该方式是不完全依靠于总体分布和其参数的数学方式。该方式已经在能源等很多方面获得一定的应用价值。对于一些参数方式,非参数方式主要有如下3个益处。

(1)偏差更小。在使用非参数方式的时候,样本n已经“特别大”,这就能够让非参数统计中有关统计数量的确切分布和其极限分布的相差“特别小”,并且由于非参数统计方法通常基于相关统计量的某些极限性质,所以在应用上基本“可以忽略不计”使用极限分布所带来的偏差。

(2)更广泛的适用性。因为非参数方式只使用普通的数据建立模型,对信息的限定是比较少,对总体的限制也不多,相对比来说,参数统计方式一旦模型更改,方式也随之进行更改。这是因为参数一般对设定的模型有很多的限定的性质,例如极大似然估计,它需要总体概率密度的具体图形已知。

(3)更好的稳健特性。所谓的稳健性主要指统计方法在假设的理论模型和实际模型没有很大差距的偏离时依然能保持很好的性质的性能。非参数统计天然具有稳健性,是因为它对模型的限定不多,只有最弱的限定。但是参数统计法一般是确立在假设限定至上,一旦假定限定不匹配,其正确性就会比较低。

密度估计可包括两种,即参数密度估计和非参数密度估计,主要指的是在给定样本后,对其总体密度函数的估计,前者已无法满足越来越高的精度要求,而针对后者来说,最初则产生于直方图法,渐渐演变成核密度估计法等多种类型,在此过程中,该种理论得到了比较健全的发展,并且有效阐述了非参数函数估计的一般特征。

相对来说,后者方法主要的不同之处:参数估计要求密度函数f(∙)已经具有某种特定的数学形式且只包含少量参数未知。比如:f(∙)为正态或Gamma分布。而当密度函数f(∙)的所属类型未知时(或最多只知道连续、可微等很少数的条件),非参数核密度估计可以仅从现有的样本数据得出密度函数的表达式。非参数核密度估计分为单变量核密度估计与多变量核密度估计,重点在于带宽的选择。

(1)单变量核密度估计。假设X1,X2,⋯Xn是n个离散随机样本,其概率密度函数f(x)未知,从经验分布函数中导出所需要的概率密度函数的核密度估计如下:

取均匀核为核函数:

则密度估计为:

在此过程中h即为带宽(所表示的为窗宽或者平滑系数);n即是样本容量,将核函数窗宽则能够获得核密度估计:

公式中所表示的核函数即为K(∙),其具有如下特性:

K(∙)一般均选择根据0作为主要核心的对称单峰概率密度函数,具体如表1所示。

核函数的选择依据是距离分配各个样本点对密度贡献的重要程度,但核函数的选择不是这种方法中最重要的因素,因该估计只要核函数具有对称单峰的特点,就可以确保所有核函数均可以确保密度估计有着一定的稳定相合性。相关研究人员通过进行研究了解到,一旦带宽系数h最优,则不同核函数作用等价。所以通常认为最优带宽的条件下任何核函数都合适。

(2)单变量核密度估计的宽窗(带宽)的选择。若样本足够多,精度则决定于核函数与带宽两个方面。经证实:假设具有带宽时,不一样的核函数对的影响具有等价特征,而当给定核函数,带宽不同则对有很大的影响。

核密度估计的偏差和方差公式如式(6—7),从中可以看出窗宽h不能使偏差与方差在同一时间内变少,假设h取值比较大的时候,则会促使偏差较大,方差比较小的时候,相对比较平滑,遗漏函数的某些细节;若h取值较小,使得偏差会减小,而方差很大,欠平衡,会出现较大摆动。因此需要寻找能使方差和偏差综合权衡的最优带宽h。

K(u)为核函数。对于最优带宽来说,一般情况下均将误差最低值作为基本函数,并对其实行最小化的优化运算得出,与其他的误差公式存在差异,则能够获得不一样的最优带宽算法,以渐进均方误差为例对ROT算法简要计算,渐进积分均方误差:

对其求偏导数,则得到使得渐进均方误差取最小值时的带宽:

式(11)中该式R(f'')含未知概率密度函数f(x)的二阶导数,而这个函数未知,因此只有完成对R(f'')的估计才能够求得hAMISE。文献[9]采用高斯核函数,假设f(x)也服从正态分布时,可以得到:

该式子中的σ和IQR分别表示随机变量的x的标准差和四分位距。学者进一步简化论证为:

另外一种获得最佳带宽h的方式即为选取极大似然估计,并对其实行极大似然交叉证明[10]。

1.2 光伏输出功率的非参数核密度估计的概率模型

①概率分布模型。根据(2)非参数核密度估计的基本原理可以看出,该方法主要研究数据的分布特征,不需要经验的累积,均是将样本信息作为基础而展开研究,世界各地有很多研究人员应用这一方式不但在负荷建模以及风速建模等方面取得了成就,并且也在可靠性指标计算[11,12,13]中都取得了一定的成功。

本文在研究的过程中,主要根据非参数核密度估计的相关理念阐述了全新的方式,且这一方式不必具备其他参数分布的要求,可以相对系统的考虑各种相关都气象因素对光伏功率输出的影响。

假设p1,p2,⋯pn为光伏电源的输出功率p的n个样本,输出功率p的概率密度函数为f(p),则根据非参数核密度估计的理论进行估计f(p)为[14]:

在上述公式中,h表示的是带宽,n表示的样本数量;K表示的是核函数。一般情况下,均对核函数选择应用对称单峰概率密度函数,并将0作为主要核心,具备下述公式(16)所呈现出的特征。在核密度估计时,通常均会选择高斯函数当作核函数,如(16)式所示。

②最优带宽的求取。由前文分析可知,建立的非参数核密度估计的光伏输出功率的概率模型后,需要考虑最优带宽从而使得该概率密度函数最接近真实的f(p),通常建立优化模型来选取。本文采用上节所述的简化算法,即采用式(14)进行求取最优带宽h。

2 结语

本文主要创建了有关非参数核密度估计的概率分布模型。阐释分析了已有文献提的概率模型,主要基于参数分布的太阳辐照度的概率分布模型,然后导出光伏输出功率;而本文所提出的率模型,能全面考虑各种因素对光伏电源输出功率的影响。该方法能够大范围的应用在具备光伏电力系统的概率分析以及评定等方面。

摘要:随着大规模的光伏电源接入电力系统,人们越来越关注其输出功率的波动性对电网的运行与控制的影响。建立光伏电源输出功率概率模型将有助于运行人员更好地实现对含光伏电源的电力系的控制。目前,光伏电源出力概率建模方法需要先假设概率分布,无法全面分析各种随机因素的影响。因此文章结合概率论基本思想,在太阳能辐射模型的基础上,建立了基于非参数核密度估计的光伏电源并网出力概率模型。

分布式概率 第2篇

在许多问题中,只知道平均数和方差还不够,还需要知道样本中数据在各个小范围所占的比例的大小,这就需要研究如何对一组数据进行整理,以便得到它的频率分布。

2、研究频率分布的一般步骤及有关概念

(1)研究样本的频率分布的一般步骤是:

①计算极差(最大值与最小值的差)

②决定组距与组数

③决定分点

随机变量及其概率分布复习导航 第3篇

1.离散型随机变量X的概率分布

(1)如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量;按一定次序一一列出,这样的随机变量叫做离散型随机变量.

(2)设离散型随机变量X可能取的不同值为x1,x2,…,xi,…,xn,且P(X=xi)=pi,i=1,2,…,n,①,则称①为随机变量X的概率分布列,简称为X的分布列,也可以将①用下表形式来表示:Xx1x2…xi…xnPp1p2…pi…pn上表称为随机变量X的概率分布表,它和①都叫做随机变量X的概率分布.显然,这里的pi(i=1,2,…,n)具有性质:①pi≥0;②p1+p2+…+pn=1.

离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的概率值的和.

2.两点分布

如果随机变量X的概率分布表为:X10Ppq其中0

3.超几何分布

在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则随机变量X的分布列:P(X=k)=CkMCn-kN-MCnN(k=0,1,2,…,m),其中m=min{M,n},且n≤N,M≤N,n、M、N∈N*,则称X服从超几何分布,记为X~H(n,M,N∈N*),并将P(X=k)=CkMCn-kN-MCnN,记为H(k,n,M,N∈N*).

二、题型分析

题型一、离散型随机变量概率分布的性质

例1若离散型随机变量X的分布列为:X01P9c2-c3-8c试求出常数c.

解:由离散型随机变量分布列的性质可知:

9c2-c+3-8c=1,

0≤9c2-c≤1,

0≤3-8c≤1,解得c=13.

即X的分布列为:X01P2313评注:离散型随机变量的两个性质主要解决以下两类问题:①通过性质建立关系,求得参数的取值或范围,进一步求得概率,得出分布列;②求对立事件的概率或判断某概率的成立与否.

例2设离散型随机变量X的概率分布表为:X01234P0.20.10.10.3m求:(1)2X+1的概率分布表;(2)|X-1|的概率分布表.

分析:利用pi≥0,且所有概率之和为1,求m;求2X+1的值及其概率分布表;求|X-1|的值及其概率分布表.

解:由概率分布的性质知:0.2+0.1+0.1+0.3+m=1,∴m=0.3.

首先列表为:X012342X+113579|X-1|10123从而由上表得两个概率分布表为:

(1)2X+1的概率分布表:2X+113579P0.20.10.10.30.3(2)|X-1|的概率分布表:|X-1|0123P0.10.30.30.3评注:(1)利用概率分布中各概率之和为1可求参数的值,此时要注意检验,以保证每个概率值均为非负数.(2)若X是随机变量,则2X+1,|X-1|等仍然是随机变量,求它们的概率分布表可先求出相应随机变量的值,再根据对应的概率写出概率分布表.

题型二、求离散型随机变量的概率分布

例3甲、乙两队进行一场排球比赛.根据以往经验,单局比赛甲队胜乙队的概率为0.6,本场比赛采用五局三胜制,即先胜三局的队获胜,比赛结束.设各局比赛相互间没有影响.令ξ为本场比赛的局数.求ξ的概率分布列.

解:ξ的所有取值为3,4,5.

当ξ=3时,表示甲连胜3局或乙连胜3局,则

P(ξ=3)=C33×0.63×0.40+C03×0.60×0.43=0.28;

当ξ=4时,表示前3局中甲胜2局,第四局甲胜或前3局中乙胜2局,第四局乙胜,则

P(ξ=4)=C23×0.62×0.41×0.6+C13×0.61×0.42×0.4=0.3744;

当ξ=5时,表示前4局中甲胜2局,第五局甲胜或前4局中乙胜2局,第五局乙胜,则

P(ξ=5)=C24×0.62×0.42×0.6+C24×0.62×0.42×0.4=0.3456.

∴ξ的分布列为:ξ345P0.280.37440.3456评注:根据不同情形进行分类,要充分理解ξ取每一个值的具体含义.

例4袋中装着标有数字1,2,3,4,5的小球各2个,从袋中任取3个小球,按3个小球上最大数字的9倍计分,每个小球被取出的可能性都相等,用X表示取出的3个小球上的最大数字,求:(1)取出的3个小球上的数字互不相同的概率;(2)随机变量X的概率分布表;(3)计分介于20分到40分之间的概率.

分析:(1)是古典概型;(2)关键是确定X的所有可能取值;(3)计分介于20分到40分之间的概率等于X=3与X=4的概率之和.

解:(1)方法一:“一次取出的3个小球上的数字互不相同”的事件记为A,则P(A)=C35C12C12C12C310=23.

方法二:“一次取出的3个小球上的数字互不相同”的事件记为A,“一次取出的3个小球上有两个数字相同”的事件记为B,则事件A和事件B是互斥事件.

因为P(B)=C15C22C18C310=13,所以P(A)=1-P(B)=1-13=23.

(2)随机变量X的可能取值为2,3,4,5,取相应值的概率分别为P(X=2)=C34C310=130,

P(X=3)=C12C24C310+C22C14C310=215,P(X=4)=C12C26C310+C22C16C310=310,P(X=5)=C12C28C310+C22C18C310=815.

∴随机变量X的概率分布表为:X2345P130215310815(3)由于按3个小球上最大数字的9倍计分,所以当计分介于20分~40分时,X的取值为3或4,所以所求概率为P=P(X=3)+P(X=4)=215+310=1330.

评注:在解决概率分布问题时要逐渐将问题回归到概率分布表上来,这样所求的概率就可由概率分布表中相应取值的概率累加得到.

题型三、超几何分布问题

例5某班同学利用寒假在三个小区进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”,这两族人数占各自小区总人数的比例如下:A小区低碳族非低碳族比例1212B小区低碳族非低碳族比例4515C小区低碳族非低碳族比例2313(1)从A,B,C三个小区中各选一人,求恰好有2人是低碳族的概率;

(2)在B小区中随机选择20户,从中抽取的3户中“非低碳族”数量为X,求X的分布列.

解:(1)3人中恰好有2人是低碳族的概率为P=12×45×13+12×15×23+12×45×23=715.

(2)在B小区中随机选择的20户中,“非低碳族”有20×15=4(户),

P(X=k)=Ck4C3-k16C320(k=0,1,2,3),

∴P(X=0)=C04C316C320=2857,P(X=1)=C14C216C320=819,

P(X=2)=C24C116C320=895,P(X=3)=C34C016C320=1285,

故X的分布列为:X0123P28578198951285评注:超几何分布的理论基础是古典概型,主要运用于抽查产品,摸不同类别的小球等概率模型.如果随机变量X服从超几何分布,那么事件{X=k}发生的概率为P(X=k)=CkMCn-kN-MCnN,k=0,1,2,…,m.

例6一袋中装有10个大小相同的黑球和白球.已知从袋中任意摸出2个球,至少得到1个白球的概率是79.(1)求白球的个数;(2)从袋中任意摸出3个球,记得到白球的个数为X,求随机变量X的概率分布表.

分析:(1)列出符合题意的关于袋中白球个数x的方程;(2)随机变量X服从超几何分布.

解:(1)记“从袋中任意摸出2个球,至少得到1个白球”为事件A,设袋中白球的个数为x,则P(A)=1-C210-xC210=79,得到x=5.故白球有5个.

(2)X服从超几何分布,其中N=10,M=5,n=3,其中P(X=k)=Ck5C3-k5C310,k=0,1,2,3.

于是可得其概率分布表为:X0123P112512512112评注:对于服从某些特殊分布的随机变量,其概率分布表可以直接应用公式给出.超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数,随机变量取值的概率实质上是古典概型.

三、友情提示

掌握离散型随机变量的概率分布表,需注意:

(1)概率分布表的结构为两行,第一行为随机变量X所有可能取得的值;第二行是对应于随机变量X的值的事件发生的概率.看每一列,实际上是:上为“事件”,下为事件发生的概率,只不过“事件”是用一个反映其结果的实数表示的.每完成一列,就相当于求一个随机事件发生的概率.

(2)要会根据概率分布的两个性质来检验求得的概率分布表的正误.

(作者:王佩其,江苏省太仓高级中学)endprint

∴随机变量X的概率分布表为:X2345P130215310815(3)由于按3个小球上最大数字的9倍计分,所以当计分介于20分~40分时,X的取值为3或4,所以所求概率为P=P(X=3)+P(X=4)=215+310=1330.

评注:在解决概率分布问题时要逐渐将问题回归到概率分布表上来,这样所求的概率就可由概率分布表中相应取值的概率累加得到.

题型三、超几何分布问题

例5某班同学利用寒假在三个小区进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”,这两族人数占各自小区总人数的比例如下:A小区低碳族非低碳族比例1212B小区低碳族非低碳族比例4515C小区低碳族非低碳族比例2313(1)从A,B,C三个小区中各选一人,求恰好有2人是低碳族的概率;

(2)在B小区中随机选择20户,从中抽取的3户中“非低碳族”数量为X,求X的分布列.

解:(1)3人中恰好有2人是低碳族的概率为P=12×45×13+12×15×23+12×45×23=715.

(2)在B小区中随机选择的20户中,“非低碳族”有20×15=4(户),

P(X=k)=Ck4C3-k16C320(k=0,1,2,3),

∴P(X=0)=C04C316C320=2857,P(X=1)=C14C216C320=819,

P(X=2)=C24C116C320=895,P(X=3)=C34C016C320=1285,

故X的分布列为:X0123P28578198951285评注:超几何分布的理论基础是古典概型,主要运用于抽查产品,摸不同类别的小球等概率模型.如果随机变量X服从超几何分布,那么事件{X=k}发生的概率为P(X=k)=CkMCn-kN-MCnN,k=0,1,2,…,m.

例6一袋中装有10个大小相同的黑球和白球.已知从袋中任意摸出2个球,至少得到1个白球的概率是79.(1)求白球的个数;(2)从袋中任意摸出3个球,记得到白球的个数为X,求随机变量X的概率分布表.

分析:(1)列出符合题意的关于袋中白球个数x的方程;(2)随机变量X服从超几何分布.

解:(1)记“从袋中任意摸出2个球,至少得到1个白球”为事件A,设袋中白球的个数为x,则P(A)=1-C210-xC210=79,得到x=5.故白球有5个.

(2)X服从超几何分布,其中N=10,M=5,n=3,其中P(X=k)=Ck5C3-k5C310,k=0,1,2,3.

于是可得其概率分布表为:X0123P112512512112评注:对于服从某些特殊分布的随机变量,其概率分布表可以直接应用公式给出.超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数,随机变量取值的概率实质上是古典概型.

三、友情提示

掌握离散型随机变量的概率分布表,需注意:

(1)概率分布表的结构为两行,第一行为随机变量X所有可能取得的值;第二行是对应于随机变量X的值的事件发生的概率.看每一列,实际上是:上为“事件”,下为事件发生的概率,只不过“事件”是用一个反映其结果的实数表示的.每完成一列,就相当于求一个随机事件发生的概率.

(2)要会根据概率分布的两个性质来检验求得的概率分布表的正误.

(作者:王佩其,江苏省太仓高级中学)endprint

∴随机变量X的概率分布表为:X2345P130215310815(3)由于按3个小球上最大数字的9倍计分,所以当计分介于20分~40分时,X的取值为3或4,所以所求概率为P=P(X=3)+P(X=4)=215+310=1330.

评注:在解决概率分布问题时要逐渐将问题回归到概率分布表上来,这样所求的概率就可由概率分布表中相应取值的概率累加得到.

题型三、超几何分布问题

例5某班同学利用寒假在三个小区进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”,这两族人数占各自小区总人数的比例如下:A小区低碳族非低碳族比例1212B小区低碳族非低碳族比例4515C小区低碳族非低碳族比例2313(1)从A,B,C三个小区中各选一人,求恰好有2人是低碳族的概率;

(2)在B小区中随机选择20户,从中抽取的3户中“非低碳族”数量为X,求X的分布列.

解:(1)3人中恰好有2人是低碳族的概率为P=12×45×13+12×15×23+12×45×23=715.

(2)在B小区中随机选择的20户中,“非低碳族”有20×15=4(户),

P(X=k)=Ck4C3-k16C320(k=0,1,2,3),

∴P(X=0)=C04C316C320=2857,P(X=1)=C14C216C320=819,

P(X=2)=C24C116C320=895,P(X=3)=C34C016C320=1285,

故X的分布列为:X0123P28578198951285评注:超几何分布的理论基础是古典概型,主要运用于抽查产品,摸不同类别的小球等概率模型.如果随机变量X服从超几何分布,那么事件{X=k}发生的概率为P(X=k)=CkMCn-kN-MCnN,k=0,1,2,…,m.

例6一袋中装有10个大小相同的黑球和白球.已知从袋中任意摸出2个球,至少得到1个白球的概率是79.(1)求白球的个数;(2)从袋中任意摸出3个球,记得到白球的个数为X,求随机变量X的概率分布表.

分析:(1)列出符合题意的关于袋中白球个数x的方程;(2)随机变量X服从超几何分布.

解:(1)记“从袋中任意摸出2个球,至少得到1个白球”为事件A,设袋中白球的个数为x,则P(A)=1-C210-xC210=79,得到x=5.故白球有5个.

(2)X服从超几何分布,其中N=10,M=5,n=3,其中P(X=k)=Ck5C3-k5C310,k=0,1,2,3.

于是可得其概率分布表为:X0123P112512512112评注:对于服从某些特殊分布的随机变量,其概率分布表可以直接应用公式给出.超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数,随机变量取值的概率实质上是古典概型.

三、友情提示

掌握离散型随机变量的概率分布表,需注意:

(1)概率分布表的结构为两行,第一行为随机变量X所有可能取得的值;第二行是对应于随机变量X的值的事件发生的概率.看每一列,实际上是:上为“事件”,下为事件发生的概率,只不过“事件”是用一个反映其结果的实数表示的.每完成一列,就相当于求一个随机事件发生的概率.

(2)要会根据概率分布的两个性质来检验求得的概率分布表的正误.

概率分布列问题解法解析 第4篇

例1 5封不同的信, 投入三个不同的信箱, 且每封信投入每个信箱的机会均等, 是三个箱子中放有信件数目的最大值.求的分布列.

分析:三个箱子中放有信件数目的最大值ξ取最大值5, 我们容易想到, 因为5封信全部放在一个信箱中.但三个箱子中放有信件数目的最大值ξ取最小值是几呢?颇费思量, 当然经过深入思考后不难得知是1, 2, 2这种情形中的2.

解:ξ的分布列为:

二、对不同情形的发生进行分类

例2甲、乙两队进行一场排球比赛, 根据以往经验, 单局比赛甲队胜乙队的概率为0.6, 本场比赛采用五局三胜制, 即先胜三局的队获胜, 比赛结束.设各局比赛相互间没有影响, 令为本场比赛的局数, 求的概率分布. (精确到0.000 1)

解:当ξ=3时, 表示甲胜3局或乙胜3局.则P (ξ=3) =0.63+0.43=0.28.

当ξ=4时, 表示前3局甲胜2局, 第4局甲胜或前3局乙胜2局, 第4局乙胜.则P (ξ=4) =C320.620.40.6+C320.420.60.4=0.374 4.

当ξ=5时, 表示前4局甲胜2局, 第5局甲胜或前4局乙胜2局, 第5局乙胜.则P (ξ=5) =C420.620.420.6+C420.420.620.4=0.345 6.

则ξ的分布如下:

三、对不同元素的组合进行分类

例3从8个男生5个女生中抽取6个学生参加义务劳动, 其中女生的人数是随机变量, 求ξ的分布列.

解:ξ的分布列如下:

四、对n次独立重复试验发生了k次进行分类

例4某工厂规定, 如果工人在一个季度里有1个月完成生产任务, 可得奖金90元;如果有2个月完成生产任务, 可得奖金210元;如果3个月都完成生产任务, 可得奖金330元;如果3个月都未完成任务, 则没有奖金.假设某工人每月获得奖金与否是等可能的, 求此工人在一个季度里所得奖金的分布列.

可得分布列如下:

五、对n次独立重复试验第k次才发生进行分类

例5某射手有5发子弹, 射击一次命中概率为0.9, 如果命中就停止射击, 否则一直到子弹用尽, 求耗用子弹数ξ的分布列.

解:ξ的取值有1, 2, 3, 4, 5.

当ξ=1时, 即第一枪就中了,

故P (ξ=1) =0.9;

当ξ=2时, 即第一枪未中, 第二枪中了,

分布式概率 第5篇

近几十年来, 风力发电成本不断下降, 已经具有了与常规电源竞争的实力。风电并网和规划的相关研究[1,2]正日益得到重视。

风速概率分布是体现风电场风能资源的重要指标之一, 也是风电场规划运行的重要参考[3]。常用的风电场风速分布的拟合模型有瑞利分布[4]、对数正态 (Lognormal) 分布[5]和威布尔 (Welbull) 分布[6]等, 其中两参数威布尔分布是在绝大多数情况下拟合效果最好、应用最为广泛的一种, 它在拟合长周期 (如年或部分月份) 风速分布时, 效果良好[6]。

然而, 随着风电场装机容量比重的不断增加, 为保证风电场接入后电网依然保持安全稳定运行, 需要利用短时分布和特殊时段分布信息加强系统运行分析。但当需要研究更短周期或某些特殊时段的风速概率分布特性时, 气候变化等随机因素对分布影响明显增强[7]。经某风电场实际数据统计发现, 同一年内不同月份风速分布随季节气候变化不同, 分布往往存在差别。不同年份的同一月份分布也不相同, 常出现两峰甚至三峰分布情况。其规律已很难用两参数威布尔函数准确逼近。

国内外学者对多峰分布均做过相关研究。文献[8]考虑面积约束后以3次Hermite插值函数对直方图进行逼近, 效果良好, 但缺乏统计意义。其他文献多为求解混合分布。文献[9]介绍了一种用遗传算法求解混合分布的方法, 计算复杂费时;文献[10]介绍了Kececioglu方法;文献[11]采用L-M算法求解参数, 但Kececioglu方法和L-M方法都需要人工作图计算初值, 工作量较大, 有待改进。

针对以上问题, 本文提出采用七参数混合威布尔函数逼近特殊时段风速分布的方法。七参数威布尔函数是两个三参数威布尔函数的叠加, 每个威布尔函数具有各自的尺度、形状和位置参数, 可以适应双峰型风速概率密度函数逼近的需要。本文采用极大似然估计法[12]并根据实测风速数据建立混合威布尔分布的极大似然方程。考虑到特殊时段风速分布的两个峰值间可能具有较大的差异性, 且有时需要更多地关注某一峰值或某些风速段的概率密度, 本文采取对这些风速段进行加权的方式构造似然函数, 以提高这些风速段概率密度函数的拟合优度。在加权似然函数的基础上, 本文采用数论布点法[13]求解待求的7个参数, 该方法只要求目标函数连续, 对初值选择不敏感, 迭代过程只需计算目标函数。

1 风电场短时风速分布的统计特性

取某规划风场2006年和2007年11月份 (冬季大风期) 10 min平均风速采样数据绘制直方图, 如图1所示。分别对两个分布进行两参数威布尔分布的极大似然估计拟合, 可看出二者威布尔函数形状差别较大。这是因为2007年11月大于6 m/s的风速样本个数要大于2006年, 因此该年威布尔函数相对2006年有“右移”趋势。直观看2006年风速分布存在3 m/s~4 m/s和6 m/s~7 m/s两个风频峰值。而2007年风速分布存在6 m/s~7 m/s和10 m/s~11 m/s两个风频峰值, 具有双峰分布的特点。用两参数威布尔分布拟合后, 2006年风频最大误差出现在4 m/s~5 m/s风速段, 2007年风频最大误差出现在8 m/s~9 m/s段, 其相对误差分别达到53.2%和29.4%;而且对两年拟合显著程度进行皮尔森卡方 (Pearson chi-square) 检验 (显著性水平α=0.05) 后, 2006年结果未通过检验, 可见两参数威布尔分布逼近有局限性。在实际应用时, 究竟选用两参数还是混合威布尔分布, 主要根据分布的峰数决定。对分布数据滤波 (去除影响判断的毛刺) 后对风频进行扫描, 若发现几个相邻连续风频先上升后下降, 则可判断出现一个峰。若滤波处理后的分布只有一峰, 则选用两参数威布尔分布进行拟合;若有多峰, 则选用混合威布尔分布进行拟合。图1显然需要选用混合威布尔分布进行拟合。

2 混合威布尔函数拟合双峰分布

三参数威布尔函数是混合威布尔函数的基础, 比两参数威布尔函数多了一个描述分布偏移程度的位置参数。其概率密度函数f (v) 和概率分布函数F (v) 分别为:

f (v) =kcv-uck-1exp-v-uckI (u, ∞) (v) (1)

F (v) =1-exp-v-uckI (u, ∞) (v) (2)

式中:

Ι (u, ) (v) ={1v (u, ) 0v (u, )

是集合 (u, ∞) 的示性函数;k, c, u分别为非负的形状、尺度和位置参数。

在三参数分布基础上, 七参数混合威布尔概率密度函数fmix (v) 和概率分布函数Fmix (v) 可分别表示为:

fmix (v) =rf (v|c1, k1, u1) + (1-r) f (v|c2, k2, u2) (3)

Fmix (v) =rF (v|c1, k1, u1) + (1-r) F (v|c2, k2, u2) (4)

混合威布尔分布函数的参数计算是一个难点。矩估计是统计学常用的点估计方法[14], 它可通过矩估计对样本分布进行大致逼近。以样本低谷风频段的起始风速vdivide为分界风速, 将风速总体样本集V分为V1和V2两个子集, 其中V1为风速不大于vdivide的样本子集, 含N1个样本;V2为风速大于vdivide的样本子集, 含N2个样本。由V1和V2可获得混合威布尔分布的矩估计参数。

以各样本子集风速最小值作为位置参数umi (i=1, 2) 的矩估计值:

{um1=minV1um2=minV2 (5)

形状参数的矩估计值kmi (i=1, 2) 由如下方程求出:

(vavi-umi) 2σi2+ (vavi-umi) 2=Γ2 (1+1kmi) Γ (1+2kmi) (6)

式中:vavi (i=1, 2) 分别为V1和V2的平均风速;σi (i=1, 2) 分别为V1和V2的风速样本方差;Γ为伽马 (Gamma) 函数。

于是可得尺度函数cmi (i=1, 2) 的矩估计值为:

cmi=vavi-umiΓ (1+1kmi) (7)

百分比参数rm可通过样本比例得到:

rm=Ν1Ν1+Ν2 (8)

至此得到所有参数的矩估计值。一般来说, 矩估计的精度较差, 因此本文仅采用矩估计值作为优化算法的参考初值, 然后采用数论布点方法求得混合威布尔分布参数的极大似然估计。

另外, 由以上分析可见, 七参数混合威布尔分布就是两个三参数威布尔分布的“叠加”, 同样的思路可拓展到十一参数及更多参数的分布, 以适应三峰或更多峰的情形。本文仅以短时分布最易出现的双峰分布为例说明问题。

3 混合威布尔分布的参数优化

3.1 混合威布尔分布的加权极大似然方程

为求得混合分布参数优化解, 可由混合威布尔概率密度函数构造似然函数:

L (θ|v1, v2, , vn) =i=1nlnfmix (vi) (9)

由此转化为求L的最大值问题。普通极大似然估计的无偏性和一致性使得每个风频段具有相同的“权”, 事实上, 根据不同的研究需要 (如风机额定运行风速要比非额定运行风速重要) , 所有风频段均分配相同权未必合适, 可考虑对不同风频段进行权分配。权分配应根据实际风场情况有所偏重, 为此构造加权极大似然函数如下:

L (θ|v1, v2, , vn) =i=1nΡilnfmix (vi) (10)

式中:Pi为样本个体vi对应的权, 可根据研究需要设定, 也可通过计算优化调节。

3.2 采用数论布点法计算优化参数

数论布点方法[13]是数论与近似分析交叉的产物, 其实质是在S维单位立方体CS上找到一个均匀散布点集, 由数论方法得到的均匀散布点集通常称为数论网格。

用数论布点方法求函数f (z) , zD (D是一个S维矩形a, b=) 的极大值点z*, 使M=f (z*) 的基本思想是:在D上取一个数论网格P={zk, k=1, 2, , n}, 如果f (z) 是连续的, D是有界闭集, 当n充分大时, 有zk*∈P使得f (zk*) 接近M, zk*接近z*。生成数论网格的方法为:

{qkikhi (modn) uki=2qki-12n (11)

再令:

zkiai+ (bi-ai) uki (12)

得到a, b上数论网格{zk= (zk1, zk2, , zkn) , k=1, 2, , n}。为提高求解精度, 使用序贯优化算法, 即在迭代过程中使D的边长收缩, 收缩比为本步与上步求解区域边长比。具体计算步骤如下:

步骤1:初始:m=0, D (0) =D, a (0) =a, b (0) =b;

步骤2:布点:产生数论网格P (m) ={zi (m) , i=1, 2, , n};

步骤3:选优:求P (m) ∪{zi (m-1) }上的极大值点z (m) , M (m) =f (z (t) ) , {z (-1) }可定义为空集;

步骤4:迭代:令c (m) = (b (m) -a (m) ) /2, 若max c (m) i <δ, δ为预先给定正数, 取z*=z (m) , M=M (m) , 停止迭代, 否则进入步骤5;

步骤5:收缩区域:令ai (m+1) =max{zi (m) -rci (m) , ai}, bi (m+1) =max{zi (m) +rci (m) , bi}, i=1, 2, , S, 令m=m+1, 返回步骤2。

D范围的确定对优化结果影响较大。矩估计结果已可大致反映逼近函数, 因此可为D提供参考。一般地, 若矩估计的形状或尺度参数大于1, 相应D的范围下限可设为ki_min=kmi/2或ci_min=cmi/2, 上限可设为ki_max=kmi+3.0或ci_max=cmi+3.0;若形状或尺度参数小于1, 为避免计算溢出, 形状参数下限设为0.05, 上限设为0.95, 位置参数的数论布点优化结果一般与矩估计相差不大, 可设下限ui_min=umi/2, 为避免对数运算真数为0, 上限ui_max=umi-0.01。优化结果r范围变化较大, 若rm<0.8, 则设定上限rmax=rm+0.2, 否则rmax=1;下限统取为rmin=rm/2。

采用文献[13]提供的生成向量产生数论网格。m=1时布点数记为n1, m为其他值时均取为n2。为在第1步就找到较好的M (m) 而之后又不会过分降低计算速度, 取n1>n2。为保证收敛速度合理, 可设定第1步收缩比为r=0.8, 其余各步收缩比为r=0.5。

3.3 加权值优化

特殊风频段的逼近精度与该段权有重要关系, 权过低或过高都会导致逼近精度降低。风频段权上限大于2后一般逼近误差已经较大, 因此权多集中在区间[1,2]内, 变化范围较小, 为简化计算可采用较简单的步进加权方法。每次权增加一个步长, 随着权的增大, 特定风频段的逼近误差一般先减小后增大, 鞍点对应权值即可作为权优化结果。

特殊风频段的优化加权结果有时可能会极大地降低全局逼近精度, 甚至无法通过皮尔森卡方检验。这种情况下就要根据规划或工程需要有所取舍, 可综合考虑逼近精度和拟合效果选取一个略小于优化结果的较优值。

4 算例分析

对某风场2008年1月每天17时至20时期间的10 min平均风速样本进行统计, 并对样本数据进行极大似然估计拟合, 结果如图2所示。

由图2可见, 该特殊时段风频分布为双峰分布, 两峰风频段分别为4 m/s~5 m/s和8 m/s~9 m/s。其中8 m/s~9 m/s风频较大达0.207, 直方图中该风频段变化陡峭。用两参数威布尔函数似然逼近后, 风频为0.127, 相对误差达38.6%, 而该风频段恰是风机额定运行风速区间, 显然两参数威布尔分布不能准确描述该特殊时段的分布, 应考虑采用混合威布尔函数逼近。

4.1 一般极大似然估计拟合

采用本文方法, 分界风速vdivide为7 m/s, 分别以矩估计和一般极大似然估计 (不考虑加权) 对该样本进行混合威布尔函数逼近, 以均方百分比误差 (MSPE) [14]来检验3种方式的拟合误差;以皮尔森卡方检验方法检验不同方式的显著程度, 取显著性水平0.05, 将样本数较少的风频段合并后共划分为11个区间, 3种拟合方式的全局预测误差均方 (MSPE) 、重要风频段 (8 m/s~12 m/s) MSPE比较结果和皮尔森卡方检验结果见表1前3行。

直观看来, 七参数威布尔分布的矩估计和极大似然估计逼近反映出特殊时段的风速分布情况。分析表1结果可知, 两参数分布的似然估计通过了皮尔森卡方检验, 且全局MSPE小于矩估计, 但重要段MSPE较大, 逼近效果欠佳。作为粗略估计, 矩估计全局MSPE较大, 虽未能通过皮尔森卡方检验, 但相比两参数分布, 关键段的MSPE得到有效降低。作为矩估计的优化结果, 七参数分布的一般极大似然估计、全局和重要时段的MSPE均小于两参数分布情况, 且通过皮尔森卡方检验, 逼近效果良好。

4.2 加权极大似然估计拟合

为进一步提高重要风频段的逼近精度, 以重要段 (8 m/s~12 m/s) 的MSPE作为逼近指标, 采用步进加权方法进行优化, 加权步长取为0.1。不同权值对应结果见表1, 逼近效果见图3。

由图3可见, 随权重的增加, 重要风频段的MSPE先减小后增大, 说明特殊段权重较小或较大时逼近精度都会变差;全局MSPE随权重增大而增大, 说明优化过程在提高了局部逼近精度的同时牺牲了全局的逼近精度。在权重为1.7时, 重要风频段的MSPE虽然达到最小值0.114 8, 但对应的全局MSPE达到0.154 6, 误差较大;在权重大于1.3时, 所有结果均拒绝检验, 说明权重较大后全局逼近精度已下降到皮尔森卡方检验不可接受的程度。在接受检验的4组优化结果中, 权重1.3的全局MSPE较权重为1.7时减小了0.52, 而重要段的MSPE仅增加了0.001 9, 可见特殊段权重为1.3的混合威布尔分布兼顾了全局和重要风频段的逼近精度。对应不同的特殊双峰分布时段, 可根据规划的不同要求在不同权重下选取不同的拟合结果, 甚至有时为衡量规划风场额定风速区间对接入电网的冲击也可忽略皮尔森卡方检验。针对本文算例, 采用权重为1.3的优化结果较为合适。

5 结语

针对短时风速概率分布易出现双峰分布的特性提出了混合威布尔逼近方法。其中, 七参数混合威布尔分布能够准确反映短时风速的双峰分布情况, 而更多个三参数威布尔分布的混合可适应更多峰的情形。

极大似然估计模型复杂, 计算时间随峰数和样本数量的增加而延长, 是否可以找到一种逼近精度与计算速度均有所提高的新方法仍有待研究。

分布式概率 第6篇

随着国民经济发展和居民生活水平提高, 基于电力电子技术的非线性居民电器日益广泛使用, 且插入式电动汽车和民用新能源获得快速发展。这些分布式谐波源具有类似的大小并遍布在整个电力网络中。由于它们独自产生的谐波并不显著, 过去一般忽略由家用负荷注入的谐波, 但大量的类似负荷产生的集体谐波却是非常可观的, 其对电力系统的影响与危害已不可忽视[1,2,3]。居民非线性负荷产生的谐波同传统工业负荷具有明显的差别, 主要是居民负荷在电力系统中的分散性和工作状态的随机性, 评估和消除它们引起的谐波畸变在理论和工程上非常困难。

国外学者较早关注居民负荷产生的谐波, 并已开展了较多的研究工作。学者Wilsun Xu研究团队发现居民谐波电压畸变主要由系统背景谐波确定, 谐波电流畸变主要由居民负荷和系统背景谐波共同确定[1];研究了紧凑型荧光灯等单个家用电器的谐波负荷模型[2,3,4,5];并建立了基于概率论的自下向上的居民负荷谐波建模体系[6,7]。文献[8-9]定量分析了不同荧光灯负荷渗透率下配电网的谐波危害。文献[10]分析了大量单相电力电子型负荷谐波的分散效应和消减效应。

居民负荷的集体谐波评估本质上是一个概率性谐波求和问题。在概率性谐波求和方面, 国内外学者也已开展了较多研究[11,12,13,14,15,16], 主要有正态分布法、蒙特卡洛方法、中心极限定理法、基于Laguerre多项式法等。正态分布法[11]适用于评估相互之间完全独立、且大量存在的类似负荷所产生的谐波;但是考虑居民负荷类型、用户行为习惯或电力监管政策的影响, 各个居民负荷产生的谐波并不完全独立, 采用正态分布法将产生较大的误差。蒙特卡洛法[12]需要大量复杂的现场数据, 计算耗时多, 难以普遍应用。Laguerre多项式法[13,14,15]计算中会产生截断误差, 且尺度因子、修正系数的选取及样本的标准化还需进一步研究。中心极限定理法[16]联合概率密度函数的确定非常复杂, 而且需要大量的测试数据和复杂的运算, 难以实际应用。文献[17-18]对多谐波源节点的谐波责任进行评估划分, 以确定不同支路的谐波发射责任。现有方法主要从电气设备安全即电磁兼容角度进行谐波水平评估, 一般以集体谐波概率最大值, 即超过某一概率值 (如95%) 谐波电压或电流的大小, 作为谐波水平评估标准。而对于集体谐波的概率性分布关注较少, 而概率性分布体现了谐波来源, 对于确定谐波治理措施和监管政策具有重要指导意义。

云理论是国内李德毅教授提出的一种综合了模糊理论和概率理论的数学方法, 在设备敏感度评估、大坝裂缝监控、图像分割、电能质量数据分析等领域获得成功应用[19,20,21,22]。云理论是一种比概率论正态分布精确, 同时比联合分布简单易算的随机相量求和方法。本文提出一种基于云理论的居民负荷集体谐波概率分布的研究方法, 可以给出精确的居民负荷谐波概率分布, 对于研究居民谐波来源、确定谐波治理措施和监管政策具有重要理论意义。

1 云理论基本概念

1.1 云模型

云模型[23]的定义:给定定量论域U, C是U上的定性概念, 若定量数值x∈U是定性概念C的一次随机实现, x对C的确定度μ (x) ∈[0, 1]是具有稳定倾向的随机数 (不是一个固定的数值) , 即

则x在论域U上的分布称为云, 记为C (X) 。每一个x称为一个云滴。

云的数字特征用期望Ex、熵En和超熵He这3个量表示, 如图1所示, 能够把物理概念的随机性和模糊性很好地集合在一起, 形成了定性与定量之间的映射。

由云滴xi (i=1, 2, …, n) 组成的数据样本期望Ex、熵En和超熵He的计算表达式为:

1.2 云变换

云变换[24,25,26,27]把任意一个不规则的空间数据分布进行数学变换, 生成若干概念的云模型集, 使之成为若干个大小不同的云的叠加。云变换在一定的误差范围内可将任意频率分布函数分解为若干基云的叠加, 一般情况下, 叠加的云的个数越多, 变换误差越小。其数学表达式为:

式中:g (x) 为实际数据的概率分布函数;fi (x) 为云模型的期望函数;ai为幅度系数;n为产生云的个数;ε为误差阈值。

云变换的实质是采用若干个云模型的期望曲线的叠加来拟合实际数据的频率分布。

2 居民负荷集体谐波评估流程

基于云理论的居民负荷集体谐波评估流程主要包括5个部分, 如图2所示。

流程1:测量点电压、电流数据采集

中国居民配电网通常采用“闭环设计、开环运行”的模式, 低压配电网采用220V/380V电压单相或三相供电, 形成“电网—配电站—分支箱—表箱—家庭”的多级辐射电能传输网。谐波测量点可选择家庭、馈线及台区进行电压、电流数据采集, 如附录A图A1所示。

流程2:电压、电流测量数据傅里叶分析

对测量点所测电压、电流数据进行离散傅里叶 (DFT) 分析, 为满足计算精度和速度要求, 一般1s连续采样10个周期, 每个周期256个点。

流程3:电压、电流谐波值预处理

现有研究表明居民供电母线电压畸变主要由系统背景谐波确定, 谐波电流畸变主要由居民负荷和系统背景谐波共同确定[1]。本文主要研究居民负荷所产生的谐波电流。采用系统谐波阻抗法来区分负荷谐波和背景谐波, 即当系统谐波阻抗角在第一象限和第四象限时, 认为谐波电流由系统侧流向负荷侧;当系统谐波阻抗角在第二象限和第三象限时, 谐波电流的流向是由负荷侧流向系统侧。本流程剔除位于第一象限和第四象限的样本点以确保研究数据为负荷所产生的谐波。

流程4:谐波电流幅值云模型分析

谐波电流幅值概率密度函数采用云模型方法表示如式 (8) 所示。

式中:Ih和EIh分别为谐波电流幅值和期望。

其中谐波电流幅值Ih由前述流程得出, 每个谐波电流幅值看作1个云滴, 再根据式 (2) 、式 (3) 、式 (4) 计算得到谐波电流幅值的期望、熵和超熵, 形成谐波电流幅值的云模型表示, 进而计算其概率密度函数, 得出谐波电流幅值的概率分布。

式 (8) 是一个没有明确解析表达式的概率密度函数, 本文通过式 (9) 积分变换后采用高斯—埃尔米特 (Gauss-Hermite) 积分法[20]对任意谐波电流幅值I0积分以求得相应的谐波电流幅值的概率密度f (I0) , 从而进一步获得95%概率最大值。

流程5:云变换法确定谐波电流幅值概率密度函数

基于云变换的曲线拟合算法流程如图3所示。

步骤1:设置初始误差阈值ε, 迭代次数初值k=1。

步骤2:根据谐波电流幅值数集生成其概率分布曲线gk (Ih) 。

步骤3:寻找gk (Ih) 的最大值, 并作为第k个峰的幅度系数ak。

步骤4:在gk (Ih) 的最大值对应的Ih两边[Ih-Δ, Ih+Δ]取点, 根据式 (2) 、式 (3) 计算该峰所对应的云模型期望EIhk和熵Enk, 根据式 (6) 得到云模型期望函数fk (Ih) 。Δ根据需要设置, 例如Δ=0.1。

步骤5:从gk (Ih) 中减去已知云模型的数据分布fk (Ih) , 再迭代寻找最大值, 即重复步骤3, 4, 5, 得到多个基于云的数据分布函数。

步骤6:经过数次迭代后当gk (Ih) 的绝对值的最大值小于ε时迭代终止输出式 (5) 表示的曲线的拟合函数。

3 典型居民负荷谐波电流发射特征

文献[28-30]针对典型家用电器的谐波电流发射特性进行了测试及研究, 考虑国内居民家庭实际拥有情况和品牌型号的差异, 选取普及率较高典型家用电器的测试结果列入表1。

4 应用研究

4.1 数据来源

采用电力录波设备对上海某居民小区的4户家庭进行了现场测量, 如图4所示, 具有5个电流测量点和1个电压测量点。电流测量点分别为4户家庭供电进户线和总线, 电压测量点为公共连接点。对上述测点进行了为期1个月的测试, 采用本文方法对测试数据开展相关研究。

4.2 4户家庭负荷曲线和谐波幅值曲线

4户家庭及总馈线某周日连续24h的15min平均负荷曲线见附录A图A2, 4户家庭及总馈线该日连续24h的3次谐波5s平均幅值曲线见附录A图A3, 下文中图5数据亦为该日数据。

由于居民负荷谐波中主要是较低次频率的谐波, 故分析主要针对3, 5, 7次谐波电流幅值概率分布进行研究。以3次谐波为例, 由附录A图A2和图A3可以看出, 谐波伴随非线性用电负荷的使用同步产生, 电器产生谐波远大于系统背景谐波。

4.3 谐波电流四象限分布

该日中5个测量点的3次谐波电流四象限分布见附录A图A4, 横轴和纵轴分别为谐波电流实部和虚部。由图可知: (1) 3次谐波电流主要集中在第二、三象限, 表明大部分时间居民负荷谐波电流大于系统背景谐波电流, 经矢量叠加后表现为从负荷侧流向系统侧。由于本文研究由居民负荷侧产生的谐波, 因此将仅考虑位于第二、三象限的采样数据。 (2) 3次谐波电流分布没有一定的规律, 不具有典型特定的形状 (如环形、圆形、扇形等) , 不服从特定的概率分布, 这一特征对5次、7次谐波电流同样适用。

4.4 谐波电流概率分布

由测点5的谐波电流测量数据, 可绘制3, 5, 7次谐波电流幅值概率分布曲线图, 如图5所示, 可以看出: (1) 分布曲线和正态分布、瑞利分布等差异明显, 不服从某一特定的分布; (2) 分布曲线具有多峰性。分布曲线的多峰性主要由两方面因素引起, 一方面是由于不同居民电器的谐波电流发射特性的差异性, 例如, 微波炉和荧光灯产生的谐波电流幅值差异明显。另一方面是由于不同居民电器使用概率的差异性, 例如, 微波炉在一天中使用时间一般比荧光灯短, 表现为其概率密度很低。在概率分布曲线上, 微波炉所产生的谐波电流幅值大而概率密度低, 荧光灯所产生的谐波电流幅值小而概率密度高。

4.5 基于云分布和云变换的谐波电流估计

以测点5的3, 5, 7次谐波电流幅值测量数据为例呈现基于云分布和云变换的谐波电流估计方法。由于拉盖尔多项式法和联合概率分布方法不仅要求足够大的谐波样本数, 而且需要准确的网络参数, 在居民配电网中难以满足, 因此本文和较实用的正态分布方法的分析结果进行横向对比。

基于本文第1节和第2节所提理论方法, 可分别绘制测点5的3, 5, 7次谐波电流幅值云分布曲线、正态分布曲线和云变换拟合曲线, 为了同时反应居民用电周末和工作日的用电差异情况, 分析时选取了前述算例日 (周日) 和某工作日 (周二) 的数据进行分析, 见图5、图6。基于云变换的拟合曲线和实际分布曲线的参数见表2。

可见, 云分布和正态分布曲线形态较为接近, 两者均拟合成单峰, 不能反映实际分布曲线的多峰性;基于云变换的拟合曲线能较好地逼近实际分布曲线, 反映出实际分布的多峰性。除3次谐波的峰1外 (相对误差大但绝对误差很小) , 各次谐波电流幅值、概率密度实测值与云算法估计值相对误差均较小, 谐波电流幅值相对误差基本均在10%以内, 在谐波电流幅值估计误差允许的范围内, 云变换法得到的逼近曲线能够完全拟合谐波实测值的频率分布曲线, 准确反映了实际谐波的分布变化趋势, 能拟合实际多峰情况, 清晰反映谐波电流幅值分布, 整体拟合精度与生成云的个数有关, 云的个数越多, 精度越高。

基于分布曲线, 可分别计算出实测分布、正态分布、云分布曲线和云变换拟合曲线所对应的95%概率最大值, 如表3所示。由表3中可以看出, 云变换法在谐波电流幅值95%概率值计算上误差显著小于正态分布法和云分布法。

由图5、图6和表3可以看出, 周末的各次谐波电流幅值的95%概率最大值均显著高于工作日, 即周末居民用电谐波发射水平显著高于工作日。

由表2可以看出, 周末和工作日居民负荷谐波电流幅值分布中各峰值的谐波电流幅值基本相当, 如:3次谐波最大电流峰值中周末曲线峰5谐波电流幅值 (3.02A) 和工作日曲线峰4谐波电流幅值 (2.90 A) 相当;周末曲线峰2谐波电流幅值 (0.42A) 和工作日曲线峰3谐波电流幅值 (0.45A) 相当;周末曲线峰1谐波电流幅值 (0.10A) 和工作日曲线峰1谐波电流幅值 (0.08A) 相当, 是相同负荷电器谐波源的直观反映。

根据各次谐波电流幅值多峰性概率分布曲线, 可用于判别产生该谐波电流的电器类型或电器类型组合。如图5 (a) 所示3次谐波电流分布曲线具有5个峰, 各个峰所对应的谐波电流幅值和概率密度见表2。谐波是伴随负荷电器的使用产生的, 每个电器谐波发射电流幅值累积为测试点谐波电流幅值, 电器的使用时长决定了该类型电器谐波发射电流幅值的概率密度, 故谐波电流幅值概率分布曲线的横纵坐标分别对应电器谐波电流幅值和其使用时长。和表1进行对比发现, 峰1所对应的谐波其幅值约为0.10A、概率密度约1.18, 幅值较小但概率密度最大, 由使用时间较长但谐波电流发射水平低的荧光灯、电视机等电器所产生;峰5所对应的谐波其幅值约3.02A、概率密度约0.02, 幅值大但概率密度很低, 由使用时间较短但谐波电流发射水平高的微波炉所产生。谐波电流幅值概率分布曲线峰值和居民电器间具有很强的匹配性, 这对识别谐波来源和制定谐波抑制措施具有重要意义。

由于居民负荷电器种类的多样性和用电习惯的随机性, 导致居民负荷谐波不服从特定分布且具有多峰性, 现有居民谐波水平评估一般以集体谐波概率最大值, 即超过某一概率值 (如95%) 谐波电压或电流的大小, 作为谐波水平评估标准, 对谐波的概率性分布关注较少。本文所提方法在谐波电流幅值概率密度曲线形态、拟合精度和95%概率最大值计算精度三方面均显著优于现有方法, 即为居民负荷功率特性、使用时长特征及负荷类型的反映。由图5可见, 基于云变换的拟合曲线能较好地逼近实际分布曲线, 和实际曲线形态一致, 反映出实际分布的多峰性, 显著优于只能模拟单峰的正态分布法;由表2可见, 和实际值相比, 云算法谐波电流幅值及概率密度值相对误差水平较小, 在工程允许误差范围内;由表3可以看出, 95%概率最大值计算精度显著优于正态分布法, 相对误差最大仅4.27%。证明了所提方法应用于居民负荷谐波发射概率性分布分析中具有可行性, 但由于实际居民用电的随机性太强, 要对分析结果进行严格校验在工程上很难实现。

注:“—”表示无此数据。

5 结语

本文提出一种基于云理论的居民负荷谐波集体影响的评估方法。研究表明, 居民负荷谐波电流分布没有一定的规律, 不服从特定的概率分布, 具有多峰性, 采用正态分布方法进行评估存在较大的误差。本文所提云变换方法可以精确拟合居民负荷谐波的概率分布曲线。根据居民负荷概率分布曲线特征, 有可能判别产生该谐波电流的电器或者电器类型或不同组合类型, 对识别谐波来源和制定谐波抑制措施具有重要意义。

附录见本刊网络版 (http://www.aeps-info.com/aeps/ch/index.aspx) 。

摘要:电力电子型居民负荷和新能源装置在配电网中应用越来越广泛, 其产生的集体谐波非常可观, 对电力系统的影响与危害已不可忽视。文中提出一种基于云理论的居民负荷集体谐波评估方法, 介绍了云模型和云变换的基本理论, 阐述了基于云理论的居民负荷集体谐波评估流程。通过实际案例证明, 采用云变换方法可精确拟合谐波电流概率分布曲线, 能较好地呈现居民负荷谐波电流幅值分布曲线的多峰性, 其95%概率最大值估计精度显著优于正态分布法。研究结果对分析居民谐波来源、确定谐波治理措施和监管政策具有重要意义。

分布式概率 第7篇

高压输电网络中,注入转移分布因子(ISF)体现了支路有功潮流与各节点有功注入之间近似的线性映射关系[1,2],表示了系统内某一节点有功注入的变化对支路有功潮流变化的影响。电力网络中几种重要的线性化分布因子,如功率传输分布因子(PTDF),支路开断分布因子(LODF)以及开断传输分布因子(OTDF),都可以由注入转移分布因子推导获得[2]。因此,注入转移分布因子在电力系统最优潮流[3]、阻塞管理[4,5,6]和安全评估[7,8]等应用中具有重要的作用。显然,研究如何获取更为准确、合理的注入转移分布因子具有重要的现实意义。

传统的注入转移分布因子估计方法是以直流潮流模型为基础的一种确定性估计方法[2,9,10,11]。在该方法中,注入转移分布因子可直接由支路电抗矩阵推导得到。然而,基于直流潮流模型的估计方法可能存在元件参数不准确、平衡节点设置与系统实际平衡策略不符、信息更新不及时、难以追踪系统运行点及拓扑变化等缺陷[12,13,14],从而存在较大的估计误差。

随着电力系统监测技术的发展[15,16],系统运行人员能够通过数据采集与监控(SCADA)或广域测量系统(WAMS)获取大量以固定时间间隔采集的量测数据,支路有功潮流与节点有功注入数据均可从中筛选出来,从而使利用量测数据进行注入转移分布因子的估计成为可能。根据支路有功潮流与节点有功注入之间的近似线性关系,文献[13-14,17] 提出了多种利用量测数据基于最小二乘原理的注入转移分布因子的估计方法。此类确定性最小二乘估计方法具有如下特点:1仅需使用量测数据进行注入转移分布因子的估计,避免了由于支路参数不准确、拓扑结构更新不及时所引起的估计误差[14]; 2因子求取过程中,不再预置潮流平衡节点[18,19],避免了由于平衡节点设置与实际系统平衡策略不符所造成的估计误差;3量测数据蕴含电力系统运行状态及拓扑结构变化的信息[20,21],利用量测数据进行注入转移分布因子估计的方法,可以自动、实时地适应系统运行状态与拓扑结构的变化调整节点注入与线路潮流间的映射关系[14]。以上特点使得基于量测的最小二乘估计方法的估计精度优于基于物理模型的直流潮流方法[13,14,17]。

然而,需要注意的是,即使基于量测的注入转移分布因子估计方法更加准确,但其估计结果仍可能受到测量噪声与线性化假设的影响而存在误差。注入转移分布因子的估计误差会造成对支路潮流估计的偏差,进而影响到电力系统安全分析与调度决策结果的有效性。文献[22]研究了注入转移分布因子不确定情况下的鲁棒性调度决策方法,阐明了注入转移分布因子估计误差对于调度决策结果的显著影响,但能够量化给出估计误差分布情况的注入转移分布因子的不确定性估计方法目前尚未见诸文献。

针对上述研究现状,本文提出一种依据量测信息的注入转移分布因子的概率估计方法。方法首先在输电网络线性化假设条件下,以注入转移分布因子为回归系数,建立了支路有功潮流关于各节点有功注入的线性回归模型;进而,根据贝叶斯线性回归理论[23,24,25]建立注入转移分布因子的后验概率分布模型;同时,为适应大规模电力系统中高维注入转移分布因子的概率估计需求,采用吉布斯采样数值解法[26,27]对线性贝叶斯回归模型进行求解,最终得出注入转移分布因子的后验概率分布。

1注入转移分布因子的概率估计原理

1.1含有注入转移分布因子的线性回归模型

对于输电网络,以下线性化条件可近似满足[2]: 1支路电阻值远小于电抗值;2支路两端电压相角差很小,可以忽略;3系统中各节点电压标幺值约等于1。因而在忽略线路对地导纳的前提下,支路有功潮流与各节点有功注入之间存在着近似的线性关系,即系统内某一支路有功潮流可以近似表达为各节点有功注入的线性组合[13]:

式中:PBranch,k为流过支路k的有功潮流;PNode为对应系统内N个节点有功注入的N维列向量;Mk为对应于支路k的N维注入转移分布因子向量,表示系统内N个节点的有功注入对支路k上有功潮流的影响。

随着电力系统量测技术的发展,SCADA系统或WAMS可以提供大量的时序量测数据,从中容易筛选出支路有功潮流与节点有功注入值,充足的数据使采用回归方式来估计注入转移分布因子成为可能。考虑到回归估计中残差的存在,在式(1)的基础上,可以建立包含注入转移分布因子向量的线性回归模型:

式中:εk为服从正态分布N(0,σk2)的残差变量。

1.2注入转移分布因子的贝叶斯概率估计

贝叶斯线性回归[23]是贝叶斯推理中针对线性回归模型的一种方法,它可以用于对线性回归模型中未知系数的概率估计,以获取系数的概率分布。

式(2)中待估计的变量为关于支路k的注入转移分布因子向量Mk和回归残差的方差标量σk2,为不失一般性,视各待估计变量为相互独立的随机变量。根据贝叶斯公式,所有随机变量的联合后验概率密度函数可以表示为:

式中:P (Mk,σk2|PBranch,k,PNode)为给定观测值PBranch,k与PNode下Mk与σk2的联合后验概率密度函数;P(Mk,σk2)为关于Mk与σk2的联合先验概率密度函数;P (PBranch,k|Mk,σk2,PNode)为似然函数; P(PBranch,k)为通过统计获得的支路有功潮流PBranch,k的边缘概率密度函数。

易知在已知式(3)所示联合概率分布的情况下, 支路k注入转移分布因子向量Mk的联合后验概率分布可以通过如下积分获得:

式中:P(Mk|PBranch,k,PNode)为注入转移分布因子向量Mk的联合后验概率分布。

式(3)、式(4)提供了一种注入转移分布因子向量联合后验概率分布的估计方式。然而,由于当前电力系统规模庞大,注入转移分布因子向量维数通常较高,式(4)难以通过解析的方式求解出来。因此,本文采用吉布斯采样数值算法来近似求解各注入转移分布因子的后验概率分布。

2注入转移分布因子后验概率分布的数值解法

吉布斯采样是马尔可夫链蒙特卡洛算法中的一种,它通过从各变量已知的条件分布中采样,统计采样值,近似得出全部(部分)变量的联合分布或单一变量的边缘分布[26,27]。该方法可以避免复杂的解析推导,且输入、输出明确,易于编程快速实现对注入转移分布因子后验概率分布的估计。

吉布斯采样算法的思路是根据式(3)所示的联合概率分布,在Mk与σk2其一为已知的条件下,对另一部分进行采样,如此迭代,最终统计形成各自的概率分布。

如图1所示,吉布斯采样过程主要包括如下4个步骤。

步骤1:初始化。为σk2赋初值并设置迭代计数变量,开始采样过程。此处,σk2的初值由普通最小二乘估计获得。

步骤2:对Mk的联合后验概率分布采样。当 σk2已知时,式(3)中关于Mk与σk2的联合后验分布将成为仅关于向量Mk的联合后验分布。根据贝叶斯公式,为了得到Mk的联合后验概率分布表达式, 必须首先设定其先验分布与似然函数。

在贝叶斯线性回归中,Mk的先验分布通常被设置为多维正态分布,可表达为:

式中:Zk为N维均值列向量;Σk为N ×N阶对角协方差阵。

本文中,Zk被设置为零向量,Σk的对角线元素赋值为1 000σk2。由于式(2)中残差变量εk服从正态分布N(0,σk2),因而式(3)中的似然函数为:

式中:σk2的当前值由其最新采样值来更新(初次迭代为所赋初值)。

由先验分布与似然函数表达式,根据式(3)所示关系,Mk的后验概率分布将是一个联合正态分布, 该分布的均值向量Zk*与协方差矩阵Σk*分别为:

从而,可通过标准多维随机变量采样程序[24], 获得向量Mk的采样值。存储采样值,并用它们更新Mk的当前值。

步骤3:对σk2的后验概率分布采样。同样,当Mk由其采样值替代时,式(3)将成为关于σk2的边缘分布。在贝叶斯线性回归中,σk2通常被设定为服从逆伽马先验分布:

式中:Tk为先验分布的形状参数;θk为先验分布的规模参数;Γ(Tk)为伽马函数在Tk处的取值。本文中,Tk与θk的值都设置为0.5。

将式(9)与式(6)代入式(3)中化简后发现,σ2k的后验概率分布也是逆伽马分布,该分布的形状参数为Tk+0.5,规模参数为θk+0.5(PBranch,kPNodeMk)T(PBranch,k-PNodeMk)。

根据σk2的边缘后验概率分布函数,通过单变量采样程序便可以获取σk2的采样值,存储采样值。

步骤4:收敛检验。检验采样次数是否达到设定值,如果已经达到设定次数,结束采样程序,输出存储的Mk与σk2的采样值;如果未达到,以最新采样值更新σk2的当前值并返回步骤2。

步骤1至步骤4描述了对于注入转移分布因子向量Mk的吉布斯采样过程。最后,通过对向量Mk中各元素采样值的统计,便可得到各注入转移分布因子的边缘概率分布。

3算例分析

本文利用截取于河南省220kV输电网络的21节点41支路系统中的实际SCADA量测数据,验证本文方法的有效性。系统的拓扑结构如图2所示。

3.1注入转移分布因子概率估计

选取301组时序量测数据(采集间隔为5 min) 对注入转移分布因子进行概率估计,另301组数据用于交叉检验。为简洁起见,将这两组数据分别记为数据集A与数据集B。

从数据集A中筛选出PBranch,k与PNode的观察值并代入注入转移分布因子的贝叶斯后验概率分布模型,利用吉布斯采样方法获得注入转移分布因子向量Mk的多组采样值。为保证估计效果,采样次数设置为18 000次。

通过统计注入转移分布因子采样值,可获得其概率估计结果。表1给出了关于支路21的6个注入转移分布因子部分分位点的估计结果。以表1中M2115与M2116为例(其中上标15,16为节点号),其采样轨迹如图3所示。

轨迹图反映了吉布斯采样器的采样过程,图中所示各样本值经统计即可获得图4中的概率密度曲线,两图从不同角度反映出注入转移分布因子一致的不确定分布情况。

理论上来说,单个注入转移分布因子的边缘后验概率分布服从t分布[23],该分布具有样本容量越大越趋近于正态分布的性质。算例中注入转移分布因子的采样次数为18 000次,样本容量较大,因此, 图4中注入转移分布因子的概率密度分布形状趋近于正态分布,这直观地表明吉布斯采样值获得的后验概率分布良好地收敛到了其实际分布,显示了本文方法的有效性。

综上,注入转移分布因子的概率估计结果可以总结为表2。

由表2可见,概率估计可以获得注入转移分布因子的中位数与期望值,在2.5%与97.5%分位点之间的注入转移分布因子值界定了其95%置信区间。 例如,M2115的95% 置信区间为[-0.042 3, -0.018 2],这意味着因子M2115取该区间以外的值为小概率事件,实际运行中几乎不会发生。关于支路21的各个注入转移分布因子的95%置信区间长度较短,因子波动较小,这表明高压输电网络确实具有较高的线性化程度。另外值得注意的是,以上求得的注入转移分布因子的概率分布或不确定性区间体现了本文所提出的注入转移分布因子概率估计方法与已有研究中确定性估计方法的本质区别。

3.2与注入转移分布因子确定性估计方法的对比

基于直流潮流模型的估计方法[2,9,10,11]及利用量测数据的最小二乘相关的估计方法[13,14,17]是两类主要的注入转移分布因子的确定性估计方法。通过直流估计方法,一组固定的注入转移分布因子值可以从支路导纳矩阵中直接推导得出。而基于数据的最小二乘相关估计方法随着采集得到新数据,在线更新注入转移分布因子估计值。其中,文献[13]使用潮流模拟实验证明了基于测量的最小二乘估计方法相比于基于直流潮流模型的估计方法优势明显。此处,本文利用河南电网某输电网络的实际参数与运行数据,将两种确定性方法与本文方法进行对比,以说明本文方法的有效性。

仍以支路21相关的注入转移分布因子为例进行说明。3种方法获得的注入转移分布因子估计结果列于表3。其中,直流潮流估计方法中选取节点16为参考节点。

直流估计方法估计结果依赖于直流潮流模型, 基于物理模型估计方法的固有缺陷将降低其估计的精度。例如:在直流潮流估计方法获得的结果中,与参考节点相关的注入转移分布因子均为零值[10],当网络实际平衡策略与计算中参考节点设置不一致时,直流估计获得的注入转移分布因子将是不准确的。相反,最小二乘估计与本文提出的概率估计方法均使用量测数据进行估计,使这一问题得以避免。 观察表3中最小二乘估计结果及概率估计期望值可见,节点11的注入功率对支路21的有功潮流影响最弱,相应注入转移分布因子值接近于零,然而直流估计结果显示,节点11的功率注入对支路21的有功潮流影响最强,这显然与基于数据的估计方法结果相冲突,显示了直流潮流估计方法的不足。

此外,由表3可见,注入转移分布因子的最小二乘估计结果接近概率估计期望值,这表明概率估计的期望值完全可以作为注入转移分布因子的点估计结果加以使用。

3.3支路有功潮流预估结果对比

注入转移分布因子的估计效果可从其对支路潮流估计的准确程度反映出来。在系统任意注入情况下,根据式(2),利用Mk与σk2的采样值,即可获得支路k有功潮流样本并统计得到其概率分布。由注入转移分布因子概率估计结果获得的支路有功潮流概率分布包含更加丰富的信息,可以为调度人员预防线路过载情况发生提供更为全面的决策依据。

从数据集B中取出一组节点注入数据进行说明,其中节点11~16的有功注入分别为-204.68, -94.48,141.07,-104.25,76.84,876.70 MW。仍以支路21为例,由已知注入转移分布因子概率估计结果,可计算得出支路21有功潮流的期望值、2.5% 分位点、97.5% 分位点的概率预测结果分别为152.051 8,149.745 4,154.386 2MW,而其量测值为151.537 0 MW。可见,支路21所传输有功功率的真实量测值在概率估计值的95%置信区间内,且预测期望值接近量测值,是量测值的良好点估计结果。

按照这种方式,应用数据集B中301组量测数据进行交叉检验,对比由概率估计、直流估计与最小二乘估计方法获得的注入转移分布因子应用于支路有功潮流预估的有效性。检验结果如图5所示。

由图5可见,依据3种注入转移分布因子估计结果得到的支路有功潮流均可追踪支路潮流量测值的变化趋势。但同时可见,本文提出的概率估计方法与最小二乘估计方法和直流估计方法相比,追踪效果更好,3种方法对应的平均绝对误差(MAE)指标分别为1.023 1,1.133 7,2.352 0,也验证了这一直观感觉。另外,图5中的黄色分布带表示概率估计注入转移分布因子计算所得支路有功潮流预测值的95%置信区间,在测试时间段内,实际有96.01%的功率点落于该分布带中,体现了由本文注入转移分布因子概率估计结果所得支路有功潮流概率分布的合理性。

另外,本文方法估计所得注入转移分布因子计算支路有功潮流与交流潮流计算结果的对比见附录A,系统拓扑结构变化后本文方法的适用性测试见附录B。

4结语

本文提出一种基于量测数据的注入转移分布因子的概率估计方法。方法依据贝叶斯线性回归理论建立了注入转移分布因子的概率分布估计模型,并采用吉布斯采样数值解法对模型进行了有效求解。 文中以河南省局部输电系统的实际运行数据,对方法的有效性进行了测试,测试结果表明:相比较于基于直流潮流、最小二乘的注入转移分布因子估计方法,本文方法能够提供更为准确的注入转移分布因子的点估计结果,同时,估计得到的注入转移分布因子的概率分布结果可以真实地反映注入转移分布因子估计结果的偏差范围,为调度人员提供更为全面、 可靠的电网功率分布信息,以预防输电线路过载情况的发生。

分布式概率 第8篇

雷电流幅值概率与输电线路防雷分析、设计紧密相关,在绕击和反击防雷计算中占据十分重要的位置。国内科研人员通过近30年的研究,先后3次修改了雷电流幅值概率,目前我国输电防雷设计中采用的是电力行业规程,文献[1]中推荐的表达式lg P=-IM/88,这是浙江省电力试验研究院19621988年历时27年通过安装在220 kV新杭线I回路上的磁钢棒对雷电流进行了长期的监测,通过对106个雷击塔顶的雷电流幅值数据和其中97个负极性数据的统计,得到的雷电流幅值超过IM(单位为k A)的概率。国际上,Anderson-Erikson、Popolansky、Sargent等人先后对全球各地的雷电流幅值分布进行了研究,归纳出相应的雷电流幅值累积概率表达式,IEEE工作组和CIGRE通过对全球雷电参数研究进行回顾和总结,仍然推荐Ander Son提出的雷电流幅值的概率分布的近似对数正态分布式[2]。

湖北省地形多为山区丘陵,地形条件复杂,雷电流幅值概率公式较规程以及其他省份的公式也有区别。本文在IEEE工作组和国内电力行业规程中采用的雷电流幅值概率分布特性的基础上,通过统计分析湖北雷电定位系统监测数据,得出了雷电流幅值分布特征,并给出了修正公式。

1 雷电定位系统简介

湖北电网新一代雷电定位系统(LLS3000)是1 套全自动、大面积、高精度、实时监测雷电活动的系统工具,能够实时显示云对地雷击发生的时间、位置、雷电流幅值和极性、雷电电磁波波形、回击次数和每次回击参数。目前湖北电网共建站15个,基本覆盖整个湖北地区。本文通过对雷电定位系统中20052012年的监测数据对湖北地区的雷电流幅值概率分布进行统计,得到湖北电网近8年典型的雷电流幅值分布特征。

2 雷电流累积概率公式介绍

1959年,为满足线路防雷的需要,我国开始借鉴原苏联相关行业规程中雷电流幅值累积概率的公式,随后分别在1979年和1997年2次对雷电流幅值累积概率公式进行修订,而国际上较多国家的雷电流累积概率分布公式采用美国IEEE推荐公式。

2.1 国内雷电流累积概率公式

国内电力行业规程中雷电流累积概率公式一直采用的形式为:

式中:I为雷电流幅值;Pl为电流幅值大于I的概率;c为根据实测数据拟合出的常数。

1979年,基于全国各地1 205个磁钢棒记录数据,原水利电力部颁发的《电力设备过电压保护设计技术规程》给出了雷电流累积概率分布的计算式[3]:

1997年,依据新杭线多年的磁钢棒检测结果,通过对106个雷击塔顶的雷电流幅值数据和其中97个负极性数据的统计,电力行业规程《交流电气装置的过电压保护和绝缘配合》中给出了雷电流累积概率分布计算式的改进公式:

2.2 美国IEEE推荐雷电流累积概率公式

美国IEEE Std 1243-1997推荐的雷电流累积概率分布计算式为[2]:

式中:a、b为与被统计地区雷电活动相关的参数,a表示中值电流,即电流幅值大于a的概率为50%;b值可以体现幅值概率曲线的变化程度,b值越大,表示幅值概率曲线下降程度越快,电流幅值集中性越强。IEEE推荐值为a=31,b=2.6。美国IEEE推荐公式与国内规程相比,IEEE推荐公式有2个显著含义参数,能更全面、形象、直观地表现雷电流幅值概率的分布特征。

3 雷电流累积概率公式计算结果比较

国内雷电流累积概率公式中只需要根据实测数据即可拟合出常数c的值,而美国IEEE推荐雷电流累积概率公式中,则需要根据湖北电网雷电定位系统中的实测数据拟合计算出参数a,b的值。湖北地区正闪时中值电流a为38.09 kA,负闪时a为35.93 kA,这与重庆地区的雷击中值电流a=37接近[4]。基于Matlab对上述2个公式进行最优化拟合,通过数值计算得出其中的b、c参数值。拟合结果如表1所示。

根据计算结果,可以拟合出正闪雷电流幅值累积概率曲线(见图1所示),以及负闪雷电流幅值累积概率曲线(见图2所示)。通过比较分析,正闪时,实际雷电流累积概率曲线与IEEE推荐累积概率曲线特征更相似,在雷电流幅值极小部分,两者均有缓慢下降的一段,而国内标准在这一部分下降更快,但相对误差不大。负闪时,实际雷电流累积概率曲线与IEEE推荐累积概率曲线特征仍然更相似,实际累积概率曲线与国内标准推荐曲线在约50 kA处相交,雷电流绝对值小于50 kA时,同一电流值所对应的实际累积概率要大于国内标准推荐值,且相对误差较大,在50~200 kA时,同一电流值所对应的实际累积概率要小于国内标准推荐值。

4 IEEE推荐公式计算值与实际值之间的相对误差分析

为进一步分析湖北电网雷电流幅值累积概率,将IEEE推荐公式计算值与实际值之间的相对误差定义为:

图3为正负闪时雷电流幅值累积概率IEEE推荐公式计算值与实际值之间相对误差曲线。由图3可看出:正闪的相对误差绝对值较小,雷电流幅值小于148 kA时,相对误差小于10%,一般能满足工程应用的要求;雷电流幅值大于148 kA时,相对误差随雷电流的递增而增大,在200 kA时达到35%,不满足工程应用要求。而负闪的相对误差绝对值较大,负闪雷电流幅值小于79 kA时,相对误差小于10%;雷电流幅值大于79 kA时,相对误差也随雷电流的递增而增大,在200 kA时可达到50%。

为满足工程应用,需要修正雷电流幅值累积概率公式(4),定义修正后的累积概率公式为:

式中:PI为IEEE推荐雷电流累积概率公式;为修正系数,函数f(I)=aI3+bI2+cI+d,是根据各相对误差值拟合出的近似函数,通过数值分析计算,对于正闪,a=1.1810-7,b=-1.7410-5,c=0.000 673,d=0.006 847,对于负闪,a=-5.910-8,b=2.7610-5,c=-6.7910-4,d=-0.003 4。

图4为IEEE推荐的累积概率公式修正后的相对误差,通过比较分析,修正之后的累积概率公式的相对误差绝对值较修正前小很多,正闪相对误差均在2%以内,其中绝大部分小于1%,负闪相对误差均在5%以内,其中大部分小于2%,比IEEE推荐公式的相对误差小得多,基本可以满足工程应用要求。

5 结论

本文基于湖北电网雷电定位系统监测数据对雷电流幅值进行统计,分析比较国内电力行业规程推荐的概率公式和IEEE推荐的概率公式的拟合效果,并根据IEEE推荐的概率公式提出适合湖北电网的雷电流幅值概率修正公式,得出以下结论:

(1)IEEE推荐的雷电流幅值累积概率公式的拟合效果优于国内推荐公式的。

(2)IEEE推荐的雷电流幅值累积概率与实际累积概率相比,雷电流幅值在200 kA时相对误差绝对值最大,正闪时相对误差为25%,负闪时相对误差为50%。

(3)修正后的雷电流幅值概率公式的相对误差绝对值远小于IEEE推荐公式的,正闪相对误差均在2%以内,负闪相对误差均在5%以内。

(4)修正后的雷电流幅值概率公式可以为湖北电网输变电设备差异化防雷措施提供参考。

参考文献

[1]DL/T620—1997,交流电气装置的过电压保护和绝缘配合[S]. 北京:中国电力出版社,1997.

[2]IEEE Std 1243—1997,IEEE Guide for Improving the Lghtning Peifoimance of Transmission Lines[S]. New Tork:IEEE Inc. ,1997.

[3]SDJ 7—1979,电力设备过电压保护设计技术规程[S]. 北京:电力工业出版社,1979.

分布式概率 第9篇

关键词:边坡,系统可靠度,概率分布函数

0 引言

边坡可靠度分析越来越受到业界研究人员的高度重视, 许多学者很早就开始进行此方面的研究工作[1,2]。最初, 学者们大都在具有最小安全系数的滑动面 ( 可称之为确定性临界滑动面) 上进行可靠度分析, 即计算其失效概率[3], 然而研究发现, 边坡有可能沿着确定性临界滑动面之外的滑动面发生失稳, 因此边坡系统可靠度的研究也不容忽视[4,5,6,7,8,9,10]。在进行边坡系统可靠度分析时, 尤其是在结合Monte Carlo方法时, 土体材料参数的概率分别函数假定不同, 得到的失效概率也不同。有必要研究土体材料参数概率分布函数对边坡系统可靠度的影响。本文结合一个典型的土坡进行算例分析, 比较分析了对数正态分布函数与正态分布函数假定下, 边坡系统失效概率以及确定性临界滑动面上的失效概率有何不同, 最后, 得出了有意义的结论。

1 边坡系统可靠度分析

边坡可以沿着任何一个滑动面发生失稳破坏, 因此, 从系统学的角度来讲, 边坡是一个包含许多失稳模式的系统。如此一来, 边坡系统可靠度分析就应运而生。传统上, 边坡稳定分析得出的具有最小安全系数的滑动面, 即确定性临界滑动面, 常被认为是边坡最有可能沿着发生破坏的滑动面。边坡系统可靠度分析认为, 边坡可以沿着包含确定性临界滑动面在内的所有滑动面发生失稳破坏, 分析边坡系统可靠度, 需要借助Monte Carlo方法来实现。其具体步骤如下:

1) 根据假定的土体参数概率分布函数, 产生一系列样本值 ( 譬如N个样本值) ; 2) 将其中的一个样本值作为土体材料参数值, 然后进行边坡确定性分析, 得到最小安全系数及其对应的滑动面; 若最小安全系数小于1, 则统计该样本为失效样本; 3) 当所有样本值计算完毕后, 失效样本个数与N值的比值, 即为边坡系统失效概率值。其中, 第一步中产生样本值是边坡系统可靠度分析的关键, 目前的抽样方法可以用Latin超立方抽样方法, 该方法已经内嵌在加拿大Rocscience旗下的Slide5. 0 软件里, 读者可以很方便地进行各种概率分布函数的抽样过程模拟。下文的算例分析, 就是借助于Slide5. 0 分析软件来进行的。

2 算例分析

考虑一个典型的土坡, 其坡高为10 m, 坡角为45°, 土的密度ρ = 2 000 kg / m3, 不考虑其不确定性, 也就是说将其视为定值。考虑内摩擦角 φ 和粘聚力c的不确定性, 参数设置如下: 内摩擦角的均值 ф= 30°, 标准差为3°, 粘聚力的均值c = 5 k Pa, 标准差为1 k Pa, 分别假定 φ 和c共同符合正态分布和对数正态分布, Monte Carlo抽样次数N = 1 000。边坡几何坐标见图1。

首先, 假定 φ 和c符合正态分布, 并且两者之间具有- 0. 5 的互相关性, 利用Slide5. 0 进行了边坡系统可靠度的分析计算, 计算得到的系统失效概率为63. 1% , 图2 给出了1 000 次抽样值下得到的失稳滑动面集合。图2 清晰地表明, 除确定性临界滑动面 ( 安全系数为0. 971 对应的滑动面) 以外, 边坡还沿着其他滑动面产生失稳破坏, 形成了所谓的滑动带。对数正态分布假定下, 边坡系统失效概率以及对应的失稳滑动面集合以及滑动带的范围与图2 相差不大, 其中对数正态分布假定下, 边坡系统失效概率值为65. 3% 。但是, 失效概率值较之正态分布假定下增加, 增幅为 ( 65. 3 - 63. 1) /63. 1 × 100% = 3. 5% 。

算例分析中还进行了正态分布假定与对数正态分布假定下, 确定性临界滑动面的失效概率值。其中, 正态分布假定下, 临界滑动面的失效概率值为61. 5% , 对数正态分布下相应地失效概率值为64. 7% , 增幅为 ( 64. 7 - 61. 5) /61. 5 × 100% =5. 2% , 由此可见, 当考虑边坡系统的可靠度时, 对数正态分布假定带来的失效概率增加较之不考虑边坡系统的可靠度时要小 ( 3. 5% < 5. 2% ) 。

其次, 假定 φ 和c之间的互相关性为0, 即不考虑 φ 和c之间的互相关性, 比较分析正态分布函数与对数正态分布函数对边坡系统可靠度的影响。不考虑 φ 和c之间互相关性时, 正态分布函数以及对数正态分布函数假定下边坡系统的失效概率值及其失稳滑动面集合相差不大。正态分布函数假定下, 其失效概率值为60. 6% , 对数正态分布函数下其失效概率值为61. 4% , 增幅为 ( 61. 4 - 60. 6) /60. 6 × 100% = 1. 3% , 对比发现, 不考虑 φ 和c之间的互相关性时, 对数正态分布函数导致的失效概率值增幅降低。值得注意的是, 对数正态分布假定下的滑动带范围较之正态分布假定下的滑动带范围呈变窄趋势。

3 结语

本文利用极限平衡方法分析软件Slide5. 0, 结合Monte Carlo抽样方法, 针对一典型土坡, 比较分析了土体材料参数所具有不同概率分布函数时, 所得到的边坡系统失效概率值的不同。同时, 还比较了考虑与不考虑内摩擦角与粘聚力之间的互相关性时, 边坡系统失效概率值的区别。研究发现:

1) 相同均值与标准差条件下, 假定为对数正态分布, 计算得到的边坡系统失效概率值要比正态分布假定下的边坡系统失效概率值大。2) 考虑内摩擦角与粘聚力之间的互相关性 ( 相关系数为- 0. 5) 时, 对数正态分布假定导致的边坡系统失效概率值增幅要比不考虑互相关性时大。3) 对数正态分布假定导致的确定性临界滑动面失效概率值增幅要比边坡系统失效概率值增幅大。

参考文献

[1]祝玉学.边坡可靠性分析[M].北京:冶金工业出版社, 1993.

[2]陈祖煜.土质边坡稳定分析——原理、方法、程序[M].北京:中国水利水电出版社, 2012.

[3]李亮, 褚雪松, 于广明.蒙特卡罗法在边坡失效概率计算中的应用[J].青岛理工大学学报, 2012, 33 (6) :6-9.

[4]吕惠, 李亮, 路世豹, 等.土坡系统可靠度分析[J].山西建筑, 2013, 39 (22) :47-48.

[5]褚雪松, 李亮, 吕慧.考虑土体材料二维空间变异特性的边坡可靠度分析[J].水利水电科技进展, 2015, 35 (2) :32-36.

[6]李亮, 褚雪松, 郑榕明.Rosenblueth法在边坡可靠度分析中的应用[J].水利水电科技进展, 2012, 32 (3) :53-56.

[7]褚雪松, 李亮.伪蒙特卡罗法及其在边坡可靠度分析中的应用[J].土木建筑与环境工程, 2013, 35 (6) :33-39.

[8]褚雪松, 王旭春, 张勇强, 等.基于代表性滑动面的边坡系统可靠度分析[J].煤炭学报, 2014, 39 (6) :1077-1083.

[9]李亮, 褚雪松, 袁长丰.快速蒙特卡罗法及其在土坡可靠度分析中的应用[J].煤炭学报, 2013, 38 (9) :1576-1582.

分布式概率范文

分布式概率范文(精选9篇)分布式概率 第1篇光伏发电与一般的能源电厂(比如说火电厂等)有相似之处,例如都是把其他类型的能源改变成电能去...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部