分布模型范文
分布模型范文(精选12篇)
分布模型 第1篇
20世纪70年代,国外开始了分布式水文模型的研究。Freeze和Halran撰写了《一个具有物理基础数值模拟的水文响应模型的蓝图》,首次提出了分布式水文物理模型的概念和框架[1],此后,全世界开发了众多分布式水文模型,例如:MIKE SHE、SWAT、HSPF、GBHM、WEP等[2]。分布式水文模型多为商业或部分商业模型,一般较为复杂不易操作,且在实际的水资源管理、洪水管理业务中还存在很多问题,其实际应用范围还很有限。特别是在国内水利行业,分布式水文模型成功应用于实践的案例更少见[3,4]。
为了推进分布式水文模型技术在实际水资源管理与洪水管理中的应用,开发了分布式水文模型Easy DHM(Easy Distributed Hydrological Model)。Easy DHM集成了多种新技术,如:基于DEM的快速建模技术、支持不同时空尺度的快速模拟技术、参数自动识别技术等,力图打造为能够真正服务于实际水管理业务,功能强大而操作简便的易用型分布式水文模型。
Easy DHM支持多种空间结构,其水循环过程模拟核心模型采用模块化和组件式的开发思想,其产流、汇流、蒸发、地下水等模块均支持多种算法,增强了水循环过程模拟的灵活性和扩展性。Easy DHM还能对参数进行自动识别,包括参数敏感性分析模块和参数优化模块。同时,针对分布式水文模型在大流域应用时计算速度低、模型参数率定困难等问题,提出了“计算分区”和“参数分区”概念,提高了分布式水文模型参数识别的自动化程度和模型率定及建模效率,降低了模型参数识别的经验性。Easy DHM还支持不同水管理领域的应用,包括:(1)支持多种时间步长(从h到d)的洪水预报;(2)支持水资源评价方面相关的水文模拟与计算功能;(3)和水资源调配模型的耦合,可以支持流域水资源调配,实现流域2元水循环模拟与调控。
为与Easy DHM模型配套,开发了配套的模型系统。Easy DHM模型系统的开发目标是要建立国内第1个面向实际应用,基于开源软件,集成前处理、模型计算、参数识别、统计分析、结果展示等功能,低成本的分布式水文模型软件系统。分布式水文模型Easy DHM的模型系统是基于开源GIS软件Map Window开发,命名为MWEasy DHM,其软件体系结构如图1所示。
2 Easy DHM模型的前处理
前处理模块是分布式水文模型建模过程中最复杂的部分,包括:(1)基于DEM的水文分析,包括流向、累积数、流长、坡度、模拟河网、出口点水文站的添加等计算工作;(2)各种模型产流参数的推求,包括土壤物理参数、土地利用类型参数、地形指数等;(3)各种模型汇流参数的推求,包括子流域特征参数、河道特征参数等;(4)气象数据空间插值。通过该模型软件的开发,设计新算法或者集成已有算法等,大大提高了模型建模过程中的自动化程度。
2.1 基于DEM的水文分析
基于DEM的水文分析大体上分为3个部分,首先对DEM数据处理,Easy DHM中的DEM数据处理流程如图2所示,待准备好文件后,一键即可完成所有计算,得到模拟河网和各河段出口点等信息;其后,在DEM基础上,添加区域总出入口点和水文站、水库等;最后为模拟区域的空间离散。
Easy DHM中,总出口点从上一步推求的各河段出口点推求,总出口点应能控制整个研究区域。不用人工输入流域出口点,从而大大提高了出口点选择的合理性和准确性。水文站、水库等则通过导入文件形式添加入研究区域底图上。为避免一些不必要的错误,如出入口点、水文站和水库不在模拟河网上,模型提供了合理性检查和自动吸附的功能,即根据设定好的吸附范围阈值,把不在河网上的水文站、水库点自动移动到最近的模拟河网上。
Easy DHM模型采用自主开发的通用子流域划分算法PGSDM(Pfafstetter coding system based General Sub-basin Delineation Method)[5]来完成子流域划分工作。通过对传统Pfafstetter编码[6]的扩展,该算法可以高效、准确地实现对各种复杂流域的子流域划分工作。为增加Easy DHM模型对下垫面的空间描述能力,子流域可以进一步划分为2级计算单元,包括依据高程划分的等高带(EEB,Equal Elevation Band),依据汇流入流域出口点的时间划分的等流带(EFB,Equal Flow interval Band)和根据水文响应机制划分的水文响应单元(HRU,Hydrological Response Unit)等。
为节省工作量,根据Easy DHM模型的水平结构,提出“计算分区”与“参数分区”概念。计算分区是为方便模型计算而设计的。在进行模拟时,可以只对某个计算分区内的计算单元进行模拟,而不用模拟其他计算单元,从而可以大大降低模拟的计算工作量。计算分区按照水文站、水库、流域出口点的单独控制范围进行划分,这样各分区内的产汇流过程较为独立,然而计算分区间必然存在水量交换,下游分区内的水流流入直接为其上游分区的最末端水文站或水库的出流量,因此,在模拟下游计算分区时,应首先模拟其上游相邻计算分区。参数分区则为方便模型参数调整而划分的。在对某个参数分区进行调参时,不改变模型中各类下垫面间参数的相对关系,整体改变该参数分区内所有子流域内计算单元的参数。例如:对某个参数分区内土壤饱和导水系数调参时,通过把模型原来默认的参数组(每个子流域内计算单元1个值)乘以1个修正系数,得到1组新的土壤饱和导水系数。参数分区内各个子流域内部计算单元之间的相对关系仍继续保持,只是其绝对值发生整体变化。
2.2 模型参数推求
分布式水文模型的一个重要特点也是其优势所在就是,模型参数大都具有相应的物理意义,而且可以根据下垫面数据来推求模型参数,正是因为这一点,分布式水文模型才具备适用于无资料地区模拟的基本条件。
Easy DHM的参数推求集成了Wetspa模型的产流参数推求方法[7]和MWSWAT模型系统的汇流参数推求方法[8]。Easy DHM主要根据DEM、流长、河网编码、子流域划分结果等来推求子流域内主河道、支流的汇流参数。而产流参数则根据DEM、土地利用、土壤数据计算每个网格的各种物理参数,然后把它们统计到子流域内计算单元(等高带、等流带或HRU)上。
2.3 气象数据插值模块
E a s y D H M的气象数据展布程序的计算流程如图3所示。该程序集成了多种气象数据展布算法,其中包括:泰森多边形法、距离反比法、K r i g i n g法、考虑高程修正的距离反比法和综合法[8]。另外,在用Easy DHM进行长系列水循环模拟时,长系列气象数据空间插值是非常耗费计算时间的,还经常出现站点增加、减少、缺测等问题。为了解决这个问题,提出了一套子流域面气象要素快速插值的自适应泰森多边形法,该算法会根据站点的缺测情况,自动判读继续采用前一时段的插值权重还是重新计算泰森多边形,大大减少了泰森多边形的计算次数,所以计算效率非常高,同时还保持了泰森多边形法的计算精度。
通过引入Fortran MPI并行技术和C#的多线程技术,实现了对气象数据的快速插值。其中并行计算的思路就是把长系列划分为多个时段,对不同时段的气象数据进行同时并行空间插值,再把各个不同时段的气象数据展布结果合并成1个文件。例如:对1956~2005年的长系列数据,可以分成5个并行计算任务,每个任务单独计算10年,各个任务单独计算完后,再把各自的结果合并为1个结果。
3 Easy DHM模型的基本计算模块
3.1 产流计算模块
为适应不同流域产流特点,Easy DHM模型支持多种产流计算算法:Easy DHM产流模型,Wet Spa产流模型[7],新安江产流模型[1],Hymod产流模型[10]等。其中Easy DHM产流算法是综合SWAT模型[11]、Wet Spa[7]等多种水文模型的特点开发的一种产流算法,也是分布式水文模型Easy DHM模型首选的产流算法。Easy DHM产流模型的概化思路是在垂向上划分了4层:植被冠层、地表层、土壤层和地下水含水层。降雨先进入植被冠层,发生冠层截留,穿过冠层的水分会进入地表层,超渗的水量发生地表填洼,其他水分入渗进入土壤,在土壤中进行分成土壤水分、土壤温度模拟,土壤水渗漏则进入地下水含水层。其中地表填洼形成地表径流,土壤水侧向流出形成壤中流,地下水回归形成地下径流,它们之和即为总径流。植被冠层、地表填洼、土壤水和地下水都会形成蒸发。为扩展模型通用性,Easy DHM产流模型同时还对积雪、冻土等情况进行了模拟。
Easy DHM产流模型的产流参数按是否在参数分区内取值相同分为全局参数和子流域参数,子流域参数虽然在某一参数分区内逐子流域各不相同,但模型调参时采用参数分区整体调参的思想,即设定1个修改系数。
3.2 汇流计算模块
Easy DHM模型根据流域DEM,结合流域实测河网,提取出数字河网,推求出河道长度、纵断面、曼宁糙率系数、底板导水系数等,同时收集到河道纵横断面及河道控制工程数据,即可采用运动波(Kinematic Wave)模型、扩散波(Diffusive Wave)、马斯京干法或变储量法等方法进行河道水流演进计算[1,2]。
Easy DHM模型汇流参数主要体现在河道的形状参数,所有汇流模型都采用同样的河道形状参数,其参数提取方法采用MWSWAT中的算法[8]。同时也按经验设置了一定上下限范围内的修改参数,用户可以根据不同参数分区的特点进行调整。
3.4 洪水预报模块
洪水预报是分布式水文模拟中一个较为独立的应用模块。洪水预报需基于上文提到的基本产汇流模型进行计算。在洪水预报中,模拟精度至关重要,为提高洪水预报精度,独立于基本产汇流模型,设计了指数型退水模型、神经网络模型等经验或黑箱进行计算。同时,洪水预报模块还支持初值管理、洪水实时校正和多模型组合预报。洪水预报中的模型参数初值可视情况自适应更新,以提高模型模拟精度。洪水实时校正模块采用误差自回归校正技术[12],多模型组合预报则支持简单平均法、加权平均法和多模型集成预报法以及修订多模型集成预报法等[13]。
4 模型后处理模块
模型后处理模块主要包括:LH-OAT参数敏感性分析、单目标/多目标模型参数率定、模型结果空间展示与分析等。
4.1 敏感性分析
为了实现Easy DHM模型参数的全局敏感性分析,引入了LH-OAT全局参数敏感性分析算法。LH-OAT算法是Van Griensven[14]等结合LH方法[15]和OAT方法[16]提出的全局参数敏感性分析方法,成功应用于SWAT2005模型中。LH-OAT算法结合了Latin-Hypercube抽样算法的稳健性和OAT算法的精确性,能从所有参数的全部可行空间中根据OAT设计进行精确抽样,每次模型运行输出的变化可以清楚地归结到输入参数的变化,从而保证参数敏感性分析的强壮性及有效性。在LH-OAT抽样中,首先把整个参数空间划分为m层,然后从m个分层中分别抽样m个LH抽样点(包括p个参数的参数集合),然后再从某个LH抽样点中进行p次参数改变、每次只改变1个参数,这样模型共需运行m(p+1)次。
4.2 参数优化
为实现Easy DHM模型参数自动优化功能,引入了SCE-UA全局参数优化算法。SCE-UA算法是Duan等[17]于1992年结合受控随机搜索的单纯形法[18]、生物竞争进化[19]和种群交叉等方法优点提出的全局参数优化算法。该算法可以一致、有效、快速地搜索水文模型参数全局最优解,SCE-UA算法被认为是连续型流域参数优选最有效方法之一,在流域水文模型参数优选中应用十分广泛[20]。该算法第1步(第0个循环)先运用随机抽样在所有可行参数空间中选择一初始种群。随后,该种群被分割成多个复合体(complex),每个复合体运用单纯形法进行独立进化,复合体之间定期进行交叉形成新的复合体,从而可获得更多信息。
4.3 结果展示
方便的模型结果展示与分析功能大大提高了模型结果分析的效率。MWEasy DHM模型系统可以对Easy DHM模型结果,按照不同的方式来进行展示分析。其中包括表格式、图表式和GIS方式。
5 算例应用
诺敏河是嫩江干流下游上段右岸最大支流,发源于大兴安岭东侧特勒库勒山,由西北向东南流至沙德尔火山后急转向南,在古城子水文站下游水流分为2股汇入嫩江,河流全长466 km,集水面积25 966 km2。洮儿河发源于大兴安岭东麓高岳山下,流域多年平均降雨量400~450 mm,其中6~8月份降雨量占全年的84%~89%。察尔森水库位于嫩江一级支流洮儿河中游。由于诺敏河和洮儿河水文资料相对完善,本次研究则主要针对这个流域进行。
5.1 模型前处理主要结果展示
图4给出了模型模拟区域和其中的雨量及水文站点,上为诺敏河,下为洮儿河。图5和6分别为2个研究流域的子流域及等高带划分结果,图7为相应参数分区划分结果。
5.2 模型模拟结果展示
以洮儿河中的洮南站为例,取模型模拟期为1998年6月1日至1998年10月30日。嫩江流域每年仅这段时间河水解冻可进行水文监测。模拟时段为6 h,模型率定时段也为6 h。采用Easy DHM产流模型和马斯京干汇流模型,直接读入实测蒸发,得到模拟期的索伦站的模拟径流、实测径流及参数优化后的模拟径流如图8所示(横坐标为时段序数,径流量单位为m3/s,降雨量单位为mm,下同)。从图中可知,模型默认参数显然并不合适,对参数进行率定时极有必要的,经过参数优化后,模型模拟效果明显好于默认参数下的运行结果。
5.3 洪水预报结果展示
同样选用洮南站为例,挑选以上模拟期中的1场洪水,1998年7月30日至8月18日。直接选用优化好的参数,采用Easy DHM产流模型,得到的模拟洪水如图9所示。模型模拟精度不是很好,采用其他方式如改变参数等很难提高模拟精度,故采用实时校正技术来校正模拟洪水,如图9所示,校正洪水几乎完全与实测结果相吻合,证明了洪水实时校正的必要性和有效性。
采用组合预报模型,对同一场洪水(同上),采用Easy DHM、Wet Spa、新安江和Hymod模型等4种产流模型进行组合洪水预报,如图10所示。由此可知,组合预报的结果能综合4种产流模型的特点,为4种结果的折中值,模拟效果最好。在实际应用中,也可视情况仅对部分模型进行组合预报,以集中优势模型的优点,避免劣势模型的不足。
6 结论
分布式水文模型Easy DHM集成了水文科学、数值计算、软件科学等多学科的最新技术,具备4大特点:(1)易用性,Easy DHM模型及系统互为一体,共同为一般用户提供一个友好、方便使用的模型计算代码及建模和率定环境;(2)通用性,模型可以适用于各种特点的流域:小流域、大流域甚至超大流域,闭合流域、不闭合流域,超渗产流区、蓄满产流区等;(3)可扩展性,模型采用模块化编程思想,集成多种产汇流计算方式,并可在实践中不断扩展各种新的算法;(4)高效性,模型所特有的空间结构、参数分区/计算分区的划分及参数自动率定方法的引入大大提高了模型的计算效率。
模型在嫩江流域的应用验证则很好的展示了Easy DHM模型的前处理、模型模拟和参数优化的效果。针对专门的洪水预报,Easy DHM模型也能得到精度非常高的模拟结果。
分布模型 第2篇
利用1961-全国电线结冰及相关气象要素台站观测资料,分析电线结冰厚度的空间分布特征,并建立利用前期冰冻日数,前1天日最低气温、相对湿度、风速和降水量预报电线结冰厚度等级的3层人工神经网络BP模型.结果表明:电线结冰厚度最大值在10 mm以上的`地区,在北方主要位于东北东南部、内蒙古东北部、华北中部以及甘肃南部等地,在南方主要位于安徽东南部、江西北部、湖南南部、湖北西部、重庆南部、贵州中部以及四川东部等地,呈东-西向带状分布.近48年来,安徽黄山和江西庐山覆冰厚度历年极大值和覆冰日数均呈增长趋势;四川峨眉山、甘肃西峰镇的历年极大值和覆冰日数均呈减小趋势.建立的人工神经网络BP模型能在一定程度上预报结冰厚度等级,模型对近的回报结果显示,准确率为81.3%.
作 者:殷水清 赵珊珊 王遵娅 张强 唐为安 Yin Shuiqing Zhao Shanshan Wang Zunya Zhang Qiang Tang Weian 作者单位:殷水清,赵珊珊,王遵娅,张强,Yin Shuiqing,Zhao Shanshan,Wang Zunya,Zhang Qiang(国家气候中心,北京,100081)
唐为安,Tang Weian(安徽省气候中心,合肥,230031)
裂隙岩体裂隙面随机分布模型研究 第3篇
关键词:岩体;裂隙面;随机分布;概率图;统计模型
1.前言
岩体是一种不连续介质,各种不同成因的结构面相互交切、组合形成了特定的岩体结构。结构面的几何参数通常指某组结构面的产状、迹长、间距、闭合度等等。这些几何参数决定了岩体被这些结构面切割的特征,岩体内部的各种不同方向、规模、形态的地质界面往往对岩石地基工程起控制性作用,是研究工程岩体结构的重要参数。在平硐、钻孔和露头面上可以获得有关结构面几何参数的大量资料,如果通过这些资料可以总结出岩体结构面参数的数理统计特征(某种概率的密度函数分布)和统计参数(裂隙参数的均值和标准差),就可以为损伤力学、随机有限元、离散元和块体理论等岩体力学边缘学科提供基础资料。
在野外测量的大量结构面的几何参数往往带有不确定性、不完整性以及随机性等特点,如何对这些大量的资料进行处理以并得到结构面几何参数分布的规律是研究结构面对岩体力学性质的影响所要做的首要工作。在大量的实践和统计结果表明裂隙岩体的结构面大体上遵循若干特定的曲线,其统计的概率密度均具有随机的特征[1,2]。本文通过建立结构面分布的随机模型,分析了某核电站核岛区基岩中裂隙的分布规律,为后续评价基岩的岩土力学性质提供了基础资料。
2. 概率图法
科研及工程人员研究表明,在描述岩体结构面的几何参数分布时,主要有均匀分布、负指数分布、正态分布和对数正态分布四种[3,4]。对于某一组特定的样本资料,关键问题是如何在上述四种已知概率密度函数中选用正确的函数描述。
设统计了某一组N个资料x1, x2,??xn选用了某一概率分布函数F(x)。首先将x1, x2,??xn按其顺序排队,为θ1,θ2,??θn,那么,相应θi的分布函数从理论上讲,应为F(θn)=i/N,为了避免出现在i=N时F(θn)=1的不合理现象,定义经验分布函数值为:
以θi为横坐标,θt为纵坐标,可以将N个数据点绘制在该坐标中。从理论上讲,该N个点应连成一个与横坐标轴夹角45°通过原点的直线。但如果在实际采集数据并分析时,如果该N个点大致沿一条直线分布,那么不论截距和斜率大小,都可以认为该组资料符合所选用的分布函数F(x)。
由于正态分布函数(对数正态分布函数可以转换为正态分布函数来考虑)没有解析式,其反函数难以用显式给出,在计算θt时,可采用下列近似方法计算:
首先将非标准正态分布函数转换成标准正态分布函数,其密度函数为:
4 某核岛基岩裂隙分布
某核电站核岛由1#和2#两部分组成,各建(构)筑物子项包括核反应堆厂房、核服务厂房、以及控制厂房等,为该核电站的核心建筑,任何失灵、损坏均有有可能会导致安全事故,造成巨大的经济损失并造成不良的社会影响,因此,在勘察设计前期,应当查明核心建筑分布区的基岩裂隙分布规律,进一步为后续承载力、稳定性等各方面评价提供基础资料。
据区域地质资料及前期勘察资料,核岛建筑物地段无断裂构造通过,主要构造线为NE、NW走向的两组裂隙,此外还包括有大型裂隙、裂隙密集带。
①随机分布裂隙
经现场调查、测绘查明该核岛地基岩体中主要发育两组裂隙:第Ⅰ组.走向NE,倾向NW,倾角为45°的裂隙;第Ⅱ组.走向NW,倾向NE,倾角75°。裂隙间距一般均大于0.4m,裂隙面平直,一般胶结闭和较好,部分张开宽度1- 3mm,个别达10mm,充填有高岭土、蒙脱石等粘土矿物。
②规模较大的裂隙
分布在1#核岛东侧临海岸线一侧,张开宽度0.1~0.6m,延伸长度一般大于25m,上宽下窄,往深部、陆地方向逐渐闭和,充填有块石、碎石、砂、贝壳等。
③裂隙密集带
主要分布在1#核岛东侧海岸线一带,主要由NW走向的一组裂隙密集形成,少数由NE走向60~80°一组形成,一般裂隙间距10~30cm,延伸长度20m左右,带宽2~7m不等。2#核岛地段没有分布。
根据已有的勘察资料并结合现场调查,对核岛区的主要裂隙进行了统计分析,将核岛区的裂隙分为两组:Ⅰ组:走向NW组;Ⅱ组:走向NE组,同时还存在少量的绿泥石片岩与围岩的软弱接触面,由于软弱接触面的统计资料较少,所以根据勘察报告提供的参数。采用概率图法来确定各组裂隙几何参数的概率密度函数,检验结果见表1, 2。
由表1、2可知:Ⅰ组裂隙的倾向服从正态分布,倾角服从对数正态分布,迹长和间距服从负指数分布;Ⅱ组裂隙倾向服从对数正态分布,倾角服从均匀分布,迹长服从对数正态分布,间距服从负指数分布。
确定了裂隙几何参数的概率分布形式后通过最小二乘法对裂隙几何参数的均值和方差进行计算,计算的结果见表3、4。
5 結论
(1)可靠的概化地质模型是进行岩体力学计算的前提条件,特别是裂隙岩体,除了其岩性组合特征以外,最關键的是查清裂隙的分布组合情况。本文以野外地质调查为基础,在野外裂隙实测资料的基础上进行统计分析,建立了能够客观反映裂隙实际分布状况的统计模型,提取了力学分析中具有关键作用的裂隙参数。
(2)统计分析方法对于处理大量具有随机性的裂隙统计参数具有较好的实用性,能够提取出代表性的裂隙参数,可以有效避免对大量统计数据取平均值带来的不确定性因素的影响。
(3)在后续研究中,应当开展根据关键统计参数进行裂隙随机可视化模型的研究工作,以提供更为直观可靠的统计规律。
参考文献
[1]Prest S. D. And Hudson J. A., Discontinuity Spacings in Rock, Inter. J. Rock Mech. Min. Sci. and Geomech. Abstr., 1976, 13
[2]汪小刚,陈祖煜,《岩体结构面调查统计和计算机模拟分析及其在漫湾电站左岸边坡稳定分析中的应用》,水利水电科学研究院,1991
[3] 于本昌,《基于蒙特卡罗随机裂隙的岩溶水工隧洞稳定性及渗流特性研究》2015
[4]许湘华 曲广琇方理刚《基于节理几何参数不确定性的边坡可靠度分析》2015
[5] 陈昌平,《节理岩体结构定量化研究》,第一届全国大坝岩体力学讨论会暨第三届岩石力学与工程学会岩体物理数值模拟讨论会,1993
分布模型 第4篇
光伏发电与一般的能源电厂(比如说火电厂等)有相似之处,例如都是把其他类型的能源改变成电能去使用,并且有着很高的电能质量。但因为太阳能自然波动,光伏发电并网会对电力体系并网造成一些影响:原动力不能控制力、对电能质量有一定的影响,对电网运行调度和系统的可靠性也有不同的影响。
国内外研究人员越来越关注准确地建立光伏电源的输出功率概率模型。目前关于光伏出力模型的研究主要分为两大类:
第一类预测模型基于太阳能辐射强度。首先建立太阳辐射预测模型,再使用当地的气候历史数据得出预测值,然后逆变建模得出光伏发电系统的输出功率预测值。ALEXIADIS等[1]将其建立在对数正态、Weibull函数以及Beta分布的太阳辐照程度的概率模型的基础上,然后根据美国3个地区5年的历史数据,对应使用X2以及K-S等4种检验方式测评其拟合程度,在Beta分布下获得最好的拟合程度。BILLITON等[2]依照欧洲部分区域的历史太阳辐照度信息,使用正态、Weibull函数以及Extreme Value I型分布确立概率模型,并使用极大似然法验证其拟合程度,实际结果能够看出,Weibul以及Value I型分布对一些区域的拟合程度很好,但并没有找到能够使用到任何地方的参数分布。该方法的准确性依赖于详细的气象数据。越精确的预测结果就需要越复杂的模型,同时需要越多的历史数据和越多的数据类型,使得预测过程十分复杂,不利于实际的应用。
第二类直接预测光伏电站的输出功率。文献[3,4]提出了一种方法,该方法具有一定的实用性。文献基于马尔可夫链建立太阳能的转移矩阵,然后预测1天内该光伏发电系统的出力。但是该方法认为太阳能一天中每时每刻的转移趋势相同,使用的是同一个转移矩阵进行预测,忽略了光伏电站输出功率每日变化的特性。
目前,研究电力系统其他不确定性问题(不是光伏发电系统输出功率)主要采用概率分析方法[5,6,7],其中Monte Carlo法能不用延间接地模拟需要获得随机变量的概率分散特点;另有解析法,经过算出半不变量,进行级数可以获得想要获得的概率分布,较多地使用Gram-Charlier级数[8],但必然会出现一定的程度的误差。不管是哪一种方式都需要精准地了解随机变量的随机特点,换句话说就是:第一点需要确立每一个随机变量的分布模型,之后进行有关概率测评。但是由于太阳辐射的特点是随机性和间歇性,先假设分布则无法全面分析各种随机因素的影响,所建光伏电源模型不能够准确反映其特性。因此本文结合概率论基本思想,在太阳能辐射模型的基础上,建立了基于非参数核密度估计的分布式光伏电源并网出力概率模型。
1 光伏电源出力概率模型
1.1 非参数核密度估计
非参数核密度估计方法不受到分布制约,换句话说就是:该方式是不完全依靠于总体分布和其参数的数学方式。该方式已经在能源等很多方面获得一定的应用价值。对于一些参数方式,非参数方式主要有如下3个益处。
(1)偏差更小。在使用非参数方式的时候,样本n已经“特别大”,这就能够让非参数统计中有关统计数量的确切分布和其极限分布的相差“特别小”,并且由于非参数统计方法通常基于相关统计量的某些极限性质,所以在应用上基本“可以忽略不计”使用极限分布所带来的偏差。
(2)更广泛的适用性。因为非参数方式只使用普通的数据建立模型,对信息的限定是比较少,对总体的限制也不多,相对比来说,参数统计方式一旦模型更改,方式也随之进行更改。这是因为参数一般对设定的模型有很多的限定的性质,例如极大似然估计,它需要总体概率密度的具体图形已知。
(3)更好的稳健特性。所谓的稳健性主要指统计方法在假设的理论模型和实际模型没有很大差距的偏离时依然能保持很好的性质的性能。非参数统计天然具有稳健性,是因为它对模型的限定不多,只有最弱的限定。但是参数统计法一般是确立在假设限定至上,一旦假定限定不匹配,其正确性就会比较低。
密度估计可包括两种,即参数密度估计和非参数密度估计,主要指的是在给定样本后,对其总体密度函数的估计,前者已无法满足越来越高的精度要求,而针对后者来说,最初则产生于直方图法,渐渐演变成核密度估计法等多种类型,在此过程中,该种理论得到了比较健全的发展,并且有效阐述了非参数函数估计的一般特征。
相对来说,后者方法主要的不同之处:参数估计要求密度函数f(∙)已经具有某种特定的数学形式且只包含少量参数未知。比如:f(∙)为正态或Gamma分布。而当密度函数f(∙)的所属类型未知时(或最多只知道连续、可微等很少数的条件),非参数核密度估计可以仅从现有的样本数据得出密度函数的表达式。非参数核密度估计分为单变量核密度估计与多变量核密度估计,重点在于带宽的选择。
(1)单变量核密度估计。假设X1,X2,⋯Xn是n个离散随机样本,其概率密度函数f(x)未知,从经验分布函数中导出所需要的概率密度函数的核密度估计如下:
取均匀核为核函数:
则密度估计为:
在此过程中h即为带宽(所表示的为窗宽或者平滑系数);n即是样本容量,将核函数窗宽则能够获得核密度估计:
公式中所表示的核函数即为K(∙),其具有如下特性:
K(∙)一般均选择根据0作为主要核心的对称单峰概率密度函数,具体如表1所示。
核函数的选择依据是距离分配各个样本点对密度贡献的重要程度,但核函数的选择不是这种方法中最重要的因素,因该估计只要核函数具有对称单峰的特点,就可以确保所有核函数均可以确保密度估计有着一定的稳定相合性。相关研究人员通过进行研究了解到,一旦带宽系数h最优,则不同核函数作用等价。所以通常认为最优带宽的条件下任何核函数都合适。
(2)单变量核密度估计的宽窗(带宽)的选择。若样本足够多,精度则决定于核函数与带宽两个方面。经证实:假设具有带宽时,不一样的核函数对的影响具有等价特征,而当给定核函数,带宽不同则对有很大的影响。
核密度估计的偏差和方差公式如式(6—7),从中可以看出窗宽h不能使偏差与方差在同一时间内变少,假设h取值比较大的时候,则会促使偏差较大,方差比较小的时候,相对比较平滑,遗漏函数的某些细节;若h取值较小,使得偏差会减小,而方差很大,欠平衡,会出现较大摆动。因此需要寻找能使方差和偏差综合权衡的最优带宽h。
K(u)为核函数。对于最优带宽来说,一般情况下均将误差最低值作为基本函数,并对其实行最小化的优化运算得出,与其他的误差公式存在差异,则能够获得不一样的最优带宽算法,以渐进均方误差为例对ROT算法简要计算,渐进积分均方误差:
对其求偏导数,则得到使得渐进均方误差取最小值时的带宽:
式(11)中该式R(f'')含未知概率密度函数f(x)的二阶导数,而这个函数未知,因此只有完成对R(f'')的估计才能够求得hAMISE。文献[9]采用高斯核函数,假设f(x)也服从正态分布时,可以得到:
该式子中的σ和IQR分别表示随机变量的x的标准差和四分位距。学者进一步简化论证为:
另外一种获得最佳带宽h的方式即为选取极大似然估计,并对其实行极大似然交叉证明[10]。
1.2 光伏输出功率的非参数核密度估计的概率模型
①概率分布模型。根据(2)非参数核密度估计的基本原理可以看出,该方法主要研究数据的分布特征,不需要经验的累积,均是将样本信息作为基础而展开研究,世界各地有很多研究人员应用这一方式不但在负荷建模以及风速建模等方面取得了成就,并且也在可靠性指标计算[11,12,13]中都取得了一定的成功。
本文在研究的过程中,主要根据非参数核密度估计的相关理念阐述了全新的方式,且这一方式不必具备其他参数分布的要求,可以相对系统的考虑各种相关都气象因素对光伏功率输出的影响。
假设p1,p2,⋯pn为光伏电源的输出功率p的n个样本,输出功率p的概率密度函数为f(p),则根据非参数核密度估计的理论进行估计f(p)为[14]:
在上述公式中,h表示的是带宽,n表示的样本数量;K表示的是核函数。一般情况下,均对核函数选择应用对称单峰概率密度函数,并将0作为主要核心,具备下述公式(16)所呈现出的特征。在核密度估计时,通常均会选择高斯函数当作核函数,如(16)式所示。
②最优带宽的求取。由前文分析可知,建立的非参数核密度估计的光伏输出功率的概率模型后,需要考虑最优带宽从而使得该概率密度函数最接近真实的f(p),通常建立优化模型来选取。本文采用上节所述的简化算法,即采用式(14)进行求取最优带宽h。
2 结语
本文主要创建了有关非参数核密度估计的概率分布模型。阐释分析了已有文献提的概率模型,主要基于参数分布的太阳辐照度的概率分布模型,然后导出光伏输出功率;而本文所提出的率模型,能全面考虑各种因素对光伏电源输出功率的影响。该方法能够大范围的应用在具备光伏电力系统的概率分析以及评定等方面。
摘要:随着大规模的光伏电源接入电力系统,人们越来越关注其输出功率的波动性对电网的运行与控制的影响。建立光伏电源输出功率概率模型将有助于运行人员更好地实现对含光伏电源的电力系的控制。目前,光伏电源出力概率建模方法需要先假设概率分布,无法全面分析各种随机因素的影响。因此文章结合概率论基本思想,在太阳能辐射模型的基础上,建立了基于非参数核密度估计的光伏电源并网出力概率模型。
分布模型 第5篇
地表蒸散发是研究土壤-植被-大气系统水热平衡的关键因子.用改进的DHSVM分布式水文模型对汉江上游子午河流域蒸散发进行模拟.根据流域特点,主要进行TM遥感数据的大气校正和几何校正,在此基础上得到叶面积指数和土地覆盖等地表参数;再利用GIS技术基于DEM求出坡度、坡向和地形指数等因子.分析了蒸散发时空分布特征,表明日尺度蒸散发空间分布差异较大.初步验证了结果,表明模型在中国典型湿润区小流域取得较好效果.
作 者:刘三超 张万昌 高懋芳 柳钦火 LIU San-Chao ZHANG Wan-Chang GAO Mao-Fang LIU Qin-Huo 作者单位:刘三超,柳钦火,LIU San-Chao,LIU Qin-Huo(中国科学院遥感应用研究所遥感科学国家重点实验室,北京,100101)
张万昌,高懋芳,ZHANG Wan-Chang,GAO Mao-Fang(南京大学国际地球系统科学研究所,江苏南京,210093)
刊 名:地理科学 ISTIC PKU英文刊名:SCIENTIA GEOGRAPHICA SINICA 年,卷(期): 27(3) 分类号:P426.2 关键词:蒸散发 分布式水文模型 遥感 DEM
分布模型 第6篇
关键词 离散时间风险模型;m阶自回归;盈余分布;破产后赤字
1 引 言
文献[1]讨论了离散时间的风险模型.文献[2]讨论了利率具有一阶自回归结构的破产概率的问题.文献[3]研究了利率为独立同分布的一些破产问题. 文献[4,5]研究了利率为一阶自回归结构下给出破产的相关问题.文献[6]研究了利率为二阶自回归结构下的破产概率问题.文献[7]研究了利率为二阶自回归结构下保费收入Xk在k-1,k时间区间一开始的风险模型下的破产的盈余和首达某一水平x的时间分布的问题. 文献[8] 利率具有m阶自回归结构的情形下,研究了破产概率问题.
温室内辐射空间分布模型研究 第7篇
考虑地形因素的太阳辐射模型的研究始于20世纪60年代[1]。由于数字计算机的出现弥补了传统太阳辐射分析方法的缺陷,气候气象学者开始研究辐射模型的数学方法。最近十几年,对太阳辐射的研究转向太阳辐射模型与GIS的结合。Dubayah提出了建立地理信息系统中太阳辐射模型,Dozier与James发展了太阳辐射模型中地形参数的快速算法。Dubayah和Rich提出了2个模型ATM和SOLA-RFLUX。Kumar、Skidmore和Knowles提出运用数字高程模型计算晴空条件下太阳直接辐射和散射辐射的模型,该模型可用于计算平原和山地的太阳辐射。Oscar Van Dam进行了太阳辐射模拟,Javier G.Corripio针对太阳辐射建模在算法上进行了讨论[2,3,4]。本文主要以中国北方最普遍使用的辽沈Ⅰ型温室为研究对象,分析太阳直接辐射的时空分布状况。
研究温室各山墙对待求点的可蔽时角,计算精度取决于山墙模拟曲线的准确度、温室空间的大小、太阳方位所在山墙曲线的范围段,普遍适用于山地、日光温室等地点辐射值的计算。
1 倾斜面太阳直接辐射强度
研究进入温室内的太阳光,既要考虑透明覆盖材料对光的衰减,也要考虑温室曲面对光的不同透过率的影响。
在研究太阳辐射进入温室内的分布时需充分考虑温室内坡面的弧度问题。太阳辐射到达采光屋面时的切平面不同,该曲面下的透光率就不同,根据实际测量数据模拟出目标温室的纵切面图,如图1所示。
可以看出,以西山墙北地角为坐标原点,温室竖直高度为z,横轴为y轴,纵轴为x轴,且y=60.0,x其分段范围为:0≤x<1.4,1.4≤x<3.32,3.32≤x<5.86,5.86≤x<7.4,7.4≤x<7.72。
对于任意给定时刻,为了便于计算,首先根据温室的实际几何参数把曲面分割成4个小折面,把曲面问题转化为平面问题[5,6,7,8,9]。小折面数的多少取决于对计算精度的要求和温室的结构。从理论上讲,当着面数趋于无穷大时,小折面完全逼近曲面。从4个小折面中取出一个折面按斜面计算其瞬时辐射值,其他折面按相同方法处理。
2模拟设计
如图2所示,以西山墙北基点为坐标原点,温室竖直方向为Z坐标轴,北墙走向为Y坐标轴,西山墙走向为X坐标轴,建立空间坐标系。根据实测温室结构数据可拟合出温室后坡及采光屋面的函数表达式[10,11],即:
空间高度与距北墙的距离为:x=-0.375z2-0.08z+7.72(图3)。
3 温室内总辐射强度
3.1 直接辐射强度
在模型所需各参数给定的情况下,根据温室内某一点的日出日没时间规律判断该点在某一时刻是否处在太阳光直接照射下,若在某一时刻未处在直接照射下,则该点接收到的直接辐射值为零,否则根据公式进行计算。计算公式如下[12,13,14,15]:
其中:η-覆盖材料的透过率。
3.2 散射辐射强度
地面接受的总太阳辐射量由散射辐射(简称散射)量和直接辐射(简称直射)量两部分组成。散射部分是太阳经大气层气体,尘埃散射地面反射等因素形成的辐射部分,与海拔高度、纬度、太阳高度角、大气质量、空气湿度、地面反射率等参数有关。散射辐射再通过塑料薄膜覆盖的倾斜采光面的衰减,在温室内的分布又受温室内大气质量、山墙、温室结构遮蔽等的影响而使其空间分布相当复杂。本模型中为了估算温室内任意一点的散射量,做出假设:任意一点的散射来自于以该点为中心的半球面上各点的散射,并且来自半球面的散射各方向均一。
4 结语
由于太阳在黄道上的运动不是均匀的,而是时快时慢,因此,真太阳日的长短也就各不相同。同时地球周围的大气对太阳光也有明显的折射作用,一般来自地平方向的光线折光差可达34°之多。这就意味着当太阳中心还在地平线以下50°时,太阳上缘已经与地平线相切了。
基于概率分布模型的暴雨研究 第8篇
黄河中下游地区暴雨主要集中在每年的5~9月这153天的时间里[9]。在此期间每天发生暴雨的概率很低, 而总天数 (153天) 较大, 可见暴雨为稀有事件, 所以其概率分布可用Poisson分布来拟合。本文采用Poisson分布模式来研究黄河中下游若干站点近50年暴雨概率分布特征, 暴雨频数分布规律。同时还用建立的模式计算得到各地每年发生n次以上暴雨的概率, 为各地暴雨预报提供参考。
1 资料与方法
1.1 资料
气象统计中规定, 日降雨量≥50 mm为暴雨日[10]。数据来源与中国气象局中国地面国际交换站。选取黄河中下游若干站点历年暴雨季 (5~9月) 逐日降水量资料, 统计近50年 (1961年至2010年) 暴雨 (日降雨量≥50 mm) 日数及其发生频率。所选各测站站名如表1所示。
1.2 方法
1.2.1 泊松分布
泊松分布是1837年由法国数学家泊松 (PoissonS.D.1781-1840) 首次提出的。泊松分布在各领域的研究相当广泛, 是一种经典的描述稀有事件频率分布的概率模式。
泊松分布可以看作二项分布的极限分布。当n很大时, p很小时, 可以用泊松分布来计算二项分布。参数λ是单位时间 (或单位面积, 体积) 内随机事件的平均发生率.即
服从泊松分布的随机变量X的概率分布为:
该分布仅有一个参数λ (恒为正) 。
递推公式为:
可由 (3) 式得一年中 (5~9月) 发生k次暴雨的概率P。那么, 50年中应有50P年发生k次暴雨, 进而可得50年间每年发生k次暴雨的理论年数。结合各站值和公式 (1) 则可建立使用黄河中下游的暴雨Poisson分布模型。
根据给出的模型, 可以算出各地每年发生n次以上暴雨的概率。
每年发生n次以上暴雨的概率为:
1.2.2 暴雨分布概率模式研究
选用4个代表雨量站50年 (1961年至2010年) 逐日降水资料, 计算一年中暴雨季 (5~9月) , 每天发生暴雨的概率 (表2) 。
由表可以看出, 郑州历年 (5~9月) 共发生了94次暴雨, 延安历年 (5~9月) 共发生了38次暴雨, 西安历年 (5~9月) 共发生了34次暴雨, 太原历年 (5~9月) 共发生了116次暴雨, 且他们每年中 (暴雨季) 每天发生暴雨的概率分别为0.0122, 0.0050, 0.0032, 0.0152。
以郑州为例, 研究模式拟合问题。
由表2知, 郑州 (1951年至2000) 50年中 (5~9月) 共发生了94次暴雨。每年5~9月有15 3天, 在此期间每天发生暴雨的概率为0.0122.此概率值甚小, 而总天数153天较大, 可见暴雨是稀有事件。所以, 其概率分布可用Poisson分布来拟合。
为求郑州每年 (5~9月) 发生k次暴雨的概率, 先计算分布参数, 然后再按照递推公式 (3) 可以求得一年中郑州发生k次暴雨的概率。易得一年中郑州发生k次暴雨的理论年数。
根据中国地面国际交换站提供数据可以查询各站点每年 (暴雨季) 发生k次暴雨的实际观测数据 (表5) 。
各站点Poisson分布的概率模式的理论年数与实测年数的直方图比较如图1, 2, 3, 4所示。
2 检验与分析
2.1 方法
2.1.1 相关系数
定义:设 (X, Y) 是一个二维随机变量, 则称:
为X与Y的相关系数。
Corr (X, Y) 与协方差Cov (X, Y) 是同符号的, 即同为正, 或同为负, 或同为零。这说明, 从相关系数的取值可以反映出X与Y的正相关, 负相关和不相关。
2.1.2 分析
由表6可以看出郑州, 西安, 延安, 太原四个站点实测频数与理论频数的相关系数分别为0.926, 0.993, 0.994, 0.928。由此可见郑州, 西安, 延安, 太原暴雨季 (5~9月) 暴雨日数符合Poisson分布模式。即Poisson分布模式能较好地描述上述站点的暴雨概率分布。
检验结果已表明郑州, 西安, 延安, 太原暴雨概率分布能服从Poisson分布, 那么根据表3给出的模式和参数, 和公式 (5) 可以计算出各地每年暴雨季暴雨发生n次以上暴雨的概率 (表7) 。
3 结论
用Poisson分布理论描述黄河中下游若干站点 (西安, 延安, 郑州, 太原) 暴雨季暴雨分布符合情况较好。同时用建立的Poisson理论模式, 求得各地每年暴雨季中发生n次以上暴雨的概率, 可为各地暴雨预报提供参考。尽管本文选取的站点有限, 但根据降雨的区域连续性可以推测出相近或相邻区域的暴雨情况。本文只能在概率层面上预测出暴雨发生的次数, 未能具体到发生暴雨的具体时间或时间段, 这也为以后得继续研究指明了方向。
摘要:暴雨作为黄河中下游地区主要的气象灾害, 每年都对经济社会产生重要的影响。本文在全面的文献调查基础下选取黄河中下游四个代表雨量站:郑州, 西安, 延安和太原的1960年至2010年每年5月到9月的逐日降水资料, 运用泊松概率分布模式揭示该区域的暴雨统计特征。通过研究我们得出了一个结论, 泊松分布模型能较好地反映该地区暴雨的概率特征。在此基础上我们预测出雨量站一年内发生N次暴雨的概率。研究结果在气象统计和暴雨预报方面有重要的意义。
关键词:暴雨,概率分布,泊松分布,气象统计,黄河中下游
参考文献
[1]丁裕国, 申红艳, 江志红, 等.气候概率分布理论及其应用新进展[J].气象科技, 2009 (3) .
[2]陈艳秋, 袁子鹏, 盛永, 等.基于概率分析的暴雨事件快速评估模型[J].气象与环境学报, 2006 (5) .
[3]于新文, 丁裕国.中国东部地区暴雨的概率特征——基于泊松分布的统计模拟[J].自然灾害学报, 2006 (4) .
[4]王丙参, 魏艳华, 孙春晓.泊松分布参数估计的比较研究[J].四川理工学院学报 (自然科学版) , 2011 (5) .
[5]颜亦琪, 易建军, 孙华安.泊松分布在水文频率计算中的应用[J].人民长江, 2010 (12) .
[6]Park J S, Jung H S.Modeling Ko-rean extreme rainfall using a Kappa distribution and maximum likelihood estimate[J].Theoretical and Applied Climatology, 2002, 7 (2) :55-64.
[7]Khan B, Iqbal MM, Yousufza i.MAK (2011) Flood risk assessment of River Indus of Pakistan4:115–122.Doi:10.1007/s12517-009-0110-9.
[8]雷鸣, 高治定, 宋伟华.黄河中游河龙区间区域性暴雨特性分析[J].人民黄河, 2012 (8) .
[9]刘健, 于兰兰, 翟建青.近50a黄河三角洲极端降水事件特征研究[J].人民黄河, 2013 (2) .
居民出行分布预测的改进模型研究 第9篇
关键词:交通规划,交通需求预测,出行分布,吸引强度指标
0 引 言
出行分布是解决出行产生源与出行吸引源之间出行数量分布多少的问题, 传统出行分布预测方法有增长因素法、重力模型法等。增长因素法考虑了交通发展的延续性, 对于用地性质、继续开发规模和开发强度变化不大的城区, 以及居民出行分布特点相对固定的老城区较为适用, 但对于新开发城区、现状OD不足的城区则不太适用[1,2]。增长系数法将出行分布与路网条件变化相互独立, 这显然与实际不符。
重力模型仅将出行成本作为分布预测的作用因素[3,4], 没有考虑现状分布对将来分布的影响, 没有考虑2个小区不同性质用地之间的联系, 因此, 也不能完全描述分布预测的实质。应用中常会出现与实际明显不符的结果。
1 出行分布的实质及综合模型的建立
已有一些研究成果对传统模型进行了优化, 文献[5]建立了模糊重力模型, 解决了交通分布预测中某些不确定性问题, 但文中出行分布的决定因素是出行阻抗, 文献[6]将发生概率最大的交通分布视为预测分布, 但模型的基础仍是重力模型, 文献[7]采用神经网络预测将来分布, 其思想是通过现状OD训练网络, 并将网络应用于将来的分布预测, 此模型弊端类似于增长系数法。总之, 现有成果都针对计算方法和求解过程, 而没有考虑影响出行分布的另外一些重要因素。实质上, 某一区域未来分布应该是现状分布在多因素作用下的一个渐进性变化过程, 现状分布形态会或多或少影响将来分布形态, 其次, 出行个体在选择出行目的地时一定会考虑出行成本;另外, 出行起终点小区的用地性质、开发规模也会影响出行分布。综上, 将来分布应该是一个关于现状OD、出行成本、起终点用地性质等因素的综合函数, 可以表示为:
式中:Tij为将来OD;T
式中:Uij为i, j两交通小区间的吸引强度指标;Xmn为单位面积m类性质用地与单位面积n类性质用地间的出行吸引率;S
其中, Xmn可以通过现状不同用地性质小区间的出行调查统计得出。
借鉴重力模型, 将促进出行选择的因素T
综合作用效果表示为:
由此, 将来分布量可表示为:
式中: Ki、Kj为平衡因子。
定义一个联系紧密度函数
式中:dij为出行距离或出行时间或出行费用, c为待标定参数, 可通过现状出行调查数据标定。
于是将来分布量为:Tij=KiKjPiAjRij
由平衡条件
应用迭代求解算法, 直到|k
至此, 可得到考虑现状OD、用地性质、出行成本等因素的分布预测模型。
2 算例分析
某5个交通小区, 预测出行产生量和吸引量如表1所列, 小区平面图如图1所示。小区属性表、现状OD表、吸引强度指标表、出行时间矩阵表分别如表2~表4所列, 用3种方法预测将来分布量。其结果如下。
2.1不同方法计算结果比较
借助Transcad软件, 分别应用增长系数模型、重力模型及本文介绍方法对目标区域进行出行分布预测, 其将来OD分布结果期望线如图2~4所示。
1) 增长系数模型。现状OD为零的小区之间将来的出行数量也为0, 将来出行的分布量全部加载到有现状分布的OD对上, 对于新开发区, 其结果基本上没有指导意义, 如1小区到其他小区的分布量。
2) 重力模型。出行阻抗小的小区之间分布量大, 如3~5、5~3小区, 这2小区分别是高校用地和工业用地, 按实际情况, 这2种用地间的出行分布量应该小, 但重力模型结果显示3~5小区分布了3小区55%的产生量, 5~3小区分布了5小区24%的分布量。出行阻抗大的小区之间出行分布量小, 没有考虑现状OD分布以及小区用地之间的吸引因素, 如4~5小区。
本文介绍方法:因考虑吸引强度因素及现状OD分布的影响, 完善了重力模型仅考虑出行阻抗影响的不足, 使输出OD向更符合实际情况的方向转变。总的来说, 本文介绍方法在现状OD量大、吸引强度高的小区间, 其分布量大于重力模型的分布量, 如1~5、2~1、2~4、3~4、3~5、4~3小区等。反之, 则小于重力模型的分布量, 如3~1、5~4小区等。
3 结束语
将现状出行OD与将来2小区间的用地性质、开发规模等因素融入交通分布模型, 将会有效弥补增长系数模型在现状OD不足情况下出现零分布、以及分布量集中在某几个小区之间的错误结果。另一方面, 该模型也能避免重力模型中出行阻抗小的小区间分布量偏大的错误结果。
由于时间, 本文所举示例中的各类性质用地吸引强度指标数据, 是对5类用地现状出行分布情况调查统计分析后所得, 数据不太具有普遍性, 意在从数值上表现采用本方法预测交通分布的效果, 如果将本文介绍方法应用于实际预测, 则还需要研究吸引强度指标的准确取值, 目前还没有这方面的研究成果, 但应该看到, 2小区间的出行分布量与2小区的用地性质、开发规模具有紧密的联系, 不同用地性质间的吸引强度指标也许是交通需求预测中需要研究的一个重点内容。
参考文献
[1]肖秋生, 徐慰慈.城市交通规划[M].北京:人民交通出版社, 1998:75-100.
[2]余继东, 吴瑞麟.新城区居民出行生成及分布预测研究[J].武汉城市建设学院学报, 1999, 16 (4) :30-32.
[3]陆化普.交通规划理论与方法[M].北京:清华大学出版社, 2007:90.
[4]李旭宏.城市交通分布预测模型研究[J].东南大学学报, 1997 (27) :152-154.
[5]朱顺应, 管菊香.交通分布预测模糊重力模型[J].东南大学学报:自然科学版, 2008, 38 (4) :728-730.
[6]邵昀泓, 程琳, 王炜.最大熵模型在交通分布预测中的应用[J].交通运输系统工程与信息, 2005, 5 (1) :83-87.
分布式哈希查找模型的研究 第10篇
1 相容哈希
Chord实现了这样一种操作:给定一个关键字(key),将key映射到某个节点。如果给对等网络应用的每个数据都分配一个key,那么对等网络中的数据查找问题就可以用Chord很容易地解决了。Chord采用了相容哈希的一种变体为节点分配关键字。相容哈希有几个很好的特点,首先是哈希函数可以做到负载平衡,也就是说所有的节点可以接收到基本相同数量的关键字。另外,当第N个节点加入或者离开网络时,只有1/N的关键字需要移动到另外的位置。
相容哈希函数为每个节点和关键字分配m位的标识符,此标识符可以用SHA-1等哈希函数产生。节点的标识符可以通过哈希节点的IP地址产生,而关键字的标识符可以直接哈希此关键字。比如IP地址为198.10.10.1的节点经过SHA-1哈希之后得到的标识符为123,而关键字“LetItBe”哈希之后的关键字为60。标识符长度m必须足够长,这样才能保证两个节点或者关键字哈希到同一个标识符上的概率小到可以忽略不计。
从图1中可以看出相容哈希的特点。
相容哈希的一个特点就是当节点加入或者离开网络时对网络带来的冲击可以降到最小。当节点n加入网络时,为了保持相容哈希映射,某些原来分配给n的后继节点的关键字将分配给n。当节点n离开网络时,所有分配给它的关键字将重新分配给n的后继节点。除此之外,网络中不会发生其他的变化。以图1为例,当节点N90离开网络时,关键字“LetItBe”将被分配给节点N123。
2 关键字查找
下面看看Chord如何进行关键字查找。首先考虑最简单的情况,假设每个节点都知道整个网络中的节点和关键字的信息,也就是说,每个节点都维护0(N)大小的路由表。当网络规模很大时,这种策略是不可行的。当然,这种策略的优点也很明显,它只需要进行一次路由表查找就可以找到关键字所在的节点。
如图2所示,图中每个节点只知道其后继节点的信息。这样当进行查找时,节点将依次查询其后继节点,直到找到关键字或者遍历完整个网络为止。这种方式的优点是可扩展性好,每个节点需要知道的信息很少,缺点是查询速度比较慢,为0(N)数量级,当网络规模很大时,这样的速度是不能接受的。Chord采用了上述两种方案的折衷方案。在Chord中,每个节点维护少量的路由信息,通过这些路由信息,可以提高查询的效率。这一方案有两个重要的特性:首先,每个节点都只需要知道一部分节点的信息,而且离它越近的节点,它就知道越多的信息。其次,每个节点的指针表通常并不包括足够的信息可以确定任意一个关键字的位置。
3 节点加入算法
为保证查询的正确执行,Chord系统必须保证每个节点的后继节点是最新的。新节点n在加入Chord环的时候,先接触Chord上的任意一个节点n',n'应用上面的查找算法,把n当作关键字,找到n的后继节点s,并让n的后继指向s,然后,n将原来由s负责的部分关键字取走,此时,n的前驱临时赋为nil。可以发现,节点的加入算法并没有改变新节点n的前驱节点p的后继,以及n的后继节点s的前驱。Chord协议中,每个节点定期地调用Stabilize算法修订自己的前驱和后继,以应对节点的加入。节点n调用Stabilize算法描述如下:
Step 1取x-n的后继节点s的前驱;
Step 2如果s
由于每个节点都定期调用Stabilize算法,所以该算法既考虑到加入到Chord环上的新节点,又顾及到那些前驱或后继发生改变的Chord环上的原有节点。
另外,每个节点定期地调用修订finger表的过程fix_finger,来修订各自的finger表,方法是查找finger表中每个数据项节点的后继节点。每个节点还定期地调用过程check_predecessor来检查节点的前驱节点是否失效。若节点访问前驱时超时,则认为节点的前驱失效,那么将节点的前驱重置为空指针nil,以便节点调用Stabilize算法时能发现节点的变化,重新找到节点的前驱。
4 节点失效处理
在对等网络中,某个对等节点随时可能退出系统或者发生失效,因此处理节点失效是一个重要的问题。在Chord中,当节点n失效时,所以在指针表中包括n的节点都必须把n替换成n的后继节点。另外,节点n的失效不能影响系统中正在进行的查询过程。在失效处理中最关键的步骤是维护正确的后继指针。为了保证这一点,每个Chord节点都维护一张包括r个最近后继的后继列表。如果节点n注意到它的后继节点失效了,它就用后继列表中第一个正常节点替换失效节点。
分析了Chord模型的查找算法,它是基于网络最坏情况而设计的,较其他的结构P2P模型具有良好的扩展性、可靠性和较高的查询效率。然而,它的不足也比较明显,如它没有考虑节点的物理位置,在Chord环上的两个相邻节点在底层网络上距离较远等。有关该模型的改进和相应的仿真还在进行中。同时,在Chord系统上可以做一些应用,例如分布式文件存储、数据迁移、广域网组合查找等。
摘要:Chord模型结构是P2P网络的典型模型之一,它利用分布式哈希表(DHT)在应用层形成一个重叠网络,Chord模型应用Chord协议对关键字进行查找,分析Chord系统的关键字查找算法、节点的加入算法以及节点加入和退出对查找的影响。
关键词:Chord,哈希,节点,模型
参考文献
[1]陈刚,吴国新,杨望.一种基于Chord的路由改进算法[J].东南大学学报,2007,37(1):9-12.
[2]杨峰,李凤霞,余宏亮,等.一种基于分布式哈希表的混和对等发现算法[J].软件学报,2007,18(3):714-721.
[3]蔡晟,王泽兵,冯雁,陈海燕.基于Super-Peer对等网研究[J].计算机应用研究,2004.
分布模型 第11篇
摘要:分布式电源类型及控制方式多样,致使含多种分布式电源的小扰动机电暂态分析的电网模型复杂,分析难度加大。针对应用较广的光伏和燃料电池两种分布式电源,在对其全阶状态空间模型的特征分析和电池动特性时间尺度分析的基础上,提出了前馈解耦控制下考虑电池U-I外特性和逆变控制系统动特性的光伏发电系统降阶模型和忽略逆变系统快动态特性的燃料电池降阶模型,并应用于4机2区域系统并网小扰动分析。研究结果表明:直流DG并网主要通过改变系统潮流及平衡点影响系统阻尼特性;直流DG出力增加时,与采用降低出力增加旋转备用运行方式的常规机组强相关的模式阻尼特性会呈现增大的趋势。
关键词:固体氧化物燃料电池;光伏发电;降阶模型;特征模式;小扰动稳定
中图分类号:TM711 文献标识码:A
分布式电源(DistributedGeneration)作为一种新能源发电技术,近年来取得了快速的发展。它既可并网发电运行也可微网独立供电,因此在地区电网中得到了广泛的应用。其中包括逆变接口并网的直流分布式电源:光伏发电和燃料电池。逆变接口虽然使DG运行和控制更加灵活,但当系统受扰时,其系统惯量较小因而也更易引发振荡失稳。
对于光伏发电、燃料电池发电、风电等并网对系统稳定性影响分析,国内外学者进行了大量研究,并取得了丰富的成果。文献利用特征值分析的方法,从风机分类,模型简化,并网容量,接入地点,影响机理等各个方面细致地研究了风电并网小扰动稳定问题,得到了一系列有益的结论。然而现有针对逆变接口DG的小扰动稳定分析中,并未考虑电池时间尺度与网络时间尺度匹配的问题,大都采取基于网络方程、负荷模型、并网接口模型、各控制方法的全系统高阶模型,其阶数较高因而很难用于大规模系统。文献对含同步发电机接口和逆变器接口模型的微网进行小信号建模,其阶数高达29阶,单个逆变器模型也有13阶。文献忽略了内环快动态,对逆变接口进行降阶处理,但其同样是微分方程描述的高阶系统。此外,以光伏发电为代表的大规模无转动惯量电源接入改变了系统潮流分布,减小了系统等效转动惯量,其对系统小扰动稳定性的影响值得研究。文献以光伏发电接入IEEE14节点为例,分析了规模化光伏并网对系统阻尼特性的影响,并认为光伏发电并网增强了系统阻尼。文献利用含SOFC的扩展P-H模型分析了燃料电池并网对系统机电振荡模式的影响,但却并未在大系统中验证。
针对上述问题,本文从系统的角度出发,分析光伏(PV)和固体燃料电池(SOFC)的电池特性,采用前馈解耦的控制方式,建立了考虑各重要环节的详细状态空问模型,通过分析系统特征模式及电池动态时间尺度,忽略SOFC并网系统快动态,实现了模型降阶,建立了直流DG降阶模型,并对其接人弱耦合两区域算例进行了仿真,以此分析了直流DG并网对系统阻尼特性的影响。
1 直流DG状态空间模型
1.1 电池模型
为实现基于系统线性化动态微分代数(DAE)方程组的小扰动分析,需将由电池阵列、DC/AC逆变电路、并网控制电路等模块构成的系统数学模型线性化。其中SOFC堆电池作为一个受控电压源,其动态微分方程及输出U-I方程如式(1)(2)所示,各时间尺度参数如表1所示,其他参数说明见文献。
PV电池的精确模型十分复杂,不适应于研究及应用。因此,本文采用基于线性近似的实用工程模型。其单体电池U-I方程为:
光伏阵列由单体电池的串并联组成,本文取型号为CLS-230P的光伏电池,其标准条件下出厂参数为:Uocref=37.8V;Iscref=8.31A;Umref=29.28V;Imref=7.86A;单台逆变器容量250kVA,直流侧工作电压范围400~880V,串联数N0=880/37。8≈24,考虑温度变化系数取串联数N0=18;并联阵列数Np=60;因此单台逆变器对应的阵列输出电流,Ipv=NpI;Upv=N0U。此时单台逆变器光伏阵列输出特性方程为:
非标准条件下的参数开路电压Uoc,短路电流Isc及最大功率点电流Im,电压Um可通过下式得到:式中:Tair为空气温度;k为温度系数,通常取0.03℃·m2/w;e为自然对数;a,b,c为补偿系数,其值分别为0.0025℃,0.5m2/W,0.00288℃。
1.2 直流侧电容动特性
假定忽略各开关管损耗,则直流DG输出功率等于逆变器输出功率与直流侧电容增加的功率之和。参考方向如图1所示,由此可得直流稳压电容的状态方程如下:
CdcdUdc/dt=I-3UsddId/2Uddc (6)式中:Cdc为直流稳压电容;I为直流DG输出电流。
1.3 逆变器及控制系统模型
并网系统通常包括稳压电路、逆变电路以及控制回路,并网等效电气图如图1所示。采用d轴定向法,将d-q坐标系的d轴定向与并网节点,则有Usq=0,并通过派克变换得到同步旋转dq坐标系下数学模型如下:式中:ω为交流系统基波角频率;Usd,Usq分别为交流侧并网节点电压矢量的d,q轴分量;Id,Iq分别为交流侧系统电流矢量的d,g轴分量;Sd,Sq为三相逆变器开关函数的d,q轴分量,R为线路和开关管等值电阻,L为线路及变压器等值电感。
三相逆变器采用前馈解耦的控制策略,且为实现单位功率因数并网,一般控制无功电流为零,如图2所示。PV由于光照强度等的间歇性,一般工作于最大功率点模式,本文利用导纳增量法追踪最大功率点处电压Um作为直流侧电压参考值Udcref,电压差值通过PI调节得到电流内环的参考值,电流差值通过PI调节得到等效控制变量Udr,Uqr,然后通过引入电压前馈补偿和电流状态反馈获得逆变器控制电压在dq坐标系的参考值Ud,Uq,即sdUdc,sqUdc。为建立适用于小扰动分析的状态空间模型,引人中间变量Udcr,Idr,Iqr,并通过拉普拉斯反变换得到控制方程如下:
对于SOFC,其功率输出直接由需求决定,因此一般采用PQ控制策略,相对于PV而言只需将直流电压外环替换为有功功率外环即可。通过上述分析,即可消除时变的开关函数的影响,将三相换流器动态方程转化为线性微分方程,使基于状态方程的特征分析成为可能。其中kp,ki,kp*,ki*分别为电流内环和功率外环的PI参数。
2 直流DG发电系统特征分析
2.1 直流DG接入强耦合无穷大系统算例
本文采用PV和SOFC发电系统接人强耦合系统作为算例,其电气接线图如图1所示,单台逆变器容量SB=250kVA,归算到SB下的参数为:L=0.0035pu,R=0.012pu,Cdc=0.0038pu。光伏系统初值S=750W/m2,T=25℃,kp=0.5,ki=80s-1,ki*=0.9,ki*=50s-1;SOFC工作温度1273K,kp=0.5,ki=30s-1,kp*=1,ki*=100s-1。接人强耦合系统,可用无穷大母线表示。由于系统中无同步机及动态负荷,可直接分析直流DG发电系统本身的特征模式。通过计算系统各衰减模式的参与因子,衰减振荡模式的频率及阻尼,可找出与各模式强相关的状态变量,并分析振荡模式的性质。如表2~3所示。
由表2可知:初始平衡点处SOFC系统共有12个特征模式,其中与SOFC堆动态特性强相关的均为衰减模式,且衰减速率较慢。这是由SOFC堆动态时间常数及系统惯量较大,动态特性缓慢所引起的。分析式(1)及模式1~5参与因子可知,SOFC堆动态特性方程是与平衡点无关的常系数线性微分方程,其特征模式仅与本身的变量相关。而与逆变器及控制变量强相关的模式,其衰减特性均较快,这是由并网逆变器及控制器的高频动态特性所决定。
由表3可知:初始平衡点处PV发电系统共有6个特征模式,均为衰减模式,且与逆变器及控制变量强相关,两对衰减振荡模式频率较大且阻尼特性良好,但与△Udc强相关的模式差异很大,分析式(2)(4)(5)可知,这是由SOFC及PV电池堆的U-I特性方程不一致所引起。
2.2 参数特征值轨迹
以下以光伏发电系统为例,分析控制参数对系统稳定性影响。令T=kp/ki,T*=kp*/ki*,控制系统参数变化时特征值轨迹如图3所示。
由图3(a)(b)可知:内外环比例系数增大,系统主特征模式朝负半平面的稳定区域移动,对应系统稳定性增强,稳定裕度提升;外环比例系数增大时,模式4,5不变。对比图3(c)(d)可知:内外环积分系数增大,模式1,2虚部增大,模式3,6相互靠近;外环积分系数增大时,模式4,5不变,而内环积分系数增大时,模式4,5由衰减模式转化为振荡模式。综上可知,模式4,5的性质主要受到内环参数的影响,适当的增大比例系数可增强系统稳定性,而积分系数过小时,部分模式实部接近正半平面,系统稳定性变差。因此,为维持系统受扰暂态性能需合理地选择控制系统参数。
2.3 小扰动非线性仿真
本文在matlab/simulink中建立了拓扑如图1所示的光伏与燃料电池发电系统仿真模型,并通过设置扰动观测电池与逆变控制系统小扰动下动态特性。
图4为在0.4s时光照强度由750W/m2阶跃上升至1000W/m2,在0.8s时阶跃下降至800W/m2时,逆变器出口电流Id,Iq的仿真曲线,可以看出受扰暂态过程为衰减的振荡过程,光伏发电系统小扰动稳定,这与理论分析以及文献结果一致。
图5分别为3.5s时有功指令由1阶跃至1.1,5s时母线电压跌落10%,5.5s恢复时,SOFC内氢气、氧气和水的分压PH2,PO2,PH2O和有功功率P的受扰响应曲线。可见,由于pH2,pO2,pH2O的响应时间常数较大,其在暂态过程中衰减速度较慢,因此在受扰暂态过程中可以认为其基本不变,从而忽略其动特性,直接作为一个受控电压源处理。同时,由表1可知电池的输出电流Ifc的电气响应时间常数Te为0.8s,远大于逆变控制系统的快动态特性,因此在受扰暂态中快动态特征模式不会被激发。
2.4 直流DG发电系统机电暂态降阶模型
由上节分析可知,在小扰动过程中,光伏电池无动态响应时间常数,系统的主特征模式主要受电池U-I外特性和逆变器及控制系统影响,因此其逆变控制系统快动态必须考虑,由此可推导得以DAE方程组描述的光伏发电系统降阶模型如式(4)(6)(7)(8);SOFC电池动特性缓慢,时间尺度远大于逆变控制系统快动态,受扰暂态中快动态特征模式不会被激发,机电暂态仿真中逆变控制系统的快动态可忽略。同时,考虑到SOFC输出受扰暂态行为受到母线电压这一唯一的交流侧电气量的影响,将控制系统内外环简化为一个一阶动态环节,推导可得SOFC发电系统机电暂态降阶模型如下:式中:Td,Tq分别为有功、无功一阶环节时间常数;Pref,Qref分别为有功、无功指令值;Usref,Us分别为母线电压稳态值和运行值。
3 直流DG并网小扰动分析
3.1 仿真系统及其参数
以光伏发电系统为例,分析直流DG并网对系统机电模式的影响。与风电场类似,在机电暂态仿真中,考虑站级直流DG的各部分详细模型过于复杂且没有必要。针对本文的研究重点,假设电池组中各单体工作状态相同而忽略成组不一致性问题,将电池串并联等效为大型的电池阵列;忽略电站内部集电系统损耗,利用倍乘等值的方法,将并联发电单元等值为单一模型。系统接线图如图6所示,系统由两个对称的区域组成,每个区域各有两个容量为900MVA的同步发电机,负荷采用静态ZIP负荷。区域1与区域2负荷分别为967MW和1767MW,区域1通过弱联络线向区域2送电约400MW。系统基值SB=100MVA,在实际运行中,DG更多的是接人新节点,而不是取代同步机运行,因此本文将DG通过升压变压器接入送端母线6,改变DG出力(以DG出力占系统总输出的百分比表示),并分别通过调整送端区域1和受端区域2机组出力来维持负荷平衡。
3.2 分析与讨论
表4反映了DG出力增加时减小送端机组G2出力维持负荷平衡情况下,系统的振荡模式。其中模式1,模式2,模式3分别与G2,G4,G3的功角△δ和转子角速度△ω强相关。由表可知:DG出力增加,送端机组减小出力,模式1的阻尼呈增大的趋势,模式2,3的阻尼呈减小的趋势。
表5反映了DG出力增加时减小受端机组G4出力维持负荷平衡时系统模式。此时,DG出力增加,模式1阻尼基本保持不变,模式2阻尼呈增大的趋势,而与平衡机强相关的模式3阻尼则先增大后减小。可知,DG出力增加时,系统通过调节同步机出力来维持负荷平衡,系统潮流改变,同步机的运行模式变化,由此引起系统阻尼特性的变化,此时并未出现与直流DG强相关的局部模式。系统的阻尼特性整体变化不大,但与出力减小的常规机组强相关的模式阻尼特性会呈现增大的趋势。
由上分析可得如下结论:
1)直流DG并不直接参与系统的机电振荡,而是通过改变系统潮流分布及系统平衡点,从而改变系统阻尼特性。
2)直流DG渗透率增加时,对系统的机电振荡模式影响不大,但与出力减小的常规机组强相关的模式阻尼特性会呈现增大的趋势,这是由于DG出力增加时,为维持系统负荷平衡,同步机出力减小,系统旋转备用增加,与其强相关的模式阻尼特性会升高,这也与传统分析中,同步机出力越小,越远离稳定极限,系统稳定性变强的结论一致。
3)由于逆变接口DG通过前馈解耦实现了与电网的柔性连接,机电暂态过程中仅有母线电压这一唯一的交流量影响DG暂态行为,并网过程中并未出现同步机组与直流DG之间的局部振荡模式。
4 结语
风电功率预测误差分段指数分布模型 第12篇
风电具有清洁、经济、可再生的优点, 其发展规模不断扩大, 但由于风电的随机性、间歇性、不可调度性和部分可预测性, 使得大规模风电并网给电网调度运行带来严峻的挑战。风电预测对电网的安全经济运行尤为重要, 但目前风电功率的预测精度较低, 受预测时间尺度的影响, 其预测误差主要来源于数值天气预报 (NWP) 风速预报误差、功率输出模型、预测方法等。风电不确定性的存在对整个电网运行产生很大的影响, 包括对系统旋转备用容量的配置[1,2,3]、输电能力、调峰深度及调峰电源的配置、调频等提出更高的要求[4]。风电的预测误差分析是为计及大规模风电接入的电力系统优化调度做准备, 不确定性信息的描述越准确, 越有助于提高系统运行的安全性和经济性[5]。
国外关于风电功率预测误差分布的研究开展较早, 提出了正态分布、贝塔分布、柯西分布以及拉普拉斯分布等几种传统的经验分布模型。不同误差分布模型具有各自的特点和最佳适用范围。
正态分布假设应用最早且最为广泛[6,7,8]。对大规模风电场群而言, 当预测时间尺度较长时, 受中心极限定理影响, 风电功率预测误差将趋向于正态分布。但正态分布的峰度是固定的, 随着研究深入和大量统计分析发现, 虽然风速预测误差接近于高斯分布, 但由于功率曲线呈现非线性特性, 导致风电功率预测误差不服从高斯分布, 而是具有一定的偏度, 置信区间关于预测点并不对称。文献[9]指出基于风电功率预测误差服从正态分布的假设, 会使优化问题的目标函数求微分后存在不可解析的微分项。
基于贝塔分布的误差模型具有形状灵活、峰度可变的优势。文献[10-11]采用基于贝塔分布的误差模型表征风电功率预测误差分布;文献[12]在文献[10-11]的基础上针对每个预测功率水平区间均值和标准差提出多项式数学关系取代原来的线性关系, 以改进模型。基于贝塔分布的误差模型尽管具有很多优势, 但其应用存在障碍:首先, 其求解过程非常复杂;其次, 文献[13]指出在某些预测功率区间上这种误差模型会出现误差概率密度无穷大的异常, 因而在一定程度上降低了精度。柯西分布和拉普拉斯分布都是对称性分布, 适用于描述预测时间尺度1h以内的对称风电功率预测误差分布, 形状不够灵活, 适用范围较固定[13,14]。
当然由于风电场规模及预测方法的不同, 可能误差分布比较模糊, 或有一定的偏度, 误差模型的选择应根据实际情况选择最能准确描述该研究对象风电功率误差的分布模型。
本文的宗旨是提出一种可供选择的新的适应性和适用性较强的误差分布模型, 希望该模型具备较为灵活的形状, 以便描述非对称误差分布, 同时还要形式简单, 便于微积分运算, 适用于工程应用。
1 传统风电功率预测误差分布模型
上述几种传统的风电功率预测误差分布模型中, 正态分布、柯西分布和拉普拉斯分布是对称分布, 贝塔分布误差模型可以处理不同峰度和偏度, 是一种加权合成分布[12,13], 也是当前风电功率误差研究的热点。传统误差模型分布函数见附录A。4种传统误差模型分布曲线如图1所示。
对称误差分布模型描述研究对象的误差分布, 在保证一定精度的前提下, 其适用范围有限。因为多数风电场的规模不太大, 误差分布可能兼具多种分布的分布特征。当误差分布不对称时, 即使采用更好的参数估计方法, 采用正态分布、柯西分布和拉普拉斯分布拟合后仍会有较大的偏差, 因而不能更准确地描述实际误差分布。
本文提出的分段指数分布和贝塔分布误差模型均可以处理不对称分布。但后者求解复杂, 且在合成过程中在某些研究区间上有时会出现概率密度异常, 数据处理过程中需要将该区间的风电功率预测误差信息忽略, 以保证能够求出最终的误差分布。这样造成的信息缺失, 在一定程度上会影响贝塔误差分布模型的描述精度。
2 分段指数误差分布模型
希望提出一种形状更灵活、峰度可变、求解方便且适用范围较广的误差分布模型。要求新模型能更多地挖掘实际误差分布的相关信息, 且误差模型的形状能随实际误差分布的形状改变而改变, 因而可应用于描述大部分研究对象的风电功率误差分布。
分段指数误差分布模型是两段指数分布的合成, 有两个形状参数, 且两段指数分布的形状参数分段估计, 因此, 分段指数分布与传统误差分布模型相比, 更加灵活可变。
2.1 分段指数模型分布函数
假设分段指数分布的概率密度函数为:
式 (1) 应当满足: (1) 在负无穷到正无穷上的积分为1; (2) 在两段指数分布的结合点x=μ0处, 两段分布的概率密度函数值相等。因此, 分段指数分布概率密度函数为:
式中:x= (Pforecast-Pactual) /Pcap, 为标准化的风电功率预测误差, 其中Pforecast为风电场风电功率预测值, Pactual为风电功率实测值, Pcap为风电装机容量;b1和b2为待估形状参数, 决定曲线的形状;μ0为两段指数分布的结合点, 即当相对误差为μ0时两段指数分布汇合, μ0取实际概率密度序列最大概率密度点对应的标准化误差值。
当b1=b2=b时, 该分布就是拉普拉斯分布, 所以拉普拉斯分布是分段指数分布的一个特例。分段指数分布概率密度函数的详细推导参见附录B。
根据分段指数分布概率密度函数 (式 (2) ) , 推导出分段指数分布模型的累积概率分布函数:
2.2 分段指数分布的特点
分段指数风电预测误差分布模型由两段指数分布构成, 这种模型构成的特点是: (1) 两段指数分布的部分参数由两组相互独立的误差序列估计, 因而两段指数分布在形状上具有独立性; (2) 巧妙利用实际误差分布存在的“分水岭”概率密度分布的最大峰值, 确定两段分布的结合点。基于这样的构成特点, 新模型与传统模型相比峰度可变、形状灵活, 且求解简便。
3 最小二乘非线性回归参数估计
现有研究中正态分布误差模型的参数估计, 常用方法有经验法[15]和最大似然估计 (MLE) 法[16]两种。文献[13]关于拉普拉斯分布的参数估计较为粗略, 而粗略的估计会降低误差分布模型的精度, 因此, 这两种分布模型的精度都具有提升的空间。
本文将借助于MATLAB采用非线性回归最小二乘法估计分段指数分布模型和柯西分布模型的参数。最小二乘非线性回归参数估计函数为fnl, 参数估计式为:
式中:C为待估参数向量, 含有多个待估参数元素;r为残差;C0为待估参数向量初值;X和Y为原始数据;fun为所选择的误差分布模型概率密度函数。
利用fnl函数估计参数的原理是, 根据原始数据X和Y描点所得图形形状选择合适的模型fun, 其中模型的参数C未知, 给定参数初值C0, fnl函数将利用Levenberg-Marquardt算法[17,18]最小化模型与原始数据间的残差, 求出模型的参数。该算法同时具有梯度法和牛顿法的优点。
4 实例分析
算例取自爱尔兰国家电网公司 (EirGrid) 风电场2010年、2011年、2012年1月8月19日的风电功率预测与实测数据, 研究对象为从所有有效数据中选取各天某一相同时段的风电功率实测数据与预测数据进行分析。
4.1 数据处理
用于本算例的原始数据将进行两种处理。第1种处理是:将标准化后的误差X序列按区间长度0.008从小到大划分为79个区间, 这种处理后的数据用于估计相应正态分布、拉普拉斯分布、柯西分布和分段指数分布模型的参数;第2种处理是:将各预测风电功率和实测风电功率与装机容量进行比值标准化, 将标准化后预测风电功率序列按照区间长度0.018从小到大划分为53个区间, 这种处理后的数据用于估计贝塔分布误差模型。
用于模型参数估计的区间数目划分常根据经验确定, 区间长度过大会造成信息缺失, 不能反映误差分布的规律, 区间过小会造成信息冗余, 不能表现出一般规律, 导致误差模型的泛化性能下降。实际区间长度应根据数据规模, 结合经验选择, 根据经验区间数目应选择为50~100。
该算例将通过模型精度指标和曲线拟合图形效果对比各模型的优劣, 以论证分段指数误差分布模型在形状的灵活性及峰度可变性方面的优势。
4.2 参数估计
按照文献[15]的经验法和文献[16]的 (MLE) 法估计正态分布误差模型, 按照文献[13]的方法估计拉普拉斯分布模型参数。根据实际风电功率预测误差概率密度序列, 得到最大概率密度为8.283 9, 对应标准误差为0.036。然后, 按照非线性回归最小二乘法参数估计方法估计分段指数分布函数模型及柯西分布的参数, 按照文献[12-13]的方法求解贝塔分布误差模型参数。各误差分布模型的估计参数见表1。其中, NLR表示非线性回归最小二乘法;表中各模型的估计参数定义见附录A中各模型概率密度函数中的变量定义;各贝塔分布参数见附录C。
4.3 模型精度评价指标
常用模型精度评价指标有纵向误差指标和横向误差指标[19]。纵向误差主要描述模型在竖直方向与实际情况的差别, 往往用偏大或偏小概括;而横向误差则主要描述模型峰值的滞后与超前。绝对值平均误差 (eMAE) 和均方根误差 (eRMSE) 是两种常用的纵向误差指标, 前者是对模型误差平均幅值的评价, 指标值越小表明模型精度越高;后者用来衡量模型误差的分散程度, 指标值越小表明模型精度越高。横向误差指标也称相关系数 (ICC) , 用于描述数据间的相关程度, 指标值越大表明模型精度越高。
用Y1表示原始数据序列, y1i表示Y1中的一个元素, 用Y2表示由模型所得对应的数据序列, y2i表示Y2中与y1i对应的一个元素, 模型误差为:
各指标定义如下:
式中:n为数据序列的长度;COV () 为协方差;D为方差。
首先, 评价各模型对实际风电功率预测误差概率密度分布的拟合精度。Y1为统计的实际概率密度序列, Y2为误差模型相对应的概率密度函数值序列。经过计算, 各模型的精度指标值如表2所示。
然后, 评价各模型对实际风电功率预测误差累积概率分布的拟合精度。Y1为统计的实际累积概率序列, Y2为与模型相对应的概率分布函数值序列。则各模型的精度指标值如表3所示。
4.4 误差分布模型的图形拟合
根据实际误差序列X及对应的概率密度序列Y, 可以获得实际误差概率密度分布如图2所示。
由图2可以看出, 该算例实际误差分布的特点如下: (1) 正态分布的峰度为3, 拉普拉斯分布的峰度[12]为6, 因而该分布的峰度大约在3~6之间; (2) 该分布为不对称分布, 有一定的偏斜度, 采用对称的误差分布模型拟合会降低拟合精度。因此, 采用正态分布和拉普拉斯分布表示该误差分布, 将会与实际误差分布产生较大的偏离。
对照表2、图2和图3, 表2的结果表明对于本算例中的风电功率预测误差分布, 分段指数概率密度分布的纵向误差和横向误差比正态分布、拉普拉斯分布、柯西分布以及贝塔分布明显偏小。这一点从图2和图3中也可以看出, 表明了分段指数概率密度分布的精度高于其他模型, 原因在于分段指数分布的两段指数分布的指数系数不同, 形状随实际误差分布的偏斜产生偏斜, 形状比较灵活。
对照表3和图4, 表3的结果表明对于本算例中的风电功率预测误差分布, 分段指数累积概率分布的纵向误差和横向误差比正态分布、柯西分布明显偏小。从图4可以看出, 分段指数累积概率分布与实际误差分布基本重合, 正态分布和柯西分布则与实际累积概率分布的偏离较大。
对照表3和图5, 表3的结果表明对于本算例中的风电功率预测误差分布, 分段指数累积概率分布的纵向误差和横向误差与拉普拉斯分布非常相近, 且都非常小, 而且都比贝塔分布还小, 这一点可以从图5中看出。
由以上分析可知, 在该算例中, 分段指数累积概率分布和拉普拉斯累积概率分布对实际误差累积概率分布的拟合精度远高于正态分布和柯西分布, 略高于贝塔分布, 但拉普拉斯概率密度分布的拟合精度较低, 因此, 拉普拉斯分布模型在本算例中不能同时保证概率密度分布与累积概率分布的精度, 贝塔分布的概率密度分布与累积概率分布精度基本满足要求, 但与分段指数分布相比, 精度上要略逊一筹, 且求解复杂。分段指数分布则因形状参数分段估计, 形状灵活, 能同时保证概率密度分布与累积概率分布的精度都较高。
为了说明分段指数分布是否具有普遍适用性, 本文还采用另一个算例验证该模型的有效性。由于客观条件的限制, 国内外缺乏可用于统计分析的大量公开数据, 同时为了研究的严谨性, 笔者将在现有研究中给出的实际风电功率误差分布的基础上进行分析, 新算例取自文献[20]中的图2。算例说明及相应内容分析见附录D。
4.5 风电功率预测方法对预测误差分布的影响
风电功率预测按预测时间尺度可分为超短期预测 (1~60min) 、短期预测 (1~48h或72h) 和中长期预测 (数星期至数月) 。常用的风电功率预测方法有持续预测法、时间序列法和人工神经网络法。持续预测法最简单, 常用于进行超短期预测, 时间序列法和人工神经网络法用于短期风电功率预测。
风电功率预测误差分布随预测时间尺度和风电场规模的不同, 预测误差分布呈现不同的规律[9], 如超短期预测精度较高, 风电功率预测误差将在0附近呈现尖峰;对于短期风电功率预测, 当预测均值接近额定值或0时功率预测误差的概率密度将呈现偏向一侧的扭曲;对于大规模风电场群, 短期风电功率预测误差将趋向于正态分布。
文献[21]对比分析持续预测法、时间序列法和神经网络法预测的均方根误差, 指出3种预测方法随着预测时间的增加, 预测精度都要降低, 但降低幅度不同, 预测精度差别越来越大。时间序列法在预测时间尺度1~2h以内时, 其预测误差小于神经网络法, 预测误差相比于神经网络法能以更大的概率分布在区间[-0.1, 0.1]内[22], 但随着预测时间尺度的增大, 神经网络法将表现出更高的预测精度。而对于1~24h的短期风电预测, 神经网络法相比于时间序列法始终能以更大的概率使风电功率预测误差分布在[-0.2, 0.2]区间内[22]。
5 结语
受风电场规模、预测时间尺度及弃风程度等的影响, 不同风电场的预测误差分布表现出不同的特性, 传统误差模型在描述绝大多数的非对称误差分布精度时不能满足要求。本文提出分段指数风电功率预测误差分布模型, 该模型能够较多地挖掘实际误差分布的相关信息, 其形状灵活, 对误差分布峰度、偏斜度及尾部特性无固定要求, 且求解方便、便于微积分运算, 适于工程应用, 具有较强的适应性和适用性。这些特点使得该模型可适用于描述多预测时间尺度的误差分布, 其在描述非对称误差分布时具有更多优势。
要进一步论证分段指数误差分布模型是否具有普遍意义, 还需要大量的风电场数据和实践验证。对于中国的应用现状而言, 风电调度存在较严重的弃风行为, 弃风的存在影响了风电预测误差的真实性, 会扭曲实际的误差分布。随着风电相关数据的完善, 研究不含弃风因素的风电预测误差分布, 在调度运行中以风电实际可发电出力置信区间为依据制定风电的计划出力, 从而增加风电计划出力的可信度。在今后的工作中, 将基于风速分布和功率实测数据, 研究预测方法、预测时间尺度、尾流效应以及风电场的规模等各影响因素对风电功率预测误差分布的影响, 从而为推动风电相关领域的发展发挥应有的作用。
分布模型范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。


