大规模计算范文
大规模计算范文(精选9篇)
大规模计算 第1篇
现代汽车车身是由多种不同厚度的薄板冲压焊接而成的复杂结构,车身结构对外界载荷的响应依赖于车身结构自身的特性。由于车身结构复杂、参数众多,因此,在传统的车身设计中主要依赖有经验的工程师依据经验进行反复的试探性设计,设计的主观因素较多,设计需经实车验证,设计周期较长[1,2]。有限元方法可以对车身结构在未生产样车之前进行反复的优化设计,但对于车身设计这种大规模计算问题来说,基于有限元方法的优化需要反复迭代,计算效率较低。
解决复杂结构多参数大规模问题的一条途径是对结构进行降阶建模和分析,常用的降阶方法有Guyan降阶法、Ritz向量降阶法、正常正交分解法、平衡截断法、减基法[3,4,5,6]等。文献[7,8,9,10,11]提出了采用减基法计算的事后误差处理方法和离线、在线的计算方法,并将其在热传导等领域进行了应用。Liu等[12]将减基法扩展到反问题中,并进行了相关研究。李永红等[13]将减基法用于车架的分析。
复杂结构大规模问题需要借助有限元手段进行分析。在通用有限元软件中,参数无法显式地表达,且质量矩阵和刚度矩阵依赖于软件输出,这些因素限制了减基法的应用领域,导致减基法在复杂结构多参数大规模问题计算领域无法应用。笔者采用减基法和有限元的混合算法解决复杂结构大规模问题的缩减计算。
1 车身设计中的大规模问题
车身刚度是车身结构力学性能的主要评价指标,车身刚度设计是车身设计的重要内容。影响车身刚度的因素较多,包括几何参数、材料参数等。车身结构在造型完成之后,其外形参数基本确定,通常通过改变车身钢板的材料特性和厚度来改变其承载的力学性能。一般承载式车身使用的钢板多达几十种甚至上百种,车身钢板与刚度相关的材料参数差异较小,对车身刚度变化影响较小,因此钢板的厚度变化成为改善车身刚度的主要手段。本文以车身主要部件的钢板厚度为参数,进行大规模问题缩减计算方法的研究。
驾驶室白车身结构分为5个总成:前围总成、侧围总成、地板总成、后围总成和顶盖总成。每个总成由若干部件组成,每个部件都具有各自的厚度,这些厚度构成刚度设计的参数。
商用车驾驶室主要关注扭转刚度。白车身扭转刚度计算的位移边界条件是约束地板纵梁后端的6个自由度,力的边界条件是在纵梁的前端左右两侧分别施加大小相等方向相反的两个集中载荷,从而构成车身前端纵向横截面内的扭矩。通过测量车身左右两侧的扭角来评价车身的扭转刚度,力的边界条件如图1所示。
2 减基法与有限元法的混合计算方法
2.1 减基法基本原理
减基法基本思想是:当系统由多个参数来描述时,这些参数组合会使系统有不同的响应(这些响应可以由有限次试验得到),系统在新参数下的解可以用事先设计的近似解空间来表示。这种方法在对结构进行自由度缩减时能很好地保持原系统的物理属性。
任何含有参数的结构力学响应均可以表示为
a(ue(μ),v;μ)=f(v),∀v∈Xe (1)
式中,μ为输入的参数,μ∈S⊂Rp,对多参数问题,μ为参数向量;Rp为参数域;S为参数样本集合;ue(μ)为场变量;Xe为Hilbert空间;a(,;μ)为Hilbert空间中双线性函数;f()为Hilbert空间中的线性函数。
对于大型结构,有限元方法通常用偏微分方程弱形式的矩阵表达:
KU=F (2)
式中,K为刚度矩阵;U为场变量;F为载荷向量。
假设样本集合通过一定的预采样方法得到:
S={μ1,μ2,,μn} (3)
式中,n为样本个数。
系统在这些参数样本下的响应构成一个解空间或减基空间:
W=span{ζ1,ζ2,,ζN} (4)
式中,N为解空间的维数;ζk为解空间的第k个线性无关的向量,k=1,2,,N。
设m为结构的总自由度,对于大规模问题,m≫N。以解空间的基为列向量,构成投影矩阵ZmN,将刚度矩阵和载荷向量向解空间进行投影,有
KN(μ)=ZTK(μ)Z (5)
FN(μ)=ZTF(μ) (6)
得到减缩系统方程:
KN(μ)UN=FN(μ) (7)
式中,KN(μ)为减缩系统方程的刚度矩阵;FN(μ)为减缩系统方程的力向量;UN为减缩系统方程的解。
新的系统方程是NN的线性系统,由于N≪m,因此,原线性系统由mm的线性系统变为NN的线性系统,使问题求解计算量大大缩减。UN为减缩系统的响应,以UN为系数对解空间的基向量进行线性组合即可得到原系统的近似响应:
2.2 混合算法流程
减基法和有限元法的混合算法主要由3个部分构成:解空间构造过程、基于有限元的参数分离过程和减缩计算过程,其计算流程如图2所示。
3 构造近似解空间
3.1 车身设计的参数
假设μi(i=1,2,,n)为由各参数构成的某一个样本,有
μi={μ1,μ2,,μβ} (9)
式中,μj为第j个部件的厚度,j=1,2,,β;β为车身部件数。
为了表达简便,这里假设各总成内各个部件的钢板厚度一致,顶盖总成部件较少,将其融合到前围总成、侧围总成和后围总成中。车用钢板具有标准的尺寸系列,为了不失通用性,假设参数在钢板的厚度范围内可以选取任意值。由前围总成、侧围总成、地板总成和后围总成的钢板厚度构成的一个样本为
μi={μ1,μ2,μ3,μ4} (10)
式中,μ1、μ2、μ3、μ4分别为前围总成、侧围总成、地板总成和后围总成中部件的钢板厚度。
3.2 参数样本的选取
假设每个参数取α个值时,样本个数n=α4。车身常用钢板厚度在0.8~2.0mm范围内,根据参数取值不同得到3个不同的样本集合,3个集合内的样本数量不同,见表1。
3.3 构造近似解空间
计算在3个不同样本集合下各个样本的响应,得到对应的响应矩阵Pmn(用于构造近似解空间)。构造解空间的方法较多,常用的有Gram-Schmidt正交法、QR分解法和奇异值分解法。对于大规模问题,考虑到计算精度和数值稳定性,通常使用奇异值分解法求解空间的近似基。
若响应矩阵Pmn的秩为N,且有
N=rank(P)<min(m,n) (11)
则可以将奇异值分解简化为
P=Z Σ V (12)
Z=[ζ1ζ2 ζN] V=[v1v2 vN]
Σ=diag(σ1,σ2,,σN)
式中,ζk和vk分别为左奇异向量和右奇异向量;Z的列向量构成近似解空间的基;σk为非零奇异值。
若矩阵是非秩亏缺的,则在进行奇异值分解时奇异值均为正值,将奇异值按照从大到小的顺序进行排列,较小的奇异值对应的奇异向量对矩阵秩的贡献较小,可以忽略。因此,使用不同的截断误差来截取奇异值向量,可得到不同维数的解空间。通常,通过控制截断误差来选取矩阵的有效奇异值,小于截断误差的奇异值对解空间的贡献较小而被忽略[14]。
奇异值分解截断误差越小,近似解空间线性无关列向量的个数越多,即近似解空间的维数越大。图4和图5分别为两种样本集合下响应矩阵奇异值分解截断误差e与近似解空间维数N之间的关系。由图4可见,当截断误差为0.1时,从81个样本中选取的有效解空间维数为15,随着截断误差的增大,解空间的维数逐步变小,当截断误差为1时,有效解空间的维数为8。
4 基于有限元方法的参数分离
4.1 单元刚度矩阵的分解
有限元方法的参数化过程通常是将参数隐含地表现在刚度矩阵和载荷向量中,这对减缩计算带来了较大的困难。考虑将有限元方法中的参数显式地表示出来,即将刚度矩阵和载荷向量进行分解,将其表示为
式中,Θi(μ)为与系数相关的函数;Ai和fi为与参数无关的项。
在车身设计中,通常使用由平板单元组成的壳单元[15,16,17]进行模拟,单元刚度矩阵表示为
k=μkm+μ3kb+μks (15)
式中,μkm为由平面应力单元的膜效应引起的刚度项;μ3kb为由Mindlin厚板单元弯曲的面内效应引起的刚度项;μks为由厚板面外剪切引起的刚度项;μ为板厚。
可将单元刚度矩阵分解为两部分,第一部分表示与参数成线性关系的项,第二项表示为与参数成三次方关系的项,即
式中,k1、k2为单元刚度矩阵的无参组成阵。
4.2 无参组成阵向总体坐标系的集成
将无参组成阵按照标准的单元刚度矩阵组装流程向总体坐标系转化和集成[18],生成不含参数的总体无参矩阵。将具有相同厚度特性的单元的刚度矩阵分解并集成,得到两个总体无参矩阵。理论上,总体无参矩阵的维数和总体刚度矩阵的维数是相同的。将所有的总体无参矩阵和系数函数进行合并,即可得到总体刚度矩阵:
式中,K为总体刚度矩阵;Ki为总体无参矩阵。
K和Ki均为大型稀疏矩阵。
若车身部件较多且厚度变化较大时,将会生成较多的总体无参矩阵。这些矩阵均为大规模稀疏矩阵,在编制程序生成总体无参矩阵时将会消耗较多的计算机内存,使用相关技术,如合理的节点编号、带状存储技术或一维存储技术等可以大幅节约计算机内存[15,19]。
5 减缩系统与减缩误差
5.1 构建减缩系统
对于图1所示的车身结构,车身的每个总成对应2个总体无参矩阵。将每个总体无参矩阵及载荷向量向近似解空间进行投影,有
KNt=ZTKtZt=1,2,,8 (18)
FN=ZTF (19)
对任意新参数μnew,使用系数函数Θi(μnew)对每个部件对应的缩减矩阵进行合并,即可得到新参数下的缩减刚度矩阵:
通过求解KNUN=FN,得到原系统在新参数μnew下的响应近似值
5.2 减缩系统误差评价
在相同参数下比较有限元法计算结果和减缩计算结果,验证减缩计算的精度。定义减缩系统相对误差为
式中,
计算所有参数下缩减相对误差,得到相对误差ε={ε1,ε2,,εn},取其无穷范数为减缩误差,有
5.3 减缩误差、减缩投影时间与解空间维数之间的关系
减缩投影时间和减缩误差是衡量减缩系统效率的重要指标。近似解空间是影响缩减系统性能的主要因素。减缩误差和减缩投影时间随近似解空间维数变化的曲线是减缩系统的效率曲线。
由图6~图8可以看出:①随着近似解空间维数的增大,减缩误差趋向于一个稳定值;②随着近似解空间维数的增大,减缩投影时间正比于维数的增大;③当近似解空间的维数达到一定值时,继续增加维数不会提高减缩精度,但会引起减缩投影时间的大幅增加;④使用过多的样本数量构建的减缩空间的缩减误差稳定值(图8)大于较少参数组进行缩减计算的误差稳定值(图6和图7)。在保证精度和计算时间的情况下,较少的样本数量构建的减缩系统即可满足精度要求。
在此,选取由16个样本构造的减基系统,解空间维数为12。
5.4 减缩计算效率
使用减缩计算可以将大规模复杂问题的计算转化为解小型线性方程组,极大地提高计算效率。当需要计算在多种参数组合下系统的响应时,缩减计算具有明显优势。
减缩计算总时间由两部分组成,第一部分为离线过程时间,包括构造解空间和减缩投影的时间,第二部分为在线过程时间,即新参数下使用减缩系统的求解时间。随着计算次数的增加,减缩系统的计算时间与有限元计算时间的比较见图9。
由图9可见,当M>N时,减缩计算的总时间少于有限元计算时间,当M≫N时,减缩计算的优势更为明显。在大规模复杂结构的优化计算过程中,通常需要修改参数进行反复迭代计算,使用减缩计算将避免反复求解大规模线性方程组,极大地提高优化计算的效率。
6 结论
本文使用减基法和有限元方法的混合算法缩减复杂结构大规模计算问题,通过有限次有限元计算得到解空间的近似,并将大型系统向近似解空间进行投影,从而将求解大规模线性方程组变为解小型线性方程组,在保证精度的前提下极大地提高了计算效率。该方法对大型复杂结构的反复迭代计算有较高的效率,对于优化计算问题的优势尤为明显。
基于减基法与有限元方法的混合算法是通过编程实现的,相关运算通过调用编程软件自带的数值计算程序实现。因此,算法的效率同样受到有限元前处理方法、矩阵存储方法等的影响。
摘要:针对车身设计中复杂结构多参数大规模问题,提出了一种基于减基法和有限元的混合算法来进行缩减计算。该方法首先通过计算系统在有限个样本下的响应构造近似解空间,然后基于有限元方法分离出刚度矩阵中的设计参数,接着将矩阵向解空间进行投影,最后构建减缩计算系统。在新参数条件下,通过减缩系统得到大规模问题的响应,极大地提高了结构响应的计算效率。
大规模计算 第2篇
在这一框架的设计与实现当中,对Hadoop分布式开源计算机框架进行了应用,对其中的HDFS分布式文件系统,以及Map Reduce进行应用,从而对大规模数据处理业务进行处理和协调。在计算节点当中,对放置在Map Reduce任务进行映射,对大规模数据进行划分,使之形成若干子块,并对数据块的数量、规格等参数加以掌握。通过HDFS功能,可以在每一个计算节点当中,对数据块副块进行智能的放置,同时针对各个节点,对具体的角色进行设计。在大规模数据处理的过程当中,需要利用Reduce函数、Map函数、以及相关的程序进行分布化处理。在Hadoop当中,为了对Map Reduce进行运行,提供了一个API进行支持。
3结论
大规模计算 第3篇
余晓晖提供的数据显示,79%的受访企业对云计算有一定了解,而37.5%的受访企业已经开始部署云计算应用,其中部署在公有云上的企业占31.1%,使用私有云的企业占6.4%。受访企业中部署SaaS用户占比最小,仅为16%,但市场规模却最大,达到28.05亿元。SaaS层面主要以企业管理软件和在线办公软件为主,目前商业模式市场接受度较高。PaaS用户占比为28%,市场规模最小为1.84亿元,并且是以免费互联网应用开发为主。
IaaS层面应用虽拥有56%用户数量,但市场规模仅为5.11亿元,主要集中在虚拟机、云存储等资源出租。余晓晖指出,云主机、云存储、云邮件等资源出租型应用使用率达到约40%,未来40%用户主要希望使用企业管理软件、应用开发平台、网络加速等服务。A股公司中,包括东软建团(600718.SH)、网宿科技(300017.SZ)等公司目前可以提供相关服务及产品。
此外,61%用户认为目前云服务价格便宜或适中,81%的用户仍表示接受同传统IT类似的固定收费模式,而作为云计算核心的按需计量收费接受度仍旧偏低。虽然云计算服务市场进一步扩大,但中国云计算厂商前景并不乐观。
考虑大规模风电接入的备用容量计算 第4篇
风能的间歇性和随机性给电力系统的运行增加了风险[1,2],使得当前以高可靠性常规电源为依据的备用设置无法满足风电并网后系统运行的可靠性需求,需要研究新的备用分析方法,维持电力系统的功率平衡和稳定。因此,在大规模风电接入后,迫切需要对系统的备用容量进行研究。
近年来,新能源备用的研究受到越来越多的关注。文献[3]指出风能的不可控性使得对风电功率的预测无法与其他传统能源一样可靠。随着风电容量比例的增加,系统需要与风电场额定功率相当的备用容量。文献[4]考虑负荷预测误差和机组故障停运等随机因素,建立系统备用容量获取模型。文献[5-6]对传统备用容量确定的概率性方法进行扩展,采用原有概率性方法的思路求得最优备用容量。文献[7-8]采用对历史预测误差数据进行统计分析的方法得到风电功率预测误差及负荷预测误差分布,并运用曲线拟合法得到风电接入后满足系统一定可靠性水平的备用容量。
文献大都通过对历史预测数据进行统计分析得到预测偏差的概率密度函数,但没有对数据进行筛选,由于备用容量统计分析是基于对历史数据规律的归纳与总结,通过寻找其历史变化规律,对未来的变化规律进行外推。因此,历史数据的筛选对备用结果有很大影响。文献[9-11]在构造模型时,均在聚类分析理论的基础上对数据进行筛选,其思路值得借鉴。
在大规模风电接入的电力系统中,除机组故障和系统负荷预测误差等因素,风电的随机性、间歇性也会使风电功率预测存在较大误差,系统随机性增大。传统以常规能源为基础的备用设置已不满足风电接入后系统的可靠性要求,因此,需要研究新的备用设置方法来弥补因风电功率预测误差造成的系统供电和负荷的不平衡。
本文结合某网级电力系统实际情况,考虑大规模风电接入情形下系统的备用容量需求,以应对风电功率预测误差造成的系统供电和负荷的不平衡。考虑大规模风电间歇特性,兼顾电网运行安全性和经济性,本文引入聚类分析技术,对风电功率预测数据进行筛选,并进行统计分析,建立风电功率预测误差与旋转备用需求变化间的关联模型,形成日前新能源备用需求计划。
1 发电可靠性指标
本文将备用容量满足系统安全运行要求的概率作为系统可靠性指标[12],备用需求不超过给定值限值的概率为:
式中:y∈Y为决定风电备用需求的不确定随机变量;p(y)为y的概率密度函数;R(y)为风电接入引起的备用需求;ξ为给定限值。
若置信度水平为α∈(0,1),则满足某一置信度水平的风险备用需求可表示为:
式中:α为备用容量满足系统运行的置信度水平[13];Rα为风险备用需求。
从物理意义上讲,1-α可看做系统失负荷概率所允许的上限值。
2 风电功率预测误差分布模型描述
2.1 相似度比较法求相似日
虽然风电出力难以预测且误差大,但其季节性分布非常有规律,在风电大发和匮乏季节所需的备用容量增加不同,因此本文根据风电的规律性变化,将相似性理论引入系统风电输出功率变化规律的研究中,选出与计划日较为相似的历史数据,并对历史数据进行筛选,再对相似日的风电功率预测误差数据进行统计分析,以提高备用容量计算的准确性。
在进行相似度比较时,由于计划日的输出功率未知,可用计划日前一日的风电功率数据代替计划日的实测数据进行相似性比较。
将历史日和计划日的输出功率序列进行相似度比较,采用欧氏距离作为判定相似性程度的依据,欧氏距离的定义如下:
式中:Xi=(xi,1,xi,2,,xi,96)和Xj=(xj,1,xj,2,,xj,96)分别为i日和j日的输出功率序列,一日共96个采样点;Pcap,i和Pcap,j分别为i日和j日的采样机组装机容量;欧式距离di,j为i日和j日的输出功率序列在几何平均距离上的相似性,di,j越小,相似度越大。
若给定阈值为Z,输出功率序列Xi和Xj满足di,j<Z,则称Xi和Xj几何相似。依次将历史日的输出功率序列和计划日序列进行比较,若di,j<Z,则视为相似数据,并将其作为计算备用的历史样本数据区间。
选取数据库中4d的典型历史数据作为说明,如图1所示。
将计划日11月20日与图中4个历史日期数据进行相似度比较,计算得到10月3日,10月19日,10月20日,11月8日与计划日的欧式距离分别为1.417,0.41,0.45,1.475;若设定阈值Z=1.2,其中10月19日和10月20日的欧式距离小于阈值,认为可以作为相似日,并作为备用计算的历史数据,而10月3日和11月8日则不予考虑。
2.2 改进的K均值聚类法求相似时段
聚类分析技术直接比较各事物之间的性质,将性质相近的归为一类,性质差别较大的归入不同的类,因此常被用来衡量数据源间的相似性。
考虑到风电输出功率在计划日内各时段存在较大差异,其预测误差在不同时段分布也不同,需要对计划日各个时段分别进行备用计算,计算量较大。
在风电日内引入聚类分析技术,对相似日历史数据进行时段聚类。聚类后,只需对各相似时段进行备用分析。
K均值聚类是一种比较典型的划分方法聚类,给定N个向量和K个聚类,通过一系列迭代,将N个向量划分为K个相似的类,使同一类中的对象相似度尽可能高,而不同类之间的相似度尽可能低。考虑到K均值聚类随机选择K个类的初始聚类中心对结果影响较大,本文通过采用层次聚类得到K个划分,将这K个划分的中心作为初始聚类中心,再将相似日各时段(此时段指一日24个时段,其数据由1h内的4个采样数据求均值法得到)的输出功率序列进行K均值聚类[14],得到计划日相似时段,然后分别对各个相似时段进行备用分析。首先设定聚类个数为K,算法流程如图2所示。
2.3 风电功率预测误差分布
文献[8]中,风电功率预测值和实际值的偏差服从正态分布,基于此结论统计与计划日相似的历史时间范围内,各相似时段风电输出功率预测总量和实际输出总量的误差。
在日前计划编制时更关心一日的误差情况。根据调度的需要和新能源输出功率情况,统计电网的计划和运行数据,统计数据间隔为15 min,对每个时间点,风电预测误差为实际出力与预测出力的差值。每个时间点t风电出力误差如下:
式中:ewp,t为时间点t的风电功率预测误差;Pwpreal,t为时间点t的风电输出功率;Pwpfore,t为时间点t的风电预测输出功率。
若将一日分为若干个时段(聚类分析分为4个相似时段),统计每个时段预测出力偏差分布。对于时段T,其时间范围内共有N个时间点(间隔为15min),历史数据时间长度为M天,则对于时段T,共有MN个出力偏差数据,利用极大似然估计法,可得到偏差分布的期望和方差。
3 新能源备用计算模型
备用是针对系统运行中不确定性因素(系统负荷、机组事故等)配置的,在常规能源电力系统中[15],备用容量可用来应对系统负荷预测误差及机组停运带来的影响。风电并网后,因风电预测精度远不及负荷预测,系统随机性增大,备用容量可用来应对大规模风电场出力的不确定性给系统带来的影响。
本文考虑大规模风电接入情形下的新能源备用容量,即用于弥补风电功率预测误差造成的系统供用电不平衡的备用容量。因此,与风电功率预测误差概率分布函数相同,风电出力误差对备用的需求同样为概率密度函数,若fTreserve(ewp)为T时段新能源旋转备用需求概率密度函数,其与风电偏差概率密度函数fT(ewp)的关系为:
新能源备用由一定系统可靠性水平α决定,其表达式为隐函数,即
式中:Rwind,h为h时段新能源备用容量;μwind,h为h时段风电功率预测误差分布期望;σwind,h为h时段风电功率预测误差分布方差。
综上所述,新能源备用计算流程如图3所示。
4 实例分析
采用C++编程,以风电机组总装机容量为2 830 MW的某网级电力系统为案例分析对象,计算日前备用计划。将案例日风电功率数据和历史数据进行相似性比较,得到相似历史数据,并通过聚类分析得到相似历史时段,相似时段如表1所示。
从聚类结果看,通过聚类得到的相似时段基本符合风电场出力规律。通过对各相似时段预测误差数据进行统计分析,计算备用容量得出:风电接入后,当系统可靠性指标分别为0.85,0.90,0.95时,需要设置的新能源备用容量如图4所示。
由图4可以看出,当系统可靠性水平越高(即备用容量设置的置信度水平越高),系统所需要的新能源备用容量相对越大。但随着置信水平的增加,系统备用容量的增量逐渐减小,这说明系统在不同置信水平下备用容量获取区间的灵敏度不同。当可靠性指标增加到一定水平,系统所需设置的新能源备用容量增量会越来越少。
采用经验估计法,用负荷的百分比(本文为3%)设置常规能源备用,得到常规备用容量,与风电并网后,系统需要设置的新能源备用容量需求如图5所示。
由图5可以看出,目前接入电网的风电装机容量比重有所增加,但相对常规能源比例较小,故新能源备用相对于常规能源备用需求较少。但随着新能源比重的增加,系统需要设置的新能源备用比例会随之增加。
此外,通过计算发现,当备用容量增加到一定水平时,其对系统的可靠性水平的提高并不显著,不同置信水平下新能源备用容量如图6所示。
因此,系统运行人员在确定置信度水平时,应综合考虑备用获取成本和置信度水平,以期在经济性和安全性之间取得平衡。
5 结语
本文研究大规模风电入网条件下,保证系统安全运行的新能源备用需求。风电并网后,由于风能的间歇性和不稳定等特性,使得系统随机性增大。为保证系统安全运行,考虑增加额外的备用容量以应对风电功率预测偏差给系统带来的影响。本文引入聚类分析方法对历史数据进行筛选,建立风电功率预测误差与备用需求变化间的关联模型,计算日前新能源备用需求计划,为新能源接入电网后系统的安全运行提供了保障。
上述模型是以满足系统安全运行为前提的调度。考虑到经济性要求,若机组提供旋转备用,则需要支付一定的备用费用,系统总运行成本应包含这一费用。将备用需求加入安全约束经济调度和安全约束机组组合优化模型中统一求解,可实现经济性和可靠性之间的协调,也可作为进一步研究的方向。
云计算环境下大规模数据处理的研究 第5篇
随着互联网时代信息与数据的飞速发展,各行各业在处理日常事务的时候,如电子商务平台的交易记录处理,医疗影像处理,人口普查,商业贸易,交通业务等,数据规模都可以轻易达到GB,TB,如京东商城每天产生的交易记录数达几十万笔,而这些领域都需要计算机对这些大规模的数据进行处理。在现代社会高速发展的今天,越来越离不开高性能的计算机,对存储能力和大规模数据处理能力的要求也越来越高。
1 大规模廉价计算平台的初步研究
针对大规模数据信息和计算资源的特征及其数据处理要求,可以将闲置的计算机资源组建成大规模廉价集群计算平台,在原有的云计算研究基础上整合Hadoop,采用Map Reduce编程模型,将大规模数据处理任务分成很多细粒度的子任务,分布式地在多个计算节点上进行处理和计算,从而在云计算环境下获得对大规模数据的处理能力。
当计算资源和存储资源虚拟化被创建、发布后,需要通过相应的虚拟化解决方案部署到虚拟计算节点资源池中才可以被管理和使用,因此大规模计算平台的建设过程也是云计算环境下大规模数据处理的一个重要环节,而这一过程主要分为以下几个步骤:
(1)参数化配置数据处理所需资源,并依据需求定制。无论是数据处理用户还是计算资源及存储资源提供者,在部署和使用计算节点资源池之前,首先要选择需要部署的计算资源,并设置相应的参数,用户主要通过这一部署过程获得自己需要的计算资源以及存储资源,而提供者则在不同的操作模式中,部署底层的计算资源的相关属性,来为用户提供相应的参数服务。
(2)部署计算资源与存储资源。依据第一步定制的相关设置参数,来确立在大规模数据处理过程中的计算资源、存储资源的部署,以及相应的数据处理和计算流程的部署方案。
(3)保存定制化参数。步聚(1)产生的相关的参数设置信息写入到相应的计算资源、存储资源配置文件中,用来分配计算流程调度来启动相应的计算节点的计算资源和存储资源,或者对计算节点的定制的处理服务进行部署和管理。
(4)选择计算节点,并且配置计算流程。在对计算节点及大规模数据处理过程中所需软硬件资源进行监测及管理的情况下,部署工具会通过网络连接到目标计算节点和配置对应的计算流程,成功后,开始执行大规模数据处理方案。同时,依据配置与部署方案,开始通过代码来执行分配计算资源和存储资源。
(5)部署及实施计算流程。在外部数据处理资源管理实施方案的监测下,在各个计算节点上,实现相应的大规模数据处理的部署过程和实施方案。
(6)启动计算节点,激活相应的计算资源、存储资源的虚拟化分配,同时激活整个计算流程。在完成监测之后,开始激活。在计算节点上启动部署后,通过网络,在各个计算节点发送一系列数据处理命令,完成计算流程的部署和调度工作,激活成功后,则在各个计算节点执行计算流程。
2 基于云计算的大规模数据处理框架模型
针对一般的大规模数据资源和计算资源的特征及数据处理的要求,笔者将计算机网络和云计算技术引入到大规模数据处理中,提出在集中或分布管理的大量廉价计算机(如PC)集群上构建动态的、可扩展的、高性价比的、易使用的高性能计算平台,并提出基于云计算的大规模数据处理框架模型。这一框架模型分为两级,第一级是底层的大规模廉价计算机集群及对应的虚拟资源体系;第二级是基于第一级的大规模数据处理与分析的基础架构、数据处理服务请求与处理及监测管理体系。因此,可以在此基础上构建一种动态的、可扩展的、高性价比的高性能计算平台;软件体系的核心部分是第二级,在第一级构建的大规模廉价计算机集群及对应的虚拟资源体系的基础上,形成大规模数据处理所需的虚拟化资源的配置、回收、容错处理及负载均衡等功能体系,在虚拟资源被统一调度和管理的基础上,利用Hadoop的核心技术,通过编写数据处理接口,针对不同领域及学科的大规模数据处理的服务需求,为用户提供大规模数据处理的计算平台的软件支持,在各个虚拟计算节点之间完成分布式的并行数据处理的计算任务,并将最终的结果以对应的云服务形式提供给终端用户。提供给地理数据分析、天文信息计算、Web日志处理分析及DNA信息分析等大规模数据处理的用户接口,可以通过Web Service方式提供接口访问,从而获得用户大规模数据处理需求,以及反馈大规模数据处理的结果。
本文对此框架进行了初步的实现,利用分布式开源计算框架Hadoop,使用其分布式文件系统HDFS和Map Reduce来协调和处理大规模数据处理的业务。
(1)大规模计算机集群环境搭建。通过映射,放置Map Reduce任务在计算节点中,将大规模数据划分成多个子块,确定数据块的分块大小、数目等,HDFS能够智能地放置数据块的副本在每个计算节点,并设置每个节点的具体角色。
(2)载入大规模数据到Hadoop提供的分布式文件系统HDFS中,以允许Hadoop把Map Reduce的数据处理任务转移到各个计算节点。
(3)大规模数据处理的分布化。即需要Map函数、Reduce函数和相关程序实现大规模数据处理,而Hadoop提供了一个API来运行Map Reduce。
(4)反馈数据处理结果。通过用户验证接口,将大规模数据处理结果通过相应的云服务平台反馈到数据处理需求者。
3 大规模数据处理系统实例
通过对以上框架模型进行分析,以京东商城的大规模的Web日志数据处理为例,收集多个站点前段的原始Web日志文件,对这些Web日志数据进行处理,主要是经过以下步骤。
(1)首选收集相关的Web日志,将这些来自站点前端的日志存储起来。
(2)对收集来的数据进行统一格式配置。因为从站点前端收集到的Web日志来源较为复杂,格式不统一,必须对大规模的日志配备进行统一格式,并且保持数据信息的内容完整。
(3)将大规模Web日志导入到相应的HDFS中,利用HDFS的备份机制和存储原理,建立起各个节点的通讯方式,配置对应的名称节点、数据节点等信息。
(4)利用Map Reduce模型处理相关数据的规则设计和计算功能,这部分内容是数据处理的重要部分,是整个工作的重心。
(5)将计算完的数据导出后,按照一定的输出格式和要求进行保存,并且能够方便用户对这些信息进行分析和处理。
(6)用户得到数据信息后,将其结果反馈回来,并且对处理中所产生的垃圾数据进行清理。
4 总结
本文主要是对云计算环境下的大规模数据处理技术进行了分析,验证了云计算技术在大规模数据信息处理中的实用性,并且结合实际案例,对电商的Web日志大规模数据处理进行了分析,更好的阐明大规模数据处理的方式。
参考文献
[1]孙伟.云计算理论及其技术的应用[J].软件.2012(07)
[2]王宏宇;Hadoop平台在云计算中的应用[J].软件.2011(04)
大规模计算 第6篇
由于风电的随机性、波动性和间歇性[1,2],风电并网给电力系统区域间可用输电能力ATC(Available Transfer Capability)[3,4,5]计算的可信性带来巨大挑战[6,7,8]。在ATC的计算中,容量效益裕度CBM(Capacity Benefit Margin)是指负荷所在处的主输电系统为供电服务公司留取的一部分线路传输功率,以保证电力系统运行的可靠性水平[9]。CBM留取的合理性和准确性将直接影响所发布ATC值的可信度,进而影响系统运行的可靠性和经济性。随着大规模风电并网运行,为了确保系统ATC评估的可信性和准确性,需要对区域电网CBM的计算模型及多区域电网输电断面CBM的求取模型进行更为深入的研究[10,11]。
当前,电力系统对于CBM的研究尚不够完善,关于新能源并网对CBM留取的影响、CBM留取对系统ATC可信度的影响及对系统运行可靠性和经济性的影响尚未考虑在内。文献[12-13]采用传统的确定性方法计算CBM,主要考虑传统机组停机故障等不确定性因素,其发生概率较小,因此CBM大小一般取系统内最大发电出力的一个倍数,或者取最大输电能力TTC(Total Transfer Capability)的一个固定百分比。此类计算方法并不能很好地反映系统变化对CBM的影响,特别是风电并网后,该方法将难以应对风电波动性的影响。文献[14]按照与各区域缺电时间期望LOLE(Loss Of Load Expectation)指标大小成反比的方法进行输电断面CBM分配,此类方法虽然步骤简单且计算速度快,但未考虑系统运行的经济性,只是简单地按照LOLE指标对CBM进行分配。文献[10]采用概率性方法对CBM进行计算,并以各输电断面CBM之和最小为目标对各输电断面CBM进行经济分配,此类方法可使系统的ATC值最大化,但并未考虑系统留取CBM的成本问题和系统运行经济性。
因此,本文首先针对大规模风电并网对系统运行可靠性的影响,引入可表征系统运行可靠性的LOLE指标[15],通过计算系统发电裕度建立其与LOLE指标的对应关系;然后,综合考虑风电场出力随机性、负荷波动、常规机组故障等各种不确定性因素对系统发电裕度的影响,建立各不确定性因素与系统LOLE指标的内在联系。对于区域电网,本文根据系统对可靠性指标的不同要求,根据系统输电断面CBM大小与LOLE指标的对应关系,建立CBM计算模型;对于多区域电网,以区域电网CBM计算模型为基础,构建以经济性为目标、满足可靠性约束的送电区域各机组发电裕度分配及多区域电网各输电断面CBM留取的数学模型,力求在保证风电并网后系统运行可靠性的基础上,提升系统运行的经济性;最后,以IEEE 30节点和IEEE 118节点系统为例进行分析验证。
1 区域电网CBM模型及计算
大规模风电并网后,风电出力的波动性和随机性增加了系统运行的不确定性。根据CBM的物理意义,其为从互联区域输入电能提供了必要条件,当系统运行可靠性降低时,能够通过输电断面预留的CBM从其互联电网输入电能,从而改善系统运行的可靠性。因此,电力系统输电断面CBM的大小与系统要求的可靠性水平相关。本文基于系统对可靠性指标的不同要求建立区域电网CBM计算模型以保障系统运行的可靠性。
1.1 区域电网发电裕度建模
风电所特有的电源特性成为影响系统运行可靠性的关键因素。本文利用蒙特卡洛模拟法模拟风电场的随机因素,考虑风电场风速的随机性,并根据风力发电机组的输出功率曲线进行风电机组出力预测,计算风电场各时段综合输出功率。
根据系统发电量与负荷的关系,确定系统的发电裕度M,即系统的总发电量超出系统负荷的部分。借助M表征该区域的发电量是否足够支撑其负荷,当系统发电量不足时,通过输电断面上所留取的CBM,使得该区域可以从与其互联的送电区域输入电能,以满足系统可靠性要求。
根据系统中常规机组出力模型(C)和风电机组出力模型(W),求出系统的总出力G=W+C。由于G、W、C均为离散的随机变量,故可利用卷积公式求取G的概率质量函数:
其中,PG(W+C=z)为G数组的概率质量函数;k为自变量;PW(W=z-k)为W=z-k时的概率;PC(C=k)为C=k时的概率。
考虑系统中负荷的波动性,设负荷模型为L,则系统的发电裕度为M=G-L。系统的总出力与总负荷是相互独立的随机变量,所以仍然利用卷积公式求取M的概率质量函数:
其中,设G-L=z,PM(G-L=z)为M数组的概率质量函数;k为自变量;PG(G=z+k)为G=z+k时的概率;PL(L=k)为L=k时的概率。
求取M的概率质量函数时,以式(2)为目标,综合考虑系统的有功平衡约束:
机组容量约束:
机组爬坡率约束:
其中,N为常规机组台数;S为风电机组台数;L为负荷预测值;表示风电机组总出力值;表示常规机组总出力值,pi(t)为第i台常规机组的出力;pimin和pimax分别为机组i的最小和最大出力限值;RDamp,i和RUamp,i分别为机组i的有功出力下降速率和上升速率,单位为MW/min。
1.2 区域电网CBM计算
对某一确定的区域电网,当风电并网运行后,根据上述模型,可求取风电场出力模型W、常规机组出力模型C及负荷模型L。由式(1)、(2)以及约束条件式(3)—(5),可求得M的概率质量函数并绘制M的概率分布函数曲线,如图1中实曲线所示。LOLE指标是指某个时段系统容量小于日最高负荷天数的期望值[16]。对M的负值区域的概率进行累积分布处理,可求出此时M与LOLE的对应关系。当系统对LOLE指标要求不同时,M的概率分布发生变化,进而输电断面留取的CBM相应变化。经过计算,得到当LOLE为α时,CBM为0。若系统对可靠性要求提高,LOLE为β且α>β时,M的概率分布发生变化,如图1中虚曲线所示,进而经过计算得到输电断面留取φMW CBM,当系统为受电区域时便可以从其互联的送电区域输入不超过φMW的电能,弥补系统发电量不足,供给负荷。
因此,根据不同系统对于LOLE指标的不同要求,可求出该时段输电断面需要为本区域留取的CBM的大小。根据LOLE与CBM之间的对应关系,可绘制其关系曲线,以CBM取值为横坐标,LOLE大小为纵坐标,如图2所示,以便在之后的实用计算中应用该曲线根据系统对可靠性指标的不同要求求取对应的CBM的大小。若系统要求的可靠性指标LOLE为θh/a,则通过该曲线中所标注的点可以求出,此时CBM为γMW。即为满足系统可靠性要求,该时段系统输电断面需要为其留取的CBM大小为γMW。
2 多区域电网CBM求取模型
当互联电网存在多个区域电网时(以区域A、B、C 3区电网为例),如果区域B、C同时为送电区域、区域A为受电区域,区域B、C至区域A的输电断面留取的CBM可分别记为CB A和CC A,指为满足受电区域可靠性指标,B或C送电区域单独作用时输电断面为受电区域留取的CBM,由前文方法可分别计算得到B、C两区域至A区输电断面留取的CBM之和,即CB A+CC A。该代数和已超过区域A的实际需求,造成一定程度的经济浪费。故本文综合考虑B、C送电区域协同向受电区域A输送电能,提高受电区域可靠性并减少电能浪费。此时系统输电断面中留取CBM的大小等于送电区域各机组为受电区域预留发电裕度的总和。因此,以送电区域各机组发电裕度获取经济性最佳为目标得到各时段送电区域各机组为受电区域预留发电裕度的大小,进而求得各送电区域至受电区域输电断面上CBM的大小,使系统运行可靠性得到保障且经济性提高。
2.1 目标函数
以所有送电区域各机组为受电区域所留取发电裕度获取总成本最小为多区域电网各输电断面CBM模型的目标函数:
其中,n为可调度的机组总数;qi为机组i为受电区域预留的发电量,即通过输电断面上的CBM向受电区域传输功率的大小;Fi(qi)为机组i所预留发电裕度成本,以二次函数表示为Fi(qi)=aiqi2+biqi+ci,其中,ai、bi、ci为给定常数。
2.2 约束条件
首先,各机组出力要在其可行范围内;其次,受电区域可靠性未达到系统要求时,送电区域应在满足其自身可靠性要求的基础上,通过输电断面CBM将各机组留取的发电裕度输送至受电区域,以弥补受电区域可靠性的不足,故约束条件如下:
其中,Pi为机组i的最大技术出力;pi为机组i现有的有功出力;CA为此时段受电区域A的发电不足量,为满足系统可靠性要求所需从互联区域输入功率的大小,即输电断面需要为区域A留取CBM的大小;b、c分别为此时段区域B、C机组中未满发的机组数量;CB、CC为此时段送电区域B、C中各机组发电裕度大小的总和,即在满足自身系统可靠性约束后可以通过输电断面中留取的CBM向区域A输送电能的大小。
约束条件中,式(7)表示送电区域机组提供的通过输电断面中的CBM向受电区域传输的功率的大小在其可行范围内,即在保证其所在区域安排的发电量后可以提供的有功功率的范围;式(8)表示送电区域向受电区域输送一部分功率后能够使受电区域满足可靠性要求;式(9)、(10)表示送电区域通过输电断面中CBM为受电区域输送功率后,其自身运行仍然满足可靠性水平要求。
3 模型的求解
遗传算法GA(Genetic Algorithm)模拟物竞天择的生物进化过程,包括遗传、突变、自然选择以及杂交等。该方法已被引入广泛的工程问题中,进而快速发展成一种“自适应启发式概率性迭代式全局搜索算法”。采用GA求解多区域电网送电区域各机组发电裕度经济分配模型流程如图3所示。
4 算例分析
4.1 IEEE 30节点系统算例分析
首先以IEEE 30节点3区系统为例进行分析,该系统常规机组装机容量为435 MW,区域A、B、C的节点16、3、28各加入10 MW的风电场(考虑到风电的波动性,本算例选取风电在电网中的贡献率不超过10%),系统结构如图4所示。
采用蒙特卡洛抽样24 h风电场出力模型W、常规机组出力模型C及负荷模型L,取LOLE<1d/10 a(或LOLE<2.4 h/a),即10 a中负荷超过最大发电容量的时间累计最多不超过1 d。由式(1)和(2)及CBM-LOLE曲线分别计算各时段输电断面CBM值如图5所示,CBM大于0代表系统满足可靠性要求,各机组可通过输电断面上的CBM向外界提供电能;CBM小于0代表系统可靠性未满足要求,需在输电断面为其预留CBM从互联电网输入电能。
区域A、B、C的10 MW风电场出力预测、常规机组出力及负荷预测数据分别如图6、7、8所示。同样采用本文所建区域电网CBM计算模型,根据区域A、B、C的出力及负荷情况计算各时段各区域输电断面上的CBM,计算结果如图9所示。由图9可见,区域A发电量不足,可靠性不满足要求,需要输电断面为其预留CBM从互联电网输入电能;而区域B、C可靠性满足要求,各机组可通过输电断面上的CBM向外界提供电能。限于篇幅,以第13个时段为例进行分析:该时段,由于受电区域A系统可靠性未满足要求,需从外界输入37.2 MW功率,因此输电断面共需要为其留取CBM 37.2 MW;送电区域B和C中各机组可分别通过输电断面向互联区域输送的功率总和分别为81.9789 MW和13.3401 MW。
采用本文送电区域各机组发电裕度经济分配模型,可将遗传算法种群大小设为Nsize=100,迭代终止次数为200。根据各区域该时段发电情况及输电断面CBM值,计算可得到第13个时段系统送电区域各机组为受电区域预留发电裕度分配情况如表1所示。
各送电区域发电机组为受电区域预留发电裕度的总和即为该送电区域至受电区域输电断面留取CBM的大小,则各送电区域至受电区域输电断面CBM优化结果见表2,算法收敛过程见图10。
若采用传统的确定性CBM留取方法,即简单地将输电断面的CBM直接留取为一个确定的值,则本系统输电断面共需留取CBM为最大发电单元出力40 MW,且传统方法直接按照与区域B、C LOLE指标大小成反比的方法对CBM进行分配。将本文概率性方法与传统确定性方法进行比较,结果如表3所示。由计算结果可见,传统方法是将CBM直接取为一个较大值,来保证系统运行可靠性,但无法保证经济性;而本文所构建模型是在满足系统要求的可靠性水平的基础上将CBM取为一个较小的值,且经济性较好,更为合理。
4.2 IEEE 118节点系统算例分析
IEEE 118节点系统可划分为3个区域[17]。该系统总装机容量为5790 MW。假设在系统中新增500MW风电,平均分配在A、B、C 3个区域的节点39、67和102。采用区域电网输电断面留取CBM模型,可以求得当LOLE为2.4 h/a时,该118节点系统各时段输电断面共为其留取CBM的大小,计算结果见图11。
同样,可求得A、B、C 3区域各时段输电断面留取CBM的情况。以第16个时段为例,此时区域A可靠性未满足要求,为受电区域,需要输电断面留取201.171 4 MW的CBM。区域B和C可靠性已满足要求,为送电区域,各机组可分别通过输电断面上的CBM向外界输送功率112 MW和534.826 5 MW。由送电区域各机组发电裕度经济分配模型计算得,此时段该系统区域B、C各机组通过输电断面为区域A预留发电裕度经济分配结果如表4所示。进而可分别求得由区域B、C至区域A输电断面上CBM的优化结果如表5所示。图12为经济优化计算目标函数迭代300次的收敛过程。
若采用传统方法对IEEE 118节点3区系统进行CBM计算,可以得到此时输电断面为区域A共留取CBM为450 MW,明显多于本文方法所求得的201.171 4 MW,故其所需经济成本必然高于本文方法的,对比结果如表6所示。
由分析可见,本文所构建模型既保证了各时段系统运行的可靠性水平,又避免了资源浪费,实现了系统运行的经济性。因此,在电力系统区域间ATC的评估与决策中,采用基于可靠性指标并兼顾系统运行经济性的CBM模型是合理和有效的。
5 结论
本文提出了基于可靠性指标的CBM概率性计算模型,并对互联系统提出了以送电区域各机组预留发电裕度获取经济性最佳为目标的CBM分配模型。本文方法具有以下特点。
a.不再按照传统的确定性方法将输电断面留取的CBM取为一个固定值,而是采用概率性方法进行CBM计算,根据系统发电裕度M,并引入LOLE指标,不同系统对于可靠性水平的要求不同时,其取值不同,通常系统所要求的LOLE取值为2.4 h/a。充分考虑风电的波动性,通过绘制CBM-LOLE曲线并结合系统的可靠性要求,求取CBM的值。采用该方法计算后,输电断面留取CBM的大小有所降低,但仍然满足系统运行可靠性要求,使得CBM的留取更加科学、可靠,CBM的合适取值减少了电力系统失负荷的概率,使发布的ATC的值更加可靠,为系统创造了效益。
大规模计算 第7篇
1云计算简介
云计算 (Cloud Computing) 是分布式处理 (Distributed Computing) 、并行处理 (Parallel Computing) 和网格计算 (Grid Computing) 的发展, 或者说是这些计算机科学概念的商业实现。云计算是虚拟化 (Virtualization) 、公用计算 (Utility Computing) 、Iaa S (基础设施即服务) 、Paa S (平台即服务) 、Saa S (软件即服务) 等概念混合演进并跃升的结果。云计算的基本原理是, 通过使计算分布在大量的分布式计算机上, 而非本地计算机或远程服务器中, 企业数据中心的运行将更与互联网相似。这使得企业能够将资源切换到需要的应用上, 根据需求访问计算机和存储系统[2]。
2云计算环境下大规模图数据处理技术
图是一种典型的非线性数据结构, 具备一定多对多关系, 它也是一种复杂的数据结构。数据元素间的关系是任意的。其他数据结构 (如树、线性表等) 都有明确的条件限制, 而图形结构中任意两个数据元素间均可相关联。常用来研究生产流程、施工计划、各种网络建设等问题。因为大规模的图具备的数据量非常繁多, 所以, 分析及其研究对大规模的图的数据处理技术逐渐成为人们广泛关注的重点。通过深入的研究以及分析, 已经具备有一定层次水平的图形图像处理技术, 对相关技术理论进行日益完善, 为处理大规模的图形技术提供基础及其保障, 但是因为信息技术的飞跃发展, 促使各式各样的信息发展较快, 导致图数据处理的规模越来越大, 因此, 加强对大规模图数据处理技术的研究力度, 为了能高效处理大规模的图数据提供良好的平台[3]。从以下几个方面进行深入分析:
2.1云计算环境下存储图数据的方式
在充分研究和分析大量资料和文献之后得到, 目前, 在应用以及管理大规模图数据处理技术的时候, 其中主要包括超图数据模型、单图数据模型两种常用数据模型, 上述两种数据模型都可以在一定程度上对无向图和有向图进行相应处理, 但是两种方式最根本区别就是不同的存储格式。大规模体数据进行存储的时候, 最基本的就是云计算分布式存储系统, 可以把云计算分布系统分为分布式数据库以及分布式文件系统两种形式。分布式文件系统中最重要就是HDFS和GFS, 能够直接存放临接矩阵和对接表;分布式数据库, 也就是说No SQL, 其中最重要的就是Hbase和Big Tabl。分布式数据库可以分为以下将基本数据模型:主要包括KV存储模型、CFS列族存储模型、DS文档存储模型。DS模型具备方便、灵活的优势, 比较适合使用存储结构化数据, 此模型不适合对图数据进行存储。经过大量数据分析研究表明, KV存储模型十分适合存储大规模图数据, KV存储模型存在支持哈量存储、高并发查询以及模式结构简单的特点, 在处理Page Rank等图数据的时候, 一般情况不会出现复杂操作, 能够符合数据处理的基本需求, 如果是利用邻接表的方式形成图数据, Key就是图的源顶点, Value就是出边信息和点的值, 可以更加方便的迁移和合并数据, 增加空间局部性, 大幅度降低处理查询过程中读取数据的次数, 可以在一定程度上提高效率。
2.2云计算环境下分割图数据
一般来说, 云计算环境中处理大规模图数据, 处理方式应该是分布式并行, 因为图计算存在一定强耦合性、图数据具备连通性, 为了能够更加高效的处理图数据, 应该适当降低子图数据之间耦合度, 图分割是有效实现目标的主要方式。基本流程是:首先需要分给具备相对比较完整逻辑结构的大图, 然后在分布存储系统节点中分别放置分割部分, 进行适当处理, 并且每个子图启动以后都需要能够具备与之对应的计算服务, 在处理完子图以后, 就达到处理大图的目的。在上述处理过程总, 分割大图以后, 能够得到相对比较好的分割效果, 但是在对大图进行分割的时候, 需要重合分析图规模均衡性以及内部连通性, 保证能够降低子图连通性, 增加内部连通性, 可以在一定程度上影响分布并行处理大数据机制的运行。此外, 也应该降低子图规模均衡性, 不能形成比较大的偏斜, 避免由于过大时间差距影响系统同步性[4]。
2.3云计算环境下的图数据计算模型
现阶段, 基于云计算基础上具备两种应用广泛的模型, 包括BSP模型以及Map Reduce模型。
2.3.1 Map Reduce模型
Map Reduce模型主要包括由多个reduce、map共同形成的并行处理方式, 可以把执行任务阶段分为两部分:一是, Reduce阶段, 在此过程中, Reduce任务会聚集处理接收到的数据, 从而得到相关输出结果, 并且能够在分布式文件中保存数据。二是, Map阶段, 此过程中, Map任务会合理计算分配到系统的数据, 输出与之对应的key值, 然后在reduce任务中映射出相对应的数据信息。
2.3.2 BSP模型
BSP模型主要就是说在并行执行消息通信的时候, 具备好、数据竞争以及免锁死的运行特点, 在云计算环境下处理大规模图数据需要合理使用上述模型, 在迭代处理的时候, 相比较Map Reduce模型来说, BSP模型具备相对比较高的执行效率。
2.4云计算环境下处理查询图数据
基于云计算基础上, 主要存在两种能够支持处理查询大规模图数据的驱动模式, 也就是被动遍历模式和主动遍历模式。上述两种模式具存在图顶点是操作对象的共同特点, 也就是说操作处理技术的基本关键就是图顶点。第一, 被动模式。上述处理模式能够不进行调用处理函数, 可以适当降低处理不必要顶点, 大量节约资源。第二, 主动遍历模式。上述处理模式, 具备比较强实用性, 但是应用在特定情况下, 会形成浪费资源的问题。
3结束语
总之, 依据云计算为基础, 充分分析和研究大规模图数据处理技术, 可以发现, 在处理大规模图数据中应用云计算技术, 能够有效提高处理效率。
摘要:本文着手于大规模图数据处理技术在云计算环境下的应用优势, 通过对大规模图数据处理技术的实践应用情况进行分析, 结合云计算环境心爱的大规模图数据处理问题情况进行研究, 总结出大规模图数据处理技术在云计算环境下的关键性技术实施情况, 为我国今后的大规模图数据处理技术创新提供可行性参考。
关键词:云计算环境,大规模图数据,处理技术
参考文献
[1]于戈, 谷峪, 鲍玉斌, 等.云计算环境下的大规模图数据处理技术[J].计算机学报, 2011, 34 (10) :1753-1767.
[2]李健, 黄庆佳, 刘一阳, 等.云计算环境下基于粒子群优化的大规模图处理任务调度算法[C]//2012年第三届中国计算机学会服务计算学术会议论文集, 2012:1-8.
[3]赵小换.云计算环境下的大规模图数据处理技术分析[J].中国外资 (下半月) , 2012 (5) :275.
大规模计算 第8篇
关键词:电力系统,双边Jacobi-Davidson,关键模态,小干扰稳定分析,特征值计算
0 引言
电力系统小干扰稳定性分析建立在对线性化系统状态矩阵特征分析的基础上。现代大规模电力系统状态矩阵的阶数往往有几千阶甚至上万阶,虽然计算特征值的QR方法鲁棒性强,但由于受到内存限制以及计算时长而不再适用[1,2]。
小干扰稳定性分析,特别是机电振荡分析,实际上仅需要求出实部最大或阻尼比最小的部分特征值(关键特征子集)及相应的左右特征向量。近年来,已提出了很多计算关键特征子集的方法并得到了应用。AESOPS (analysis of essentially spontaneous oscillations in power systems) 方法根据频率响应原理计算指定发电机参与程度较大的模态[3,4]。降阶选择模态分析法[5]通过迭代计算低阶次矩阵的特征值逼近原系统的特征根,但可能漏掉一些关键特征值。
Arnoldi方法和Jacobi-Davidson(JD)方法也被应用到特征子集的计算中。文献[6]通过对原系统进行谱变换,并用Arnoldi方法计算变换后系统按模值递减的特征值,同时反变换以求得原系统的关键特征值。文献[7,8]将Chebyshev多项式加速技术用于Arnoldi方法,直接计算系统最右端的特征子集。然而Arnoldi方法的收敛效率受谱变换的影响较大,且谱变换的初值在计算之前难以选择。JD方法通过求解小规模投影矩阵的特征值来逼近原系统的特征值,将该方法应用到电力系统的关键特征值计算取得了很好的效果[9,10]。JD方法直接求取矩阵的Schur向量,在进行特征值分析时要重新计算左右特征向量。文献[11]中使用实JD方法计算电力系统的特征值,以避免计算过程中的复数运算。文献[12]首先对状态矩阵进行预处理,然后使用不精确的双边Jacobi-Davidson(TSJD)方法求解其关键特征值,用于减少矩阵的分解次数,但会对收敛性造成一些影响。
积分降阶算法[13]使用状态矩阵指数追迹随时间变化的规律来提取矩阵的最右端特征值。在求解矩阵指数时,为了得到足够的精度,该方法通过精细积分方法[14]计算矩阵指数,由于需要计算大量的满阵乘法而影响其计算速度。
使用TSJD方法[15]可以在计算特征值的同时得到相应的左右特征向量,从而可以直接进行电力系统的模态分析。JD方法可以看成是加速的Rayleigh商迭代(RQI),对非正规矩阵具有局部的二次收敛性,而TSJD方法则类似于广义RQI,有局部的立方收敛性。该方法通过左右搜索空间将状态矩阵投影到低阶矩阵,用低阶矩阵的广义特征值逼近原系统的特征值,并通过广义特征向量和左右搜索空间来求解左右特征向量。TSJD方法采用搜索空间的正交向量扩展空间,因而具有灵活的特征值选择策略、特殊的收缩策略和重启动方法。
本文将TSJD方法用于大规模电力系统的机电振荡分析,求取状态矩阵的阻尼比最小的关键特征值及左右特征向量。
1 小干扰稳定性分析的数学模型
电力系统小干扰稳定性分析的数学模型可以用线性化后的微分代数方程组描述:
式中:z∈Rn为状态向量;w∈Rm为运行参数向量;
在式(1)中消去w,得
式中:
式(2)中的A阵因失去稀疏性而不利于进行关键特征值计算,本文使用稀疏增广矩阵来计算A的特征值[16],但为描述方便,算法中仍使用A描述。式(1)等号右侧的方阵称为增广状态矩阵。
2 JD方法简介
JD方法[17]由2部分组成。
1)Rayleigh-Ritz逼近。
在k(k≪n)维搜索空间u求取A近似特征对(θ,u),其中θ=(u*Au)/(u*u)为近似特征值;u为对应θ的近似特征向量;上标“*”表示矩阵或向量的共轭转置。假设U构成了u的一组标准正交基,(θ,c)为投影矩阵U*AU的特征对,则u=Uc。
2)扩展搜索空间。
当存在(λ,x)的近似特征对(θ,u),JD方法寻求一个修正向量s,其满足(I-uu*)(A-θI)s=-(A-θI)u且s⊥u,来扩展搜索空间u。
3 TSJD方法
JD方法可以认为是加速的RQI,对于正规矩阵具有局部的立方收敛性。对于非正规矩阵,RQI局部二次收敛。而广义RQI具有局部的立方收敛性[18]。TSJD方法则是对广义RQI加速,并且同时得到左、右特征向量。
3.1 TSJD方法计算原理
1)求取特征值和左、右特征向量。
TSJD方法用u和v分别作为右、左特征向量的搜索空间,u∈u与v∈v作为右、左特征向量的近似,利用下式得到近似的特征值:
式(3)隐含下式成立:
令u=Uc,v=Vd,其中U和V的列分别构成了u和v的一组标准正交基,c和d都为k维向量,则得到:
于是c和d为广义特征系统(V*AU,V*U)对应于广义特征值θ的右、左特征向量。
2)搜索空间的扩展。
如果得到特征值和左、右特征向量(λ,y,x)的近似值(θ,v,u),采用TSJD方法寻找修正量s⊥u和t⊥v扩展右、左搜索空间:
式中:α=(u*(A-θI)-1u)-1;
3) 收敛判断准则。
在每次迭代中,都要进行一次特征值的收敛判断。TSJD方法按特征值的定义进行收敛校验:如果(θ,u,v)为矩阵A的特征值和左右特征向量,则(θ,u,v)满足‖(A-θI)u‖ε或
4)特征值的选择和重启动策略。
设搜索子空间的维数为l,若要求取阻尼比最小的特征值,则l个近似特征对按照阻尼比递增的顺序排序如下:
ξ1<ξ2<ξ3<<ξi<<ξl (7)
式中:ξi为第i个特征值的阻尼比。
TSJD方法选择阻尼比最小的特征对进行迭代。如果子空间的维数到达设定上限kmax时,为了减少计算时间和内存,需要进行重启动,降低子空间的维数到kmin。TSJD方法使用
5)收缩。
如果TSJD方法收敛到p个特征值和右、左特征向量(λi,xi,yi),i=1,2,,p,而需要求解下一个时,可以使用收缩办法以避免收敛到相同的特征值,即如果收敛到的特征向量是精确的,那么
与A有相同的特征值和特征向量,而收敛到的特征值被映射到0,其中xi和yi分别为右、左特征向量。
6) 方程的求解。
在求解式(6)时,由于(A-θI)与
3.2 提高计算效率的措施
如果TSJD方法收敛到一个特征值后,则需要重新进行下一个特征值的计算,可以先进行下一个特征值的选择,然后在下一个特征值不够精确时再进行子空间的扩展。
在特征值计算过程中,第i次迭代只需要计算矩阵第i行和第i列即可,不必每次都进行全矩阵相乘。
重启动不一定是必需的,对于第4节给出的算例,在给定子空间维数的情况下都没有进行重启动。但如果子空间维数过高,则影响计算效率,适当给出子空间的最大维数是需要的。
TSJD算法具体实现过程见附录A。
4 算例及分析
4.1 算例结果
用TSJD算法对实际某173机系统和1 077机系统进行了关键模态的求取。将所求出的关键特征值与QR方法和Arnoldi方法求得的特征值进行了比较,以说明本文所提方法的正确性。以下的计算都是在双核2.9 GHz CPU台式机上进行的,收敛条件取ε=10-5。
173机系统包含3 584条母线,5 056条支路,3 469个负荷节点,以及8条直流输电线路和8个柔性交流输电系统(FACTS)元件。该系统的状态变量个数为2 940,增广矩阵维数为20 383。
图1为使用TSJD方法求取阻尼比最小的20个模态的结果,同时给出了QR方法求解的特征值。从图1可见,TSJD方法所求取的特征值是精确的。
TSJD方法收敛到该系统5个重复的特征值1.01±8.08i。使用TSJD方法计算20个阻尼比最小的特征值和左、右特征向量总共花费61.4 s,而QR方法则需要87.6 s才能收敛到特征值,且需要另外的60 s求解右特征向量。
1 077机系统包含14 987条母线,9 621条支路,2 717个负荷节点,以及11条直流输电线路。该系统的状态变量个数为29 548,增广矩阵维数为93 492。
QR方法由于受到内存的影响,目前最多可以求解大约1万阶的矩阵,因此难以计算如此大规模的系统。以下使用TSJD方法计算系统的最右端特征值,通过69次LU分解,按照排序策略(式(7)),TSJD方法经过322 s收敛到20个特征对,其中有11个重复的特征值,计算结果如图2所示。图2同时列出了在已知谱分布的情况下,采用隐式重启Arnoldi和凯莱变换方法计算得到系统的最右25个特征值。
虽然使用隐式重启Arnoldi方法配合凯莱变换可以有效求取系统的关键特征值,但由于谱分布在计算前未知,因此难以选择凯莱变换初值。而JD类方法最大的优越性是其具有灵活的特征值选择策略。如要求取阻尼比靠近ξw的特征值时,则可以使用排序策略:
‖ξ1-ξw‖<‖ξ2-ξw‖<<‖ξl-ξw‖ (9)
图3为使用TSJD方法求解虚轴附近(ξw=0)的特征值的结果。经过68次LU分解,TSJD方法经过318 s收敛到20个虚轴附近的特征值。图3同时给出了多次使用Arnoldi方法配合位移逆计算虚轴附近特征值的计算结果,易见TSJD方法是方便而精确的。
4.2 QR,Arnoldi以及TSJD方法比较
文中分别给出了使用QR,Arnoldi及TSJD方法计算电力系统特征值的结果,在计算准确性上,TSJD与QR和Arnoldi方法是一致的。
从求解规模上,QR方法由于受到内存的限制,目前其最大计算规模约为1万阶左右矩阵。而对于1 077机系统,Arnoldi方法和TSJD方法可以快速求解约3万阶的矩阵。
从对状态矩阵的预处理来看,JD类方法不需要预处理,并具有灵活的特征值选择策略。Arnoldi方法求解关键特征值时一般需要配合预处理,而由于全系统的谱在计算之前未知,使得合理选择预处理初值较为困难,从而导致Arnoldi方法遗漏关键特征值。
在计算时间上,Arnoldi方法配合位移逆或凯莱变换,在1次计算过程中仅需要1次的矩阵LU分解,而JD类方法因为要作多次位移,从而在收敛到相同个数的特征值时,其计算时长上相对于预处理合理的Arnoldi方法要多。然而在使用Arnoldi方法求解关键特征值时,对于1 077机系统,一般需要多次使用预处理,因此总体两者用时相当。Arnoldi方法和JD类方法在计算时长上都较全特征值求解的QR方法要少,且矩阵规模越大越明显。
5 结语
本文将TSJD方法应用于大规模电力系统的关键模态求取,详细介绍了TSJD方法的基础理论以及算法实现。
通过大规模系统算例说明,TSJD方法能快速计算状态矩阵的关键特征值并同左右特征向量。该方法可以定义特征值的收敛顺序。通过与Arnoldi和QR方法进行比较,说明该方法是有效和可靠的。
附录见本刊网络版(http://aeps.sgepri.sgcc.com.cn/aeps/ch/index.aspx)。
大规模计算 第9篇
大规模开放式在线课程 (Massive Open Online Course, MOOC) , 又称为慕课, 是一种面向大众人群的基于英特网的在线课程。大规模开放式在线课程由加拿大爱德华王子大学的Dave Cormier和国家人文教育技术应用研究院的Bryan Alexander根据网络课程教学实践在2008年首次提出[1]。2012年慕课在全球范围内迅速升温, 因此, 2012年被称为大规模开放式在线课程元年。大规模开放式在线课程最显著的特征是其所有的课程内容都是开放的, 在线的, 其主要特征有大规模、开放以及在线。大规模是指学生参与人数多、参与高校众多以及提供课程丰富。大规模开放式在线课程的开放主要体现在课程学习者、教学内容以及教学形式等方面。大规模开放式在线课程是以学生为中心, 所有学生都可以参与慕课学习;教学内容的开放性是指向学生免费提供所需的学习内容, 包括课件、参考资料等等;教学形式的开放性是指学生全程参与老师教学的各个环节, 包括在线答疑、课后作业、作业批改等。在线是指慕课突破了传统课堂学习时间和地点的局限性。任何具备上网条件的人都可以在任何时间、任何地点参与慕课的学习。这些特征使得慕课具有传统课堂学习所没有的优势。
当前, 有三大在线开放课程学习平台, 分别是Coursera、Udacity和Edx[2]。Coursera是由Daphne Koller和Andrew Ng在2011年共同创办, Coursera旨在与全球一流大学和机构合作, 致力于普及全世界最好的教育, 向所有人提供免费的在线课程。截止2015年8月, 已有超过120所大学和机构加入Coursera, 提供超过25个课程类别, 包括计算机科学:人工智能、计算机科学:理论、计算机科学:系统与安全、以及计算机科学:软件工程等等。已有超过500万人在Coursera上注册学习。Coursera可提供结课证书和部分转学分计划。Udacity是由Sebastian Thrun、David Stavens、以及Mike Sokolsky在2012年共同创办, Udacity致力于大学对其课程以及学分的认可。目前, Udacity可提供包括计算机科学在内的多个专业课程内容。Edx是由麻省理工学院和哈佛大学于2012年4月联手创建的大规模开放在线课程平台, 并免费向大众提供大学教育水平的在线课堂。截止2015年8月, 已有41所大学加入Edx开放课程计划, 包括北京大学、清华大学、麻省理工学院、哈佛大学等国内外一流大学, 提供包括计算机科学课程在内的593个专业课堂。在Edx上学习并通过课程考核后可免费获得结课证书。由此可见, 学生可广泛的从大规模在线开放课程学习平台获取计算机专业相关知识内容, 这给传统的大学计算机专业教育带来了新的挑战和机遇。
二、大规模开放在线课程的优点
大规模在线开放课程的兴起是因为其具有一些传统大学课堂学习所不具有的优点[2]。
第一, 灵活性。大规模开放在线课程的开放性和在线性特点使课程学习变得更加灵活, 由于没有传统大学课堂学习的时间、地点以及修读门槛的限制, 学习者只需在学习平台上注册后, 就可以随时随地的修读自己所需的课程。
第二, 高水平性。参与大规模在线开放课程的授课教师都是著名大学的资深教授, 具有较高的学术水平。
第三, 大规模性。由于没有传统大学课堂学习人数的限制, 大规模开放在线学习平台对参与课程学习的人数没有限制, 并且参与学习的人数越多越能发挥学习平台的作用。
第四, 自主性。由于抛弃传统大学课堂灌输性教学模式, 大规模开放在线课程采取以学生为中心, 自助学习的模式, 授课教师在学习过程中起着启发和引导的作用。
第五, 高效性。大规模开放在线学习过程包括观看教学视频、疑难解答、课后作业以及小组讨论等, 通过这些教学环节使得学生学习更具积极性和深度性, 有效提高了学习者的学习效率。
三、大规模开放在线课程对传统大学计算机教育的影响
(一) 教育模式对传统计算机教育的影响
大规模开放在线课程是以学生为中心, 以学为本的全新教育模式, 其重视激发学生自主学习的积极性。这种教育模式对传统大学计算机教育以灌输式传输知识的教育理念、模式、方法带来了巨大的挑战。如果不改革现有的计算机教育理念、模式和方法, 大学计算机教育课堂将沦为实验室和考场。
(二) 对教育师资的影响
大规模开放在线课程也给大学计算机教师提出了更高的要求。如果教师在课堂的讲授的知识, 学生已在大规模开放在线课程平台上学习过了, 那么学生是否还有必要参加传统的课堂学习呢?此外, 参与大规模在线开放课程的计算机专业授课教师都是著名大学的资深教授, 具有较高的学术造诣, 而现有的传统课堂计算机教师水平层次不齐, 从而导致学生更愿意从大规模开放在线课程平台上获取所需的知识。
(三) 对学生的影响
大规模开放在线课程提供大量名师名课, 学生可自由选择自己所需的知识, 不论时间和地点, 并且可多次反复观看教学视频, 达到深刻理解知识点。对于在传统大学计算机教育课堂未能掌握的知识点, 学生可通过大规模开放在线课程平台寻求解答。此外, 大规模开放在线课程平台修读学分的费用相对于传统大规模开放在线课程平台来说, 费用相对低廉, 更容易被学生所接受。
四、大规模开放在线课程对传统大学计算机教育的启示
大规模开放在线课程的流行与其自身所拥有的优越性是分不开的, 因此, 借鉴大规模开放在线课程的优点, 可以构建全新的大学计算机教育课程, 促进传统大学计算机教育的发展。
(一) 大规模开放在线课程与传统计算机课堂学习相结合
大规模开放在线课程与传统计算机课程学习线上线下相结合, 鼓励学生在大规模开放在线课程平台上学习一些先修知识或者进行课程预习, 然后在传统课堂上学生与老师就相关知识点进行深入探讨。这些一群具有创新精神的学生和教师通过课堂互动, 方可促进学生的学习兴趣和对所学知识的理解与掌握。
(二) 优质教学资源共享
大规模开放在线课程平台上的计算机类课程都是由著名高校的资深教授讲授, 鼓励学生参与大规模在线课程学习, 实现优质教学资源共享。此外, 可试点转学分计划。学生在大规模开放在线课程平台考试通过所选课程, 拿到结课证书后, 对其学分进行认证, 从而增加学生的学习积极性。
(三) 转变传统计算机教育模式, 适应科技发展
转变传统计算机教育以教师为中心模式, 以学生为中心, 构建新型的课堂教学模式。借鉴大规模开放在线课程平台的运作流程, 注重学生对授课知识讨论学习过程, 运用现有web2.0技术构建学生课业讨论区, 增加课程教学的互动性。
五、结论
大规模开放在线课程是近几年在全球兴起的一种全新的教育形式, 它的快速发展对传统大学计算机教育带来了巨大的影响。本文分析了大规模开放在线课程发展的历程, 及其优越性, 并且分析了大规模开放在线课程对传统计算机课程教育的影响。最后给出了相应的应对策略。
参考文献
[1]王颖, 张金磊, 张宝辉.大规模网络开放课程 (MOOC) 典型项目特征分析及启示[J].远程教育杂志, 2013 (4) :67-75.
[2]杨九民, 郭晓梅, 严莉.MOOC对我国高校精品开放课程建设的启示, 电化教育研究[J].2013 (12) :44-49.
[3]王颖, 张金磊, 张宝辉.大规模网络开放课程 (MOOC) 典型项目特征分析及启示, 远程教育[J].2013 (4) :67-75.
大规模计算范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。


