进化稳定策略范文
进化稳定策略范文(精选7篇)
进化稳定策略 第1篇
1 进化稳定策略的概念
进化稳定策略指种群的大部分成员所采取某种行为方式, 这种方式的能很好地适应环境, 这是其他行为方式所不及。不同种群或者相同群体的不同个体在同一个生存环境中竞争同一种生存资源时, 竞争的结果只有那些获得较高适应度的种群或者个体生存下来, 那些得到较低收益的种群或者个体在竞争中被淘汰 (即优胜劣汰) , 但这些竞争不是杂乱无章的, 而是按一定行为方式进行的。存在一个成员稳定的群落系统中, 突然有一个选择不同行为方式的小群体入侵, 最终而形成一个混合群体, 这个时候入侵小群体就会和大群体相互竞争有限的生存资源, 在这过程中小群体由于有利的自身的条件在竞争中处有利地位, 那么小群体就能在该群落系统中存活并繁殖壮大;反之, 就会在竞争中被大群体淘汰, 那也就意味着该群体达到了一种进化稳定状态。换言之, 在自然环境没有剧烈变化的情况下, 该系统就不会这种稳定状态。
2 鹰鸽博弈模型
鹰鸽博弈可以很好地解释这种现象。在自然界中, 群体之间的不同个体为获得食物、空间、配偶等资源而冲突时, 它们可能采取“鹰”和“鸽”两种行为策略。“鹰”策略指在竞争或者战斗中全力以赴, 绝不退却, 除非对手失败逃走或自己负伤, 无力再战。“鸽”策略指在竞争或者战斗中, 不主动出击, 只是耐心等待对手主动退却, 或在对手发动攻击, 自己未被受伤前逃走。鹰鹰相遇进行殊死搏斗直到一方获胜得到资源, 而另一方受伤或者败逃为止。鸽鹰相遇时, 鹰胜鸽败。鸽鸽相遇则双方都不会受到丝毫损伤, 且一方获胜取得资源。为了更清楚的阐明鹰鸽博弈模型, 假设任何一方获胜的收益均为A, 而战斗中严重受伤所付出的代价为B。因此, 当“鹰”攻击“鹰”的情况时, 若每只鹰都有相等的获胜机会。则它们的平均收益为 (A-B) /2;当“鹰”攻击“鸽”时, 有两种情况, 若鸽子成功逃走, 鹰鸽的收益均是0, 否则, 鹰的收益为A, 鸽子付出的代价为B;当“鸽”遇到“鸽”时, 若每只鸽获胜机会相等, 则它们平均收益为A/2。有一小群鸽子不慎的落入了鹰群, 由于它们并不能对大多数鹰的生存资源产生威胁, 故鹰鹰竞争在该群体中仍占主导, 此外, 尽管鸽鹰战斗, 每次鸽子都输, 但它不会受伤。以上两种情况, 尽管鸽子都没有直接获得获益, 但是这却为鸽子繁殖创造了合适的条件, 于是“鸽”的数量在种群中越来越多。反之, 有一个鹰的侵入了鸽群, 鹰会主动攻击鸽, 若鸽子成功逃走, 鹰鸽的收益均是0, 否则, 鹰的收益为A, 鸽子不仅没有获益反而付出的代价B。以上两种情况, 鹰就会在鸽群中大量繁殖壮大, 迫使鸽子为了生存而改变策略。通过计算发现, 在种群中当“鹰”策略和“鸽”策略的比例分别为V/W=1/6和1-V/W=5/6时, “鹰”和“鸽”就会有相同的收益, 此时, “鹰”与“鸽”的数量比例则为1:5, 这个新的稳定的达到了稳定。这也说明了, 一贯采取一种单一的策略在进化上都是不稳定的, 因而导致个体之间的竞争还会持续, 直至一方改变策略, 最终达到稳定策略。
3 进化稳定策略的生物学意义
达尔文的进化论认为自然选择时生物进化的动力。在一个种群中, 对某个体而言, 跟随大多数成员行为方式才是自然选择过程中的最佳策略。在自然环境没有大的变化情况下, 种群中的个别个体它一旦有与大多数个体相异的任何行为方式时, 就会受到具有相同策略的大多数个体的排挤, 最终在竞争中处于劣势而有被淘汰的风险。这可以解释许多常见的生物现象, 比如老虎一般不会把同类作为自己的捕食对象, 因为很可能受到反抗不仅捕获不到食物反而有可能受伤。而选择狼作为捕食对象, 就很容易;相反的, 狼一看见老虎自知会有被捕获的危险, 就会选择逃跑, 而见到其他狼受到攻击的几率较小, 它就不会选择躲避。一群相互从未见过的母鸡放在一起, 通常会导致相互的打斗, 一段时间以后打斗日趋减少, 最后形成稳定的社会等级, 产蛋量增加, 这给群体带来好处;相比之下, 群体成员不断更换会带来更加频繁的打斗, 群体产蛋量就会降低。无论是动物群体还是植物群体都是有个体组成, 它们之间的这种竞争和捕食关系都是为了最大限度地、更多更有效地繁殖自己的后代, 以保证它们在生物进化过程中利于不败之地, 最终不至被淘汰。
进化稳定策略已经被很好地应用在生物种内和种间个体竞争和捕食行为的分析上。然而, 进化稳定策略包含的生物学意义远不止于此, 进化稳定策略的进一步发展, 可以帮助我们能更好的解释生物进化、生物多样性和生态系统的复杂性和稳定性。
参考文献
[1]蓝盛芳.试论达尔文进化论与协同进化[J].生态科学.1995 (2) .
[2]张良桥.论进化稳定策略[J].经济评论.2003 (2) .
[3]张良桥.进化稳定均衡与纳什均衡-兼谈进化博弈理论的发展[J].经济科学.2001 (3) .
[4]饶异.从进化稳定策略看大学生诚信的缺失[J].教育与职业.2008 (5) .
进化稳定策略 第2篇
本文使用混合差分进化算法, 设计单机与无限汇流排系统中的稳定器[5,6,7], 然后再将稳定器扩展使用于多机和复杂网络结构的系统中去。
1 系统模型
图1为单发电机与无限汇流排系统, 包括发电机及动态励磁系统, 发电机使用交、直双轴模型, 其参数如表1所示[8], 为系统状态参数, ΔE'd、ΔE'q为d轴q轴的暂态电压, Δω与Δδ为角速度和角度, ΔEFD为励磁电压, ΔVs为系统内部稳定器输出。利用混合为变数向量的目标函数。此处变数向量=[KST1T2T3T4]为发电机电力系统参数。
图2为静态励磁系统的方框图, 参数如表2所示[8]。励磁系统及发电机方程式在某工作点线性化, 表示如下:
用混合差分进化算法设计稳定器时, 应在一些限制条件下求目标函数最优化, 即:
式 (2) 中, M () 为变数向量X的目标函数。此处变数向量=[KST1T2T3T4]为发电机电力系统参数。
稳定器以发电机速度偏差为输入信号见图3, 其传递函数如下:
若时间常数T5为固定值5 sec, 其余参数KS、T1、T2、T3和T4可调, 结合发电机与励磁系统可得线性方程为:
2 稳定器设计
2.1 稳定器设计原理
为增加系统阻尼, 在发电机输出有效功率为P, 无效功率为Q, 输电线路电抗Xe变化的条件下, 将系统机电模式于指定的复平面内, 定义三种目标函数如下:
式中Ni为P范围内总点数, Nj为Q范围内总点数, Nk为Xe范围内总点数, 相位超前或落后补偿型电力系统稳定器的参数限制为[9]:
若 (7) ~ (9) 中目标函数为零, 结果将使机电模式实部皆位于垂线左边, 阻尼比区域内。设定发电机输出有效功率为P, 无效功率Q及输电线路阻抗Xe取值变化范围如下[8]:
2.2 混合差分进化法稳定器设计流程
混合差分进化法稳定器设计流程见图4。用随机方式取得差异向量产生一次进化中的突变, 扩大搜寻范围, 通过交配产生进化中的下一代, 父子两代经选择环节择其性能优者继续向前进化, 直到目标函数获得最优。这就是差分进化法[10,11,12]。
单纯差分进化法有缺点。遇到多代子不如其父, 目标函数收敛将很慢;又有时会错误地收敛到局部最小解;所以, 图4中增加了迁移及加速环节。为此更名为混合差分进化法, 其详见后[13,14,15]。
(1) 初始化:以随机方式产生Np个族群, 在每一个解中有D个变数, 此变数均匀分布在整个求解空间内, 表示如下:
(2) 突变:利用随机方式得到差异向量以产生一个扰动向量, 扩大搜索范围, 在突变过程中, 第G+1代突变向量为:
其中, F为常数, XGr1X, rGX、1, Gr2XrG2为随机产生的两个向量。
(3) 交配:交配过程是第G代向量与第G+1代突变向量交换、混合成为G+1实验向量, 表达式如下:
(4) 选择:如果下一代更好, 则替换低G代, 相反则保留第G代。首先做竞争, 然后选择最佳个体XbG+1:
将以上步骤反复进行, 直到有合适结果为止。针对差分进化法缺点, 采用混合差分进化法进行改善, 并将演算步骤代入迁移及加速过程, 提高收敛速度及克服局部最小解[13,14,15]。
(5) 必要时迁移程序:迁移选择是基于XbG+1, 变数Xi的第j次为:
(6) 必要时加速程序:在差分进化求解中, 当下一代目标函数比上一代差时, 可能需要经过多代才能达到最佳, 此时需要进入加速程序, 加速程序可表示为:
2.3 不同目标函数的电力系统稳定器
将发电机各工作点及励磁系统参数输入程序中运行, 令目标函数极小化, 以判断机电模式的电力系统稳定器是否在指定的复平面内, 此处选择和。表3为单机系统在不同目标函数下设置的电力系统稳定度参数。图5 (a) 为发电机系统无电力系统稳定器时的机电模式, 图5 (b) ~5 (d) 为发电机系统在不同目标函数下电力系统稳定器的机电模式。由图5可知, 在目标函数M下设计的电力系统稳定器, 无论在何种结构的电网系统中或系统负载变换, 系统的阻尼比都能有效控制在指定的范围内以获得较好的动态性能。
3 多汽轮机发电机系统
3.1 六汽轮发电机系统
对于单汽轮机无线汇流排系统, 利用混合差分进化法及极点指定目标函数M设计的电力系统稳定器, 应用在不同电网结构下, 是发电机的机电模式处于指定的复平面区域内, 具有较高的动态性能。根据该方法设计用于多汽轮机的电力系统稳定器, 并求出系统中各发电机的电力系统稳定器, 以保证这个系统的机电模式处于指定的复平面区。
图6为一个6汽轮机14汇流排电力系统, 假设第一台汽轮机所接的汇流排为无线汇流排, 则实际系统可视为5台发电机, 各发电机、励磁系统、传输线及发电机原始工作点等参数如表4所示。
将表4中的参数值代入电网系统并线性化求得系统在有无PPS下的机电模式如表5所示, 无PPS机电模式的阻尼比非常小, 均小于0.1, 系统极不稳定, 需设计电力系统稳定器以增强系统阻尼, 改善系统动态特性。在各发电机组不同P、Q和Xe下, 根据式 (9) 指定的复平面域, 设计电力系统稳定器。在加了电力系统稳定器后, 明显改善了系统的机电模式。
3.2 十汽轮发电机系统
如图7所示的10机39汇流排电力系统, 假设发电机G1所接汇流排为无线汇流排, 因此实际系统可视为九部发电机。将单机电力系统稳定器的设计方法用于多机系统, 根据发电机输出效率、无功功率及输电电抗变化等条件, 利用混合差分进化法及极点指定法设计多机系统电力系统稳定器, 设计过程中取和。
为验证系统的阻尼效果, 对系统在移除图7汇流排传输线7~13后, 0.2秒恢复情况下的大干扰条件进行输出响应测量, 并对电力系统在无有电力系统稳定器两种条件下进行非线性系统时域模拟, 所得结果如图8, 具体数值如表6。由图表可知, 电力系统稳定器不但能提高系统的稳定性, 还能提高系统的动态特性。
4 结论
梯度策略自适应差分进化算法 第3篇
1 自适应策略差分进化算法
自适策略应差分进化算法( Differential Evolution Algorithm With Strategy Adaptation for Global Numerical Optimization,Sa DE) 是在文献[5 ~ 6]提出的,其主要思想是将效果较好的4 个变异算子策略集中在一起组成一个策略池,并记录各个策略的历史进化情况,大概率选择最优策略。
Sa DE策略池中的4 个算子策略分别是
DE/rand/1/bin
DE / rand - to - best /2 / bin
DE / rand /2 / bin
DE / current - to - rand /1
其中,r1~ r5是随机数,代表5 个不同的随机个体。F是一个均值为0. 5,方差为0. 3 服从正态分布的随机数,K为[0,1]的随机数。
Sa DE的具体过程是在进化初期,进行LP代的学习,学习规则是: 每个策略算子k均以1 /4 的概率被选中,且利用两个矩阵( 成功矩阵nsk和失败矩阵nfk) 来存储相关信息,供后续计算自适应选择。在进化LP代后,算法利用式( 1) ,计算每一代中每一个算子被选中的概率
其中
式中,k表示策略池中第k个策略; G表示当前代数;LP表示学习代数; g = G - LP,nsk,g表示第g代策略k成功进化的个体个数; nfk,g表示第g代策略k失败进化的个体数,为避免成功率为0 的出现,ε 设为一个较小的正数,本文中令 ε = 0. 01。
对于策略算子池中,每一个算子中都有一个参数CR,用于控制算子种群变异率的大小。Sa DE中也利用矩阵CRMemory1~ CRMemory4自适应的调整参数CR。具体方法如文献[5]。
可以看出,Sa DE算法采用自适应的方式进行学习,但这样做使得策略算子池中所拥有的策略成为了关键,一旦策略算子池中的策略均不能较好的求解当前问题,则算法的效果就变差,且Sa DE算法中策略算子池中的策略均是随机策略,其适用的目标函数范围虽广,却并未较好地利用目标函数的性质。
2 梯度策略自适应差分进化算法
2. 1 梯度搜索策略算子
为避免上述局限性,本文提出了梯度策略自适应差分进化算法,该算法是在原Sa DE算法的基础上引入了梯度搜索策略算子,其利用了目标函数的性质,从而使算法具有较好的搜索能力和稳定性。
在Sa DE算法的步骤3 对每一个个体概率性的选择一个策略算子池中的策略进行变异,其本身有4 个策略,但均是随机策略,本文在其中再加入一个策略算子———梯度搜索策略算子。梯度搜索策略算子利用梯度下降法的思想,对于函数F( X) ,若在点a处可微且有定义,则函数在a点沿着梯度相反的方向下降最快。首先求出函数在初始点a的梯度grad( p) ,随后- grad( P)沿着方向,向前前进一小步,从而得到进化子代。
函数F( X) 在P点的梯度为
其中,i,j,…,k分别表示各个维上的单位向量;分别表示各个维上函数F( X) 在P点的偏导数。
由于目标函数是任何可能的函数,不一定可微,因此偏导数的求解不能直接利用求导公式求解,文献[7]提出了利用导数的定义进行求解。根据导数的定义,函数在某一点的导数等于函数上某一点函数值的变化量与自变量变化量比值。若定义P点坐标为( x,y,…,z) ,因此函数F( X) 在P点的x轴的偏导数为
其中,Δ 称为梯度步长,其值为较小的数,在实验中Δ =0. 2。同理可求得
将式( 7) 和式( 8) 带入式( 6) 中便可求得函数F( X) 在P点的梯度[7]。
值得注意的是,当P点的梯度相当大时,即使Δp =- 0. 01 × grad( P) 时也很大,这与前进一小步的要求不符。文中令grad( p) 整体缩小E倍,记作grad( P)*,其中E表示grad( P) 中的最大的数量级,令 Δp为区间( - μ × grad( P)*,0) 之内的一个随机数,其中 μ 称为梯度随机因子,0 < μ < 1,实验中 μ = 0. 5。
2. 2 算法伪代码
GSa DE算法具体步骤:
步骤1 随机初始化种群;
步骤2 计算初始种群适应值;
步骤3 While G<GMAX/*G表示当前进化代数,GMAX为设定的最大进化代数*/
2.1/*计算策略1~5的选择概率p1~p5*/
2.2/*计算策略1~5的参数CR和F*/
对于种群中每一个个体,F均为符合N(0.5,0.3)的随机数;
对种群中的每个个体根据式CR=Normrnd(CRmk,0.1)计算其参数CR
2.3/*对每一个个体,依照选择概率随机选择策略进行变异,产生子代*/
若个体选择的是策略1 ~ 4,则利用对应的式( 1) ~ 式( 4) ,产生子代; 若个体选择的是策略5,则利用梯度搜索策略求解子代,详见利用梯度搜索策略求解P点子代Q步骤;
2. 4 选择出成功进化的子代与失败进化的父代组成新的一代种群;
2.5将本次的进化情况记录在成功和失败矩阵ns,nf,将参数CR记录在CRMemory1~5;
2. 6 G = G + 1;
步骤4 输出当前种群最优解。
利用梯度搜索策略求解P点子代Q步骤:
步骤1将式( 7) ~ 式( 10) 带入式( 6) 求解grad( p) ;
步骤2grad( P)*= grad ( P ) / E,其中E为grad( p) 中的最大的数量级;
步骤3Δp = ( - μ × grad( P)*,0) ,梯度随机因子 μ = 0. 5;
步骤4 Q = P + Δp。
3 实验结果
为进一步验证GSa DE的性能,文中选择CEC2005基准测试集1 ~ 14 号测试函数进行测试,这些函数大部分是经典测试函数的旋转、平移以及复合,能够较好地测试算法的性能,这些函数可在文献[8]中找到。文中在Matlab 2008a中进行实验,对所有的测试函数测试25 次,求得25 次实验的平均值。为了能反应算法的有效性,文中将GSa DE与Sa DE,邻域控制差分演化算法( NSDE) 以及协方差自适应演化策略( CMAES)的实验结果进行对比,为保证公平起见,所有的算法都将使用相同的适应度评估次数,即3. 0 × 105,作为算法终止条件。Sa DE和NSDE,CMAES的实验结果分别取自文献[6,9]。
GSa DE参数如下: 种群规模NP = 100,维数D =30,学习代数LP = 50,终止进化代数GMAX = 3 000代,MAX_FES = 100 × 3 000,梯度步长 Δ = 0. 2,梯度随机因子 μ = 0. 5。实验结果如表1 ~ 表3 所示。
从表1 可看出,对测试函数1 ~ 5,GSa DE算法的效果要略好于其他3 个算法。GSa DE、Sa DE以及NSDE均准确找到了函数1 的全局最优点; GSa DE对于函数2 的实验结果要明显优于其他的算法; 对于测试函数3 和5,GSa DE、Sa DE以及NSDE的测试结果基本相当。对于CMAES算法,其测试结果与其他算法的差异性较大,其在测试函数3 和5 上明显优于其他算法;这主要是因这两类算法具有本质的设计区别,对于问题的搜索偏向明显不同。
如表2 和表3 所示,GSa DE算法效果要更优于其他算法。GSa DE在函数6、7、9 上要明显优于Sa DE和NSDE,并且准确找到了函数9 的全局最优点。对于8、11、13 函数,GSa DE与Sa DE和NSDE的实验结果基本相当。而CMAES算法也只是在函数6、7 上具有优势。
综上分析,发现GSa DE算法在基准测试集CEC2005 上的整体性能要优于其他的比较算法。对于具有不同特点的测试函数都能够进行高效率的求解,这表明GSa DE算法不受求解问题的限制,具有较强的通用性。当然GSa DE算法在求解CEC2005 测试集中某些函数,例如函数10、12 也存在问题,这是由于梯度下降策略算子的加入,使得GSa DE的局部搜索能力加强,但在进化后期的广度搜索能力却得到了削弱,因此可能无法跳出一些局部最优点。
4 结束语
本文在Sa DE算法的基础上对算子池进行了优化,在其中加入梯度下降策略算子,更好地利用了目标函数的特点,提升算法的全局搜索能力和适应性,并将其命名为GSa DE。经过对CEC2005 测试集中的1 ~ 14号测试函数进行实验并与Sa DE,NSDE以及CMAES等算法实验结果进行对比,表明GSa DE算法搜索能力较强,效率较高,对解决高维全局优化问题具有明显优势。在后续工作中,文中将改进本文算法,使之能更好地适用于复杂的多峰函数问题。
参考文献
[1]赵春晖.基于遗传算法的宽带加权子空间拟合测向算法[J].电子学报,2004,32(9):1487-1490.
[2]李元科.工程最优化设计[M].北京:清华大学出版社,2006.
[3]何坚勇.最优化方法[M].北京:清华大学出版社,2007.
[4]玄光男.遗传算法与工程优化[M].于歆杰,译.北京:清华大学出版,2004.
[5]Qin A K,Suganthan P N.Self-Adaptive differential evolution algorithm for numerical optimization[C].Edinburgh,Scotland:Proceding of IEEE Congress Evolution Computer,2005.
[6]Qin A K,Huang V L,Suganthan P N.Differential evolution algorithm with strategy adaptation for global numerical optimization[J].IEEE Transactions on Evolutionary Computation,2009,13(2):398-417.
[7]王宇平,刘大莲.基于平滑技术和一维搜索的全局优化进化算法及其收敛性[J].计算机学报,2006,29(4):670-675.
[8]Suganthan P N,Hansen N,Liang J J,et al.Problem definitions and evaluation criteria for the[C].Hefei:CEC 2005Special Session on Real-Parameter Optimization,2005.
供应链企业协同进化策略研究 第4篇
一、供应链企业的协同动因
1.系统自组织。生态学理论强调系统元素的自组织性, 生物进化的本质是生物为适应生存环境的变化而对自身生存状态进行的自调节, 进化的结果是生物本身结构复杂性的提高。生物进化总是导致新物种的出现和结构的复杂化即有序性的增加。有学者认为, 生物在进化过程中满足一定条件时生物可以自发地改变自己的生存状态以适应周围环境。这种适应既包括暂时性的适应反应, 如条件反射;也包括永久性适应, 即产生遗传性变异。把这个生物进化自发性条件称为自适应函数。生物界的生物自适应对社会领域问题的研究很有启发意义。
目前, 供应链已从分散式管理转变到协同式管理, 本文研究的是有自组织程度低到自组织程度高的演化过程。供应链系统从外界环境中吸取的任何东西, 都可能产生序参量, 都会引起涨落。正是由于有不断的序参量产生, 有不断的“涨落”出现, 供应链系统才得以不断创新。
2.自然选择。生物学中达尔文式的自然选择定义为生物体繁殖引起了资源的稀缺, 从而形成了消灭不够适应变种的压力。进化论学家拉马克认为, 生物进化的动力与机理来自生物具有一种不断地增加结构复杂性和完美性的天生趋势生物具有对环境变化的反应能力。把经济系统的运行机制建立在生物进化和自然选择的基础上, 其理论的核心是适应机制, 强调经济体能否适应环境是企业生存的决定性因素。弗里德曼在《实证主义经济学方法论》中论证了市场竞争倾向于保证最有效率的企业生存下来, 最有效率企业的行为都基本上做到了使其利润最大化。面对有限的资源, 现代的竞争形式以转变成为供应链与供应链之间的竞争, 同一行业里的各条供应链在接受着经济自然选择。那些能够很好地整合供应链上各个企业的相对竞争优势, 实现无缝协同的供应链往往经受了自然的选择, 得到了快速发展, 不断成长壮大。所以供应链协同是环境赋予的供应链企业迫切需要的适应模式。
3.生物进化动力:协同基因。大量生物实验和研究表明, 生物进化的基本动力有竞争和合作, 生物界存在着广泛的互惠共生机制。生物的性状是由基因决定的, 在此我们把控制物种分工与合作的性状的基因称为协同基因。协同进化的现象是普遍存在的。
供应链系统内部企业之间也存在着类似的关系, 企业之间若为上下游关系或相关产业, 则其收益相关性一般比较大。他们的成长与发展历程中充满了竞争, 资源规模有限, 其实协同合作是他们的需求和内在愿望即他们携带有协同基因。正因为如此, 供应链理论一经实施, 便得到了很好地响应。所以供应链系统也采用了协同进化的方式来建立相互之间的互惠共生关系, 以提高对外部市场的适应性。
二、供应链企业的协同策略分析
(一) 生态位与供应链协同进化
生态位指在自然生态系统中, 一个种群在时间、空间上的位置及其与相关种群间的功能关系生态位概念相对抽象, 一些数量测度指标如生态位宽度、生态位重叠、生态体积及生态位维数等帮助理解生态位概念。从而, 引出企业生态位概念, 明确这一概念对于正确认识物种在自然选择进化过程的作用, 以及在运用生态位理论指导供应链成员构成配置等方面具有重要的意义。
供应链是相互联系的多个企业集合体, 与生物种群非常相似, 呈现一种网络组织结构, 称之为企业生态系统。系统中企业间的互动关系定义为企业的生态链, 生态链上的企业之间存在共同进化关系。企业之间既有竞争关系也有合作和共生关系, 这就存在一个供应链的“最适密度”问题。描述生物种群密度与存活率相互关系的“阿利规律”同样适用于供应链系统, 即在一定条件下, 当供应链上企业密度处于适度大小时, 供应链增长最快;密度太低或太高, 由相互竞争资源造成的供应链内耗太大, 会对供应链生长起抑制作用。所以供应链系统的构建应该建立在企业生态位分离的基础之上。企业对资源的需求越相似, 产品和市场基础越相近, 它们之间生态位的重叠程度就越大, 竞争就越激烈。因此, 在进行供应链的成员选择时, 企业考虑入选企业生态位的分离。企业生态位的分离不仅减少了竞争, 更重要的是为企业间功能耦合形成超循环提供了条件, 使供应链由有序进化到更深层次的有序。
(二) r选择、k选择与供应链生态策略
生物学家们根据不同物种按照栖息、环境和进化选择将进化分为r选择和k选择。r选择是指环境气候变化大、资源相对短缺、灾害较多的系统对生物种群的选择;k选择是指环境气候稳定、资源丰富、灾害稀少的系统对生物种群的选择。根据对应的选择将进化策略分为r策略和k策略。从物种适应性出发, 进一步将k选择的生物种群称为k策略者, r选择的生物种群称为r策略者。在生存竞争中, k策略者是以“质”取胜, r策略者则是以“量”取胜, k策略者将大部分能量用于提高存活, r策略者将大部分能量用于繁殖。
生态策略是生物在环境适应过程中形成的进化策略。与经济学家提出的最优化理论相对应, 生物学家认为自然选择是一个最优化过程, 一个现存物种表明了它是其对环境各种可能适应方式中的最佳选择之一。实际上供应链的进化过程亦是典型的环境选择的过程。有时处于减少风险考虑, 会增加同类合作伙伴, 但是供应链上的合作伙伴企业未必越多越好, 它也遵循进化的生态策略。因为供应链所处的行业环境的承受能力有限, 超出环境的承载力, 会出现适得其反的效果。优化生态策略的途径有:供应链上的各企业要实现由r策略者向k策略者的转变;企业不能单纯追求规模的扩大和低成本战略, 要向创新和难以复制的核心技术的战略上调整;要由以“量”取胜向以“质”取胜, 自觉遵循“适者生存”的市场生态竞争法则
(三) 演化博弈策略
供应链类似于生物有机界的食物链, 是企业生态链的载体, 也存在着能量和物质的流动、循环发生联系并由此相互作用。种群生态理论研究的方向就是探讨生物群落的适应与变迁的过程。演化博弈理论最早源于Fisher、Hamilton等遗传生态学家对动物和植物的冲突与合作行为的博弈分析, 他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。
在该理论中, 核心的概念是“复制动态”和“演化稳定策略” (ESS) 。复制动态实际上是描述某一特定策略在一个种群中被采用的频数或频度的动态微分方程。根据演化原理, 一种策略的适应度或支付 (Payoff) 比种群的平均适应度高, 这种策略就会在种群中发展, 即适者生存体现在这种策略的增长率 (1/xk) (dxt/dt) >0, 可用微分方程给出: (1/xk) (dxt/dt) =[u (k, s) -u (s, s) ], k=1, , k。其中, xk为一个种群中采用策略k的比例, u (k, s) 表示采用策略k时的适应度, u (s, s) 表示平均适应度, k代表不同的策略。如果u (k, s) >u (s, s) , 在一定时期内是演化稳定策略 (ESS) 。由此可见, 一个物种的进化可能会改变作用于其他生物的选择压力, 从而引起其他生物的适应性变化, 而这种变化将会引起相关物种的进一步变化。所以, 两个或多个组织的自身进化常常是相互影响的, 这样就形成了一个互相作用的协同进化系统。这种复制动态的微分方程可以描述协同演化的过程, 可以为供应链协同提供新的研究视角。
三、结束语
从生态学理论的角度, 以自适应、自然选择、协同基因和生物进化动力为切入点研究供应链协同的内在动因, 得出供应链协同是供应链系统的一种自组织;自然选择的结果是企业重新审视自身的价值链优势, 使供应链协同成为必要;供应链上的节点企业具有协同基因等论点。相应于内在动因提出基于生态学理论的供应链协同策略有必要的生态位分离、k选择者的供应链生态策略和演化博弈策略。通过以上的研究为供应链协同内在动因问题的研究开辟新的研究视角和研究方法
参考文献
[1]韩福荣, 徐艳梅.企业仿生学[M].北京:企业管理出版社, 2001.
[2]程国平.供应链管理中的协同问题研究[D].天津大学, 2004.
[3]毛凯军, 田敏, 许庆瑞.基于复杂系统理论的企业集群进化动力研究[J].科研管理, 2004 (7) :110-115.
[4]沈运红, 王恒山.中小企业网络组织生态运行演化机制初探[J].科学学研究, 2006 (8) :246-249.
进化稳定策略 第5篇
遗传算法是生命科学与工程科学互相交叉、互相渗透的产物, 其遵循的原则就是Darwin的进化论和Mendel的遗传学说, 是由Michigan大学Holland教授于1975年首次提出。其本质是一种求解问题的高度并行性全局搜索算法。它能在搜索过程中自动获取和积累有关搜索空间的知识, 并自适应地控制搜索过程以求得最优解。经过近30余年的努力, 遗传算法不论是在应用上、算法设计上, 还是在基础理论上, 均取得了长足的发展, 已成为信息科学、计算机科学、运筹学和应用数学等诸多学科所共同关注的热点研究领域。尽管遗传算法在理论研究和实践应用中已经取得了巨大的成功, 但遗传算法存在收敛速度慢和易于陷入局部最优的问题, 在需要优化的参数较多时, 更表现出遗传算法的不足。以下将从遗传算法的易于陷入局部最优解入手通过改进GA中的选择算子防止陷入局部最优的问题。
2 进化博弈的基本理论与方法
进化博弈思想最早可以追溯到20世纪30年代, R.A.Fisher (1930) 用这一思想解释了自然界中种群的生存竞争现象。R.C.Lewontin (1961) 和Maynard Smith (1972) 正式提出了进化稳定策略 (evolutionarily stable strategy, ESS) 的概念。1982年Maynard Smith出版的《Evolution and the Theory of Games》和1984年Robert Axelrod出版的《The Evolution of Cooperation》两本专著使进化博弈成为完整的理论体系, 并引起经济学家和社会学家的广泛兴趣。
2.1 进化博弈基本理论。
进化博弈是研究在假设参与人为不完全理性或有限理性的条件下, 群体互动决策过程中个体策略选择问题的分析框架。进化机制一般包括选择机制和遗传机制 (交叉和变异) 。选择机制体现了优胜劣汰, 遗传机制体现了交叉和变异。进化稳定均衡是进化博弈的核心概念, 而动态模仿者模型是体现进化机制的重要模型。种群最终的进化结果依赖于初始状态和进化路径。在一定的自然选择压力下, 种群中的个体按某种概率选择博弈策略, 并使之达到某一均衡, 如果种群中的少数个体由于某种原因改变原来的博弈策略, 经过进化, 种群中个体博弈策略概率和均衡还会回到原均衡状态, 即微小的扰动 (变异) 不改变原均衡, 这时群体所选择的策略就是进化稳定策略, 相应的均衡就是进化稳定均衡。模仿者动态模型是进化博弈的经典模型, 它是指种群中采取某一纯策略的个体所占比例的增长率等于采取该策略时所得支付与种群平均支付之差。假定群体中每个个体在任何时候只选择一个纯策略, Sk={s1, s2, , sk}表示种群中个体可以选择的纯策略集;N表示种群中的个体总数;ni (t) 表示t时刻种群中选择纯策略i的个体数。x= (x1, x2, , xk) 表示种群在t时刻所处的状态, 其中xi表示在该时刻选择纯策略i的个体在种群中所占的比例, 即xi=ni (t) /N。f (si, x) 表示种群中个体进行随机配对匿名博弈时, 种群中选择纯策略Si的个体所得的期望支付。
表示种群平均期望支付。则模仿者动态模型的微分形式如公式 (1) 所示。
该公式表明, 如果一个选择纯策略Si的个体得到的支付少于种群平均支付, 那么选择纯策略Si的个体在种群中所占比例将会随着时间的演化而不断减少;反之, 则增加;如果恰好相等, 则选择该纯策略的个体在种群中所占的比例不变。
2.2 老鹰与鸽子博弈。
鹰鸽博弈是进化博弈的一个标准例题, 常常用来考查确定生态环境中种群个体的竞争情形。假定种群中有两类个体, 一种采取老鹰策略 (H) , 即决不妥协, 要么受伤败退, 要么战胜对方;另一种采取鸽子策略 (D) , 即先是耀武扬威, 但对方动真格时临阵脱逃。假设采取每种策略的个体相遇时的支付矩阵如表1所示。
首先采用经典博弈方法求解该博弈的均衡。假设种群中个体采取老鹰策略的概率为p, 采取鸽子策略的概率为 (1-p) , 则采取两种策略的个体所获期望支付为:
由对称性, 在纳什均衡处获得的支付无差别, 即UH-UD=0, 计算得p=V/ (4V-C) , 令V=1、C=0时, 存在三种纳什均衡:两种纯策略eH= (1, 0) 、eD= (0, 1) 和混合策略eHD= (1/4, 3/4) , 如图1所示。
接下来我们采用进化博弈的方法求解稳定均衡。根据公式 (1) , 若t时刻采取老鹰策略的个体概率为pt, 则
采取老鹰策略的个体获得的期望支付:UH
种群平均期望支付:EU=ptUH+ (1-pt) UD
当达到进化稳定均衡状态时, 有
公式 (4) 的解分别为Pt=1, pt=0, pt=1/4, 对应均衡 (1, 0) , (0, 1) 和 (1/4, 3/4) (但前两个均衡是不稳定的, 如果种群都采取老鹰策略, 随着进化代数的增加, 被击败者不断增加, 这些被击败者在以后的博弈中更加倾向于采取鸽子策略;如果种群都采取鸽子策略, 若有老鹰策略者入侵 (如个体变异) , 采取鸽子策略的个体将不断减少。所以, 只有混合策略才是唯一的进化稳定均衡。
2.3 进化算法的求解方法
从前面进化稳定均衡的求解方法来看, 整个过程大体由两部分组成, 首先依据模仿者动态方程来求解该博弈可能存在的均衡;然后再对各均衡施加一小扰动, 即在均衡处使微量的个体改变原策略, 产生个体策略选择的变异, 最后检验该种群在扰动下是否还能回到原均衡状态, 若能, 则该均衡是进化稳定均衡, 否则, 不是。这一过程, 实质上也是均衡的精炼过程。这里引入进化算法的基本思想, 并结合李鸿雁在遗传算法研究上的相关积累, 采用自然进化的方法直接模拟该博弈的博弈机制, 求解进化稳定均衡。
博弈机制改进遗传算法的设计如下:
a.随机产生若干位数的二进制字符串, 即染色体, 如[0 1 0 00 1], 该染色体代表整个种群, 染色体长度代表种群规模, 1代表采取老鹰策略的个体, 0代表采取鸽子策略的个体;b.在字符串中随机选择两个字符进行博弈, 如果1与1相遇, 其中一个保持不变, 另一个随机生成0和1;如果0与0相遇, 两字符都不变;如果1与0相遇, 1保持不变, 0随机生成0或1。这样的机制可以解释为自然环境中老鹰与老鹰相遇, 博弈的结果是一只存活, 另一只死掉, 死掉的老鹰所占有的资源随机分配给其它的老鹰或鸽子;如果老鹰和鸽子相遇, 鸽子死掉, 死掉的鸽子所占有的资源随机分配给其它的老鹰或鸽子;鸽子与鸽子相遇, 相安无事。c.不断进化, 直到达到稳定的状态, 即进化稳定均衡出现。
3 结论与展望
以上提出了一种基于进化博弈的遗传算法改进策略, 用于改进遗传算法的选择策略本文的创新之处在于应用鹰鸽博弈模型于遗传算法的整个选择过程, 使种群在进化的过程中处于一种稳定状态, 进而对遗传算法进行改进。虽然用于单目标函数优化问题的实验结果比较成功, 但是本算法的应用仍有需要完善和研究的地方。
参考文献
[1]姚文俊.遗传算法及其研究进展[J].计算机与数字工程, 2004:41-43.
[2]吴玫, 陆金桂.遗传算法的研究进展综述[J].机床与液压, 2008, 36 (3) :176-179.
基于微分进化算法的多目标交会策略 第6篇
随着卫星应用需求的日益发展,越来越多的空间任务已不能仅靠单颗卫星来完成。由多颗卫星组成的卫星星座系统,在通讯、导航等领域获得了越来越广泛的应用。为保证卫星系统长期可靠地正常运行,可能需要在较短时间内对卫星系统的若干颗卫星进行接近作业,以完成在轨加注、故障维修、元器件更换等在轨服务任务。针对上述需求,一种可行的解决方案是,预先在空间某轨道上布置一母航天器,在轨服务任务过程中,母航天器先后释放多个服务航天器,之后服务航天器变轨机动与多个目标分别实现交会。过去的研究多集中于对单一目标的轨道交会问题进行轨道优化,求解燃料或时间最优的转移轨道[1,2,3]。Li-li Zheng[4]对多目标最短时间交会问题进行了研究,但对问题进行了较大程度的简化,未考虑摄动影响,且目标均位于与母航天器共面的同一圆轨道上。
本文针对上述需求,对目标分别位于不同的椭圆轨道,且均与母航天器轨道不共面的多目标远程交会问题,考虑J2摄动的影响,利用微分进化算法,对总燃料消耗最优和总时间消耗最优交会进行了优化,给出了多目标最优交会的策略。
1 考虑J2摄动的远程交会求解策略
远程交会即实现服务航天器与目标航天器在同一时间到达空间同一位置的过程。在初、末位置已知,且机动时间给定的情况下,可通过求解Lambert问题得到相应的变轨速度,进而得到变轨轨迹。然而,一般的求解Lambert问题的方法均只适用于理想二体情况下,因此,需要给出一种摄动影响下求解两点定时转移问题的方法。
假设任务初始时刻t0母航天器位于空间某一轨道上,经过时间t后释放服务航天器。服务航天器与母航天器分离瞬时,认为其与母航天器具有相同的速度vp,之后通过对自身施加速度增量,以速度v在摄动影响下进行变轨机动,经过时间Δt后与目标航天器实现交会,其中,速度增量的大小Δv=|v-vp|不大于速度增量约束Δvmax。考虑J2摄动的影响,有:
式(1)中,fεx、 fεy, 、fεz为J2摄动加速度矢量在地心惯性坐标系中的投影,。假设变轨所需速度增量以脉冲形式作用于服务航天器上,则地心惯性坐标系下的轨道动力学方程具有如下形式:
如图1所示,变轨初始时刻服务航天器从A点出发,若不考虑摄动影响,服务航天器经过Δt时间到达B点理想位置;考虑摄动影响后,服务航天器从A点经过Δt时间后到达实际命中点B′点处。将B′点与B点的位置矢量差Δr记为等时位置偏差。
假设以实际目标点B附近某点B*作为虚拟目标点,规定飞行时间同样为Δt,进行Lambert机动,则认为飞行过程中两条轨道上的摄动力差别不大,经过同样的飞行时间后,产生的等时位置偏差也应该基本一样。因此,通过将虚拟目标点设在与B的位置矢量差为-Δr的B*点处,即可减小等时位置偏差。不断迭代,直到末端位置满足精度要求。考虑摄动影响的变轨速度求解过程如下:
(1) 根据初末位置矢量rA、rB和预计转移时间Δt,利用普适变量法求解Lambert问题,得到变轨速度v;
(2) 由rA、v在0~Δt内对方程式(2)进行积分,得到等时目标点r′B,求得等时位置偏差Δr=r′B-rB;
(3) 利用Δr对目标位置进行修正:rB=rB-Δr;
(4) 检查是否满足精度要求:|Δr|<ε。若不满足,重复执行(1)~(3)步;精度满足要求后继续执行下一步;
(5) 最终所得v即为考虑摄动因素并在变轨Δt时间后到达理想目标位置rB处实际需要的变轨速度。
利用上述方法求得各服务航天器变轨速度后,通过对式(2)进行积分,就可得到J2摄动影响下服务航天器与目标实现远程交会的机动轨迹。
2 采用微分进化算法的多目标交会优化
多目标交会问题由于涉及Lambert问题的求解,无法获得其解析表达式,而且问题较为复杂,存在多个局部最优解,因此不宜采用传统的优化算法进行优化。
微分进化(DE)算法是由Rainer Storn和Kenneth Price在1995年提出的一种智能优化方法。作为一种新颖的搜索算法,微分进化算法首先在搜索空间内随机产生初始群体,然后通过将群体中两个成员间的差向量增加到第三个成员的方法来生成新的个体。如果新个体的适应度值更好,那么新产生的个体将代替原个体。由于微分进化算法同样采用了“优胜劣汰、适者生存”的自然进化法则,所以应当归属于进化算法。它在收敛速度和稳定性方面都超过了其它几种随机算法[5],如退火单纯形算法、自适应模拟退火算法、进化策略和随机微分方程法等。而且和其它的进化算法相比,微分进化算法容易理解、易于实现、有很强的空间搜索能力。因此,本文采用微分进化算法对多目标交会问题进行优化求解。
微分进化算法中主要的控制参数是群体规模NP,放缩因子F和交叉常数CR。根据文献[6]中所做研究,种群规模的合理取值范围为2D~25D(D为解空间的维数),变异因子F取值范围为[0.2,1.0],CR取值范围[0.1,1.0]。
假设任务中须对三个目标航天器进行远程交会。对应的三个服务航天器分离时刻分别为t1、t2、t3,服务航天器变轨运行时间分别为Δt1、Δt2、Δt3。令:
则T1、T2、T3分别为对单个目标完成交会所需的时间。根据分离时刻服务航天器与目标航天器的位置以及变轨运行时间,利用上一节的方法求得J2摄动下的变轨速度分别为v1、v2、v3,进而得到变轨所需的速度增量大小分别为Δv1、Δv2、Δv3。
由于完成多目标交会任务所需的时间由耗时最长的单个目标交会过程决定,因此可将性能指标函数J表述为
另外,三个服务航天器的变轨速度增量大小Δv1、Δv2、Δv3须满足约束条件:
因此,引入项Kpmax{0,Δv1-Δvmax,Δv2-Δvmax,Δv3-Δvmax},则优化问题可描述为:寻找最优组合(t1,Δt1,t2,Δt2,t3,Δt3),使
最小。
式(6)中,K1、K2分别为任务时间和速度增量的加权系数。当K1=0,K2=1时为燃料最优;K1=0,K2=1时为任务时间最优;K1、K2均大于0时则为时间燃料综合最优。Kp为罚系数,本文中取值为107。
上述优化问题中解的形式为(t1,Δt1,t2,Δt2,t3,Δt3),解空间维数D=6,考虑到问题的复杂性,本文算例中取NP=100,F=0.7,CR=0.6进行优化计算。
3 算例及分析
任务初始时刻(t0=0)母航天器与三个目标航天器的瞬时轨道参数如表1所示(表中长度单位为km,角度单位为(°))。
下面将以上述参数为初始值,针对燃料最优与时间最优的不同情况,对多目标交会策略进行优化与分析。
3.1 算例一
取K1=0,K2=1,Kp=107,即以燃料最优作为优化目标。取NP=100,F=0.7,CR=0.6,进化代数Gmax=1 000。最大速度增量约束Δvmax=1 500 m/s。考虑到空间在轨服务任务具有一定的时效性,因此假定母航天器释放服务航天器前的漂飞时间和服务航天器的变轨时间均不超过10 h,即在优化过程中,t和Δt均在[0,36 000]s范围内进行搜索。将(t1,Δt1,t2,Δt2,t3,Δt3)的初值分别取为(1 000,1 000,1 000,1 000,1 000,1 000)和(2 000,5 000,3 000,6 000,4 000,7 000),进行两次优化计算。两次计算得到的优化结果(t1,Δt1,t2,Δt2,t3,Δt3)及对应的Jmin的值见表2。
可以看出两次计算结果均收敛到同一组值附近,对应的Jmin也基本相等。由于取K1=0,K2=1,Jmin的值实际上等于完成任务所需总的速度增量的最小值,即完成任务过程中所需的总的速度增量最小为359.56 m/s,其中Δv1=109.61 m/s、Δv2=136.62 m/s、Δv3=113.33 m/s。对应的任务总时间为22 851.32 s,约为6.35 h。
3.2 算例二
取K1=1,K2=0,Kp=107,即以任务总时间最短作为优化目标。最大速度增量约束Δvmax=1 500 m/s。同样取NP=100,F=0.7,CR=0.6,进化代数Gmax=1 000,在[0,36 000]s范围内对(t1,Δt1,t2,Δt2,t3,Δt3)进行寻优。分别以(1 000,1 000,1 000,1 000,1 000,1 000)和(2 000,5 000,3 000,6 000,4 000,7 000)为初值进行两次优化计算。
两次计算得到的指标函数最小值均为Jmin=7 168.43,即在服务航天器变轨速度增量均不超过1 500 m/s的限制条件下,实现同三个目标的交会任务最短需要7 168.43 s的时间。
但是,两次计算的最终结果中,与Jmin对应的(t1,Δt1,t2,Δt2,t3,Δt3)取值并不是唯一的。现将部分结果列举在表3中。
对表3中结果进行分析可知,即使服务航天器以规定的最大变轨速度增量进行机动,对目标2的交会所需的最短时间(T2)min相对T1、T3也是最长的,因此任务的总时间就由T2决定。而对于其它的两个目标,只要满足T1、T3不大于(T2)min,且Δv1、Δv3不大于Δvmax,则(t1,Δt1,t3,Δt3)的值是可以任意组合的,因此存在多组(t1,Δt1,t2,Δt2,t3,Δt3),使指标函数达到最小值Jmin。
3.3 算例三
根据算例二的结果,单纯对总的任务时间进行寻优无法得到唯一的一组最优解,因此考虑寻找一组(t1,Δt1,t2,Δt2,t3,Δt3),使得在任务时间尽量接近上例得到的最小值7 168.43 s的基础上,使任务所需的总速度增量最小。
根据上例结果,指标函数中max{T1,T2,T3}与(Δv1+Δv2+Δv3)的值均在103量级,因此考虑令K1=10,K2=1,使得总任务时间对指标函数的值起主导作用,同时由于0<K2≪K1,总燃料消耗将在任务时间充分接近最小值时对指标函数的取值产生主要影响。
同样取NP=100,F=0.7,CR=0.6,进化代数Gmax=1 000,在[0,36 000]s范围内对(t1,Δt1,t2,Δt2,t3,Δt3)进行寻优,并以(1 000,1 000,1 000,1 000,1 000,1 000)和(2 000,5 000,3 000,6 000,4 000,7 000)为初值进行两次优化计算。两次计算得到的结果如表4所示。
两次结果均收敛在同一值附近,且第一次计算的指标函数(Jmin)1小于第二次计算的指标函数(Jmin)2,即第一次得到的结果优于第二次计算的结果,因此可取第一次的计算结果作为最优解。
两个结果对应的任务时间分别为:
均与算例二中最短时间接近。比较本算例中两次计算结果,注意到:
因此,影响两个结果中指标函数Jmin的取值的主要因素是总燃料消耗,证明本算例中K1、K2的取值确实使得当任务时间接近最小值时,总燃料消耗对指标函数的取值起主导作用。
对比结果一与算例二中得到的各组解,易知当任务时间同为7 168.43 s时,Δv2均达到了速度增量约束的上限。而本算例中的解通过调整(t1,Δt1,t3,Δt3)的取值,令Δv1+Δv2的值达到最小,从而使得在最短任务时间不变的前提下,尽量减少服务飞行器变轨机动所需的速度增量,为其之后对目标的服务动作留有更充裕的燃料。因此,相比算例二中得到的各组解,本算例优化得到的(t1,Δt1,t2,Δt2,t3,Δt3)组合更具有实用意义。
4 结论
本文基于多目标在轨服务需求研究了摄动影响下的多目标远程交会问题。采用虚拟目标点的摄动修正策略,给出了J2摄动影响下的远程交会轨迹求解方法。建立了对多目标远程交会问题进行优化的性能指标函数,针对燃料最优与任务时间最优这两种常见情况,采用微分进化算法进行了寻优计算,得到了相应的优化结果和多目标最优交会策略。本方法对于多目标在轨服务与在轨拦截任务远程交会段的轨道设计具有重要的指导意义。
摘要:采用微分进化算法研究了考虑J2摄动影响的多目标远程最优交会问题。首先,采用虚拟目标点摄动修正策略,提出了考虑J2摄动影响的远程交会轨迹求解方法。然后,建立了多目标远程最优交会的性能指标函数,采用微分进化算法,对燃料最优与任务时间最优的多目标远程交会进行了寻优计算,得到了相应的优化结果和多目标最优交会策略。研究工作可用于多目标在轨服务和拦截任务的远程交会策略制定和和轨道设计。
关键词:多目标,交会,优化,微分进化算法
参考文献
[1] Luo Yazhong,Tang Guojin,Lei Yongjun,et al.Optimization of mul-tiple-impulse,multiple-revolution,rendezvous-phasing maneuvers.Journal of Guidance,Control,and Dynamics,2007;30(4):946—952
[2]佘志坤,薛白,丛源良,等.最优双冲量交会问题的数学建模与数值求解.宇航学报,2010;31(1):155—161
[3]陈统,徐世杰.基于遗传算法的最优Lambert双脉冲转移.北京航空航天大学学报,2007;33(3):273—277
[4] Zheng Lili,Yuan Jianping,Zhu Zhanxia.On-orbit service missionprogramming and orbit optimization for multi-object-spacecraft.Inter-national Astronautical Congress.International Astronautical Federa-tion,2008
[5] Storn R,Price K.Differential evolution-a simple and efficient heuris-tic for global optimization over continuous Spaces.Journal of GlobalOptimization,1997;11(4):341—359
[6]赵光权.基于贪婪策略的微分进化算法及其应用研究.哈尔滨:哈尔滨工业大学,2007
进化稳定策略 第7篇
一、意识反应模式的建立
企业进化理论用八个字可概括为:“适者生存, 市场选择。”对于任何企业而言, 发展是目的, 但是生存才是最基本的条件, 然而企业的生存与环境则是息息相关的。系统论认为, 我们的世界是一个开放的世界, 是一个开放的系统。同理, 企业作为一个开放的系统, 需要同外部环境进行充分地交流。一方面, 企业通过自身的产出物来改变环境对企业的认知, 从而提升企业在环境中的地位;另一方面, 企业通过搜寻各种反映环境变化的信息, 能动地适应变换着的环境, 从而成为环境中的长期伴随体, 不断谋求发展和进步。所以, 当企业能够从环境摄取到自身所需要的资源时, 便能够较好地生存, 否则就会功亏一篑, 企业进化更无从谈起。但是, 这种环境的适应是需要企业内部机体及时地做出反应的, 迅速作出反应者为适者, 才能生存。
1955年, 美国IBM公司高级企业研究所战略研究主任斯蒂芬亨克尔在美国《计划评论》杂志上发表题为《适应性企业设计:意识反应模式》的文章。根据亨克尔的理论, 意识反应模式下企业的关键行为如图1所示 (2) 。
我们不妨把这种模式的精髓应用到企业具体的财务管理中, 因为财务策略的选择关系到企业整体战略规划的实现与否。企业这个个体要首先意识到内外部环境的变化, 随后凭借自己的经验、能力进行分析, 再做出相应的反应, 剔除无关的甚至风险的因素, 选择适宜的财务策略。当环境又发生变化时, 再进行及时地调整, 构成一个反复循环的模式, 构成一个可以自动调节的系统, 保障企业的可持续发展。
二、意识反应模式下财务管理策略的选择
(一) 做好成本控制, 把好资金的“出口关”
成本控制是财务管理的一个必要的手段, 它能把财务管理的目标推向一个新的阶段, 因此成本控制不仅在企业财务管理中, 更在企业发展战略中处于重要地位。近些年来, 虽然国家对医药行业实行了GMP和GAP认证, 但是不少中医药企业的药品自主研发能力较差, 产品的市场占有率低, 利润率一直在低位徘徊, 再加上大量跨国医药企业涌入中国大陆, 使得不少中医药企业难有招架之力。面对日益激烈的竞争形势, 中医药企业要想提高其竞争力, 如果同类产品的性能、质量相差无几, 那么决定产品在市场竞争中地位的就是价格, 而成本决定价格高低。即只有降低成本, 才能降低价格。
一般来说, 说到成本控制, 很多企业都偏向生产领域中各种绝对成本的控制, 通过压缩材料消耗、水电费以及差旅费等来实现成本控制。而现代财务意义上的成本控制是基于财务管理中成本效益原则的, 是要减少那些不必要的支出, 而对于那些能给企业带来结构升级, 提高市场竞争力和经济效益的费用支出, 虽然眼前增加了负担.但从长远来看有助于企业的可持续经营和蓬勃发展的战略性费用支出, 如扩大生产能力、新产品的研发等, 则必须给予保证。所以, 成本控制是贯穿企业产品开发、生产、营销和售后的全过程和全方位的管理。要想真正做好成本控制, 可从以下几方面入手:
1.实施全面预算管理。编制企业预算, 内容上包括采购预算、成本预算、现金收支预算和利润预算等, 使得企业的各项活动能够按照预算轨道有条不紊地进行。时间上年度预算可分解为季度预算、月度预算, 有助于找出薄弱环节以便采取积极的措施加以解决。每年度末要进行认真分析、总结, 及时整改, 不断提高预算的编制水平。
2.指标分解, 全员参与。模拟市场核算, 层层分解、细化成本指标, 并落实到人, 做到全员参与, 使得车间、班组、个人对于自身所承担的成本、费用、消耗做到心中有数, 并与责任和绩效相挂钩 (3) 。这样做不仅能够增强员工的主人翁意识, 更是把以降低成本为主要手段的财务管理工作真正落实到了实处。
3.完善内部监督控制体系。体系的完善往往取决于管理者对于成本控制的重视程度, 以及财务人员是否具有较高的业务水平和是否能够很好的行使自己的监督权。所以, 要想完善一套健全的内部监督控制体系, 管理者必须牢固树立成本控制理念, 发挥好财务人员的参谋作用, 建立以财务为中心的成本考核体系, 努力降本增效, 提高资金的使用效果, 追求企业价值最大化的目标。
(二) 强化企业资金管理意识, 保证企业正常的“血液循环”
企业的资金犹如人体的“血液”, 是企业正常运转的保证。企业的营运资金在企业全部资金中占有相当大的比重, 其周转期短, 形态易变。营运资金不仅因其较强的流动性而成为企业日常生产经营活动的润滑剂和基础, 而且, 营运资金管理效率的高低能够影响企业经营目标的实现。实证研究表明, 财务管理的约60%的时间都用于营运资金的管理, 因此营运资金管理是企业财务工作的主要内容。
广义的营运资金是指一个企业流动资产的总额;狭义的营运资金是指某一时期内流动资产与流动负债之差, 本文所涉及的营运资金是广义与狭义概念的综合, 这里的“综合”体现的是流动资产与流动负债关系的反映, 这有利于财务人员意识到, 对营运资金的管理要注意流动资产与流动负债这两个方面的问题。
1.优化企业现金流量管理。营运资金是为了维持企业在追求利润而对各项资源的运作、达到不断增值的目的时, 完成了现金资产现金的循环而形成资金链。可以看出, 企业的现金流量管理水平在很大程度上影响了企业的生存和发展, 也是企业财务管理策略中至关重要的一个环节。在实际操作中, 要注意制定合理的现金收支规划, 及时掌握企业现金流入、流出情况, 合理持有现金余额, 为企业筹资、投资和利润分配保证正常的资金流转。另外, 要建立现金流量指标考核体系, 充分考虑外部市场环境和内部生产经营中的风险因素, 分析当前的现金流量质量, 有利于企业财务风险的防范和战略规划的实现 (4) 。
2.健全应收账款管理体系。在信用风险分析基础上, 企业要制定合理的信用政策, 明确责任, 建立客户信用档案, 进行信用等级测评, 严格控制信用期限, 采取合理的收账策略。总的来说就是做好事前和事中控制。
3.加强存货管理。企业要根据自身的特点, 权衡好存货成本与存货效益的关系, 确定合理的存货数量。实施好分级归口管理制度, 明确权限责任, 定期进行存货清查, 尽可能压缩过时的库存物资, 避免资金呆滞, 并以科学的方法来确保存货资金的最佳结构。总之, 做到供产销各个环节紧密结合, 建立规范的操作程序。
4.合理利用短期资金融资方式。企业运营都会采取贷借款增加所需资金扩大生产, 一般采用短期筹资方式如商业信用和银行短期借款来缓解企业紧迫的资金短缺困扰。当然, 在筹资过程中要尽量降低筹资成本, 合理规划、协调与流动资金之间的比重, 科学地确定数量, 不可盲目筹资, 以免加重公司的负担。
摘要:改革开放以来, 我国中医药企业得到了长足的发展, 加入世贸组织后, 更是给我国中医药企业带来了前所未有的机遇与挑战, 但是我们必须清醒地看到我国中医药企业在企业规模、产品质量、科技含量等方面还有待于进一步提高, 综合竞争力要进一步加强。文章基于企业进化视角, 侧重在意识—反应模式下如何选择适宜的财务策略, 帮助企业保持生机和活力。
关键词:企业演化,意识—反应模式,财务策略
参考文献
[1].闫安, 达庆利.基于生态位构建的企业进化模型[J].华东经济管理, 2009 (1)
[2].罗仲伟.适应性企业:急剧变动时代的战略思维[M].广州:广东经济出版社, 2001
[3].田奋飞.企业演化研究:从“生命悟性”到“生命人性”[J].社会科学家, 2008 (1)
[4].张艳.论成本控制与财务管理目标[J].财经界, 2011 (18)
[5].胡旭微, 张惠忠.财务管理[M].杭州:浙江大学出版社, 2008
进化稳定策略范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。


