本申请属于配电网决策技术领域,尤其涉及一种基于三方演化博弈的配电网决策方法、装置和设备。
背景技术:
电网的规划中心常常要面临是否要在此处建设变电站、线路等决策问题,这一过程涉及到的利益相关主体有:能源监管部门、电网、用户。从能源监管部门来看,可能会选择介入监管,以保护环境和确保公信力;也可能不介入监管,因为介入监管的难度和成本太大、从电网来看,可能会选择建设变电站或线路,以保证电网可靠性,也可能选择不建设变电站;作为用户,可能选择增加负荷也可能选择不增加负荷。这三个博弈主体任何一方的决策都会影响到其他两方的策略选择,因此在信息不完全的情况下,三者各自做出决策很难确认他们的选择是最大化自己的利益。
因此,提供一种综合考虑三个博弈主体利益的决策方法,用于各博弈主体做出决策是本领域技术人员亟待解决的技术问题。
技术实现要素:
有鉴于此,本申请提供了一种基于三方演化博弈的配电网决策方法、装置和设备,将演化博弈应用于配电网的决策问题上,指导各个部门做出最优的决策。
本申请第一方面提供了一种基于三方演化博弈的配电网决策方法,包括:
101、根据各博弈主体在参与博弈时所做出的可能选择所对应的概率和收益,确定各博弈主体对应的平均收益模型和各博弈主体参与博弈时做出肯定选择的期望收益模型,所述博弈主体包括:能源监管部门、电网、用户;
102、根据各博弈主体对应的平均收益模型和期望收益模型确定各博弈主体的复制动态方程;
103、根据各博弈主体对应的复制动态方程确定各博弈主体的动态趋势曲线;
104、根据各博弈主体对应的动态趋势曲线确定各博弈主体的博弈决策。
优选地,步骤101之前还包括:
获取由各博弈主体的所述可能选择所构成的所有策略组合、各个策略组合中各博弈主体的收益和各个策略组合中各博弈主体的可能选择所对应的概率。
优选地,所述能源监管部门的所述可能选择为:介入监管和不介入监管。
优选地,所述电网的所述可能选择为:建设变电站和不建设变电站。
优选地,所述用户的所述可能选择为:增加负荷和不增加负荷。
优选地,所述复制动态方程为:
其中,a为博弈主体i,a1为博弈主体i的肯定选择,x为博弈主体i做出肯定选择所对应的概率,
本申请第二方面提供了一种基于三方演化博弈的配电网决策装置,包括:
第一单元,用于根据各博弈主体在参与博弈时所做出的可能选择所对应的概率和收益,确定各博弈主体对应的平均收益模型和各博弈主体参与博弈时做出肯定选择的期望收益模型,所述博弈主体包括:能源监管部门、电网、用户;
第二单元,用于根据各博弈主体对应的平均收益模型和期望收益模型确定各博弈主体的复制动态方程;
第三单元,用于根据各博弈主体对应的复制动态方程确定各博弈主体的动态趋势曲线;
第四单元,用于根据各博弈主体对应的动态趋势曲线确定各博弈主体的博弈决策。
优选地,还包括:
获取单元,用于获取由各博弈主体的所述可能选择所构成的所有策略组合、各个策略组合中各博弈主体的收益和各个策略组合中各博弈主体的可能选择所对应的概率。
本申请第三方面提供了一种基于三方演化博弈的配电网决策设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行如第一方面所述的基于三方演化博弈的配电网决策方法。
本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行如第一方面所述的基于三方演化博弈的配电网决策方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请提供了一种基于三方演化博弈的配电网决策方法,包括:101、根据各博弈主体在参与博弈时所做出的可能选择所对应的概率和收益,确定各博弈主体对应的平均收益模型和各博弈主体参与博弈时做出肯定选择的期望收益模型,所述博弈主体包括:能源监管部门、电网、用户;102、根据各博弈主体对应的平均收益模型和期望收益模型确定各博弈主体的复制动态方程;103、根据各博弈主体对应的复制动态方程确定各博弈主体的动态趋势曲线;104、根据各博弈主体对应的动态趋势曲线确定各博弈主体的博弈决策。本申请中将演化博弈应用于配电网的决策问题上,通过复制动态方程描述演化的趋势和稳定性的情况,分析参数的变化对演化趋势和稳定性的影响,从而指导各个部门做出决策。
附图说明
图1为本申请实施例中一种基于三方演化博弈的配电网决策方法的第一实施例的流程示意图;
图2为本申请实施例中一种基于三方演化博弈的配电网决策方法的第二实施例的流程示意图;
图3为本申请实施例中一种基于三方演化博弈的配电网决策装置的结构示意图;
图4中4i、4ii和4iii为本申请实施例中能源监管部门对应不同情况的动态趋势曲线图;
图5中5i、5ii和5iii本申请实施例中电网对应不同情况的动态趋势曲线图;
图6中6i、6ii和6iii为本申请实施例中用户对应不同情况的动态趋势曲线图。
具体实施方式
有鉴于此,本申请提供了一种基于三方演化博弈的配电网决策方法、装置和设备,将演化博弈应用于配电网的决策问题上,指导各个部门做出最优的决策。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请第一方面提供了一种基于三方演化博弈的配电网决策方法。
请参阅图1,本申请实施例中一种基于三方演化博弈的配电网决策方法的第一实施例的流程示意图,包括:
步骤101、根据各博弈主体在参与博弈时所做出的可能选择所对应的概率和收益,确定各博弈主体对应的平均收益模型和各博弈主体参与博弈时做出肯定选择的期望收益模型。
需要说明的是,博弈主体包括:能源监管部门、电网、用户。此处所描述的肯定选择指的是参与博弈时各博弈主体的肯定选择,例如能源监管部门、电网和用户所对应的肯定选择分别为:介入监管、建设变电阵和增加负荷。
步骤102、根据各博弈主体对应的平均收益模型和期望收益模型确定各博弈主体的复制动态方程。
需要说明的是,在确定各博弈主体的平均收益模型和期望收益模型后,根据各博弈主体对应的平均收益模型和期望收益模型确定各博弈主体的复制动态方程。
步骤103、根据各博弈主体对应的复制动态方程确定各博弈主体的动态趋势曲线。
需要说明的是,在得到各博弈主体对应的复制动态方程后,可以根据各博弈主体对应的复制动态方程确定各博弈主体的动态趋势曲线。
步骤104、根据各博弈主体对应的动态趋势曲线确定各博弈主体的博弈决策。
需要说明的是,在得到各博弈主体对应的动态趋势曲线后,可以根据各博弈主体的动态趋势曲线确定各博弈主体的决策影响因素。
本实施例中,将演化博弈应用于配电网的决策问题上,通过复制动态方程描述演化的趋势和稳定性的情况,分析参数的变化对演化趋势和稳定性的影响,从而指导各个部门做出决策。
以上为本申请实施例提供的一种基于三方演化博弈的配电网决策方法的第一实施例,以下为本申请实施例提供的一种基于三方演化博弈的配电网决策方法的第二实施例。
请参阅图2,本申请实施例中一种基于三方演化博弈的配电网决策方法的第二实施例的流程示意图,包括:
步骤200、获取由各博弈主体的可能选择所构成的所有策略组合、各个策略组合中各博弈主体的收益和各个策略组合中各博弈主体的可能选择所对应的概率。
需要说明的是,能源监管部门的可能选择为:介入监管和不介入监管,电网的可能选择为:建设变电站和不建设变电站,用户的可能选择为:增加负荷和不增加负荷。
步骤201、根据各博弈主体在参与博弈时所做出的可能选择所对应的概率和收益,确定各博弈主体对应的平均收益模型和各博弈主体参与博弈时做出肯定选择的期望收益模型。
需要说明的是,博弈主体包括:能源监管部门、电网、用户。
步骤202、根据各博弈主体对应的平均收益模型和期望收益模型确定各博弈主体的复制动态方程。
需要说明的是,复制动态方程为:
其中,a为博弈主体i,a1为博弈主体i的肯定选择,x为博弈主体i做出肯定选择所对应的概率,
步骤203、根据各博弈主体对应的复制动态方程确定各博弈主体的动态趋势曲线。
步骤204、根据各博弈主体对应的动态趋势曲线确定各博弈主体的博弈决策。
本实施例中,将演化博弈应用于配电网的决策问题上,通过复制动态方程描述演化的趋势和稳定性的情况,分析参数的变化对演化趋势和稳定性的影响,从而指导各个部门做出决策。
以上为本申请实施例提供的一种基于三方演化博弈的配电网决策方法的第二实施例,以下为本申请实施例提供的一种基于三方演化博弈的配电网决策方法的应用例。
为了更好地说明本申请的内容,本申请以建设变电站为例子,研究不同的策略组合下能源监管部门、电网、用户三者的演化博弈。
1、首先定义如下的参数。
假设有能源监管部门a、电网b、用户c三个不同的博弈主体参与,每个博弈主体有两个策略可供选择,这样便构成了2×2×2的三方博弈。设能源监管部门a的可能选择为介入监管a1和不介入监管a2,也即能源监管部门a的策略集为{a1,a2},电网b的可能选择为建设变电站b1和不建设变电站b2,也即电网b的策略集为{b1,b2};用户c的可能选择为增加负荷c1和不增加负荷c2,也即用户c的策略集为{c1,c2}。三个博弈主体的策略组合有8种,每种组合对不同的博弈主体有不同的收益。
2、分析各策略组合下能源监管部门a,电网b和用户c各自的收益。以策略组合为{a1,b1,c1}为例子有:①从能源监管部门a的角度,介入变电站项目的评估管理需要的成本为c1,对电网建设变电站收取的环境费用g,介入监管获得的环境效益i,建设变电站的环境成本e;②从电网b的角度,建设变电需要成本c2,用户增加负荷电网增加的收益p,建设变电站带来的可靠性收益r,被能源部门收取的环境费用g;③从用户c的角度,建设变电站带来的可靠性收益r’,能源监管部门介入监管后对用户环境的影响βe’,增加负荷给用户带来的收益a。运用相同的方法分析8种策略组合下三方的收益,列出如下的表格:
8种策略组合下的收益组合
3、假设能源监管部门a选择a1的比例为x,选择a2的比例为1-x;电网b选择b1的比例为y,选择b2的比例为1-y;用户c选择c1的比例为z,选择c2的比例为1-z。为了简化分析计算,设这8中策略组合的收益组合为:(a,i,q),(b,j,r),(c,k,s),(d,l,t),(e,m,u),(f,n,v),(g,o,w),(h,p,θ)
则能源监管部门a选择a1的期望收益以及能源部门群体的平均收益为:
电网b选择b1的期望收益以及电网群体的平均收益为:
用户c选择c1的期望收益以及用户群体的平均收益为:
4、能源监管部门a选择“介入监管”的复制动态方程:
令t1=-b+d+f-h,t2=h-d,t3=a-b-c+d-e+f+g-h,t4=c-d-g+h然后重新对方程进行整理可得:
(a若
(b若
进化稳定策略ess要求
其分别对应的动态趋势曲线如图4所示。
同理,电网b采用“建设变电站”策略的复制动态方程:
其中,m1=-j+n+l-p,m2=p-n,m3=i-j-m+n-k+l+o-p,m4=m-n-o+pm1=c1,m2=c2,m3=0,m4=r1。
对f(y)求导可得:
代入分析可得,动态趋势和稳定性如下:
其分别对应的动态趋势曲线如图5所示。
用户c采用“增加负荷”的复制动态方程:
令n1=-s+w+t-θ,n2=θ-w,n3=q-s-u+w-r+t+v-θ,n4=u-w-v+θ;
n1=e3,n2=-a,n3=0,n4=r2。
对f(z)求导可得:
分析可得其动态趋势及稳定性如下所示:
其对应的动态趋势曲线如图6所示。此处需要说明的是,因为e”是能源监管部门介入监管后给用户收益带来的折扣,也就是e”<a,而x的范围是[0,1],因此xe”<a,即xe”-a<0,而y的范围是[0,1],因此,只有y>0>(xe”-a)这一种情况。
分析该非对称三个博弈主体可以得到不同的均衡状态(设图4中的4i、4ii和4iii以曲面s1为界,将立方体分为上下两部分记为v1和v2;图5中的5i、5ii和5iii以曲面s4为界,将立方体分为上下两部分记为v3和v4):
(a)当初始状态落在v1和v3交集空间内时,该演化博弈收敛于x=1,y=1,z=1,对应方案为:(介入监管,建设变电站,增加负荷)。
(b)当初始状态落在v1和v4交集空间内时,该演化博弈收敛于x=1,y=0,z=1,对应方案为:(介入监管,不建设变电站,增加负荷)。
(c)当初始状态落在v2和v3交集空间内时,该演化博弈收敛于x=0,y=1,z=1,对应方案为:(不介入监管,建设变电站,增加负荷)。
(d)当初始状态落在v2和v4交集空间内时,该演化博弈收敛于x=0,y=0,z=1,对应方案为:(不介入监管,不建设变电站,增加负荷)。
此处对状态(a)进行解释说明,其他状态参见状态(a),状态(a)中,当初始状态落在v1空间内,则演化博弈收敛到x=1(如图4iii中s3所表示的面);当初始状态落在v3中时,演化博弈收敛到y=1(如图5ii中s5所表示的面);而对于z,无论初始状态在何处,其都会收敛于z=1(如图6中s7所表示的面)。此时,同时观察图4(ii)和图5(ii),可以发现,v1和v3立方体有重叠的部分,当初始状态落在重叠部分时,演化博弈就收敛到x=1,y=1,z=1这个点,对应博弈决策方案为:(介入监管,建设变电站,增加负荷)。
通过建立能源监管部门、电网和负荷用户三者之间的演化博弈模型,比较不同的均衡结果,可以得出下列结论:
1、减小能源监管部门的监管成本c1(或者通过增加补贴等方式),增大建设项目对环境影响严重的项目的罚金g,将使得s1曲面下移,演化博弈收x→1概率增大,有助于推动能源监管部门履行职责,推动能源监管部门趋向于选择“介入监管”策略。
2、当用户选择增加负荷的概率大于电网建设变电站的成本与建设变电站带来的可靠性收益的比值时,y→1,电网趋向于建设变电站。所以,电网建设变电站与否关键取决于建设变电站成本与可靠性收益的比值(xc1+c2)/r1。
3、只要能源监管部门介入监管(0<x<1),则必定有z→1,也就是用户将趋近于增加负荷。所以为了保持经济的可持续发展,要发挥能源监管部门的职责,这样才能保障负荷持续稳定的增长。
相比与现有技术,本申请优点在于:
1、运用演化博弈,体现了各博弈主体在信息不对称的情况下,为了最大化自身的利益,随着时间的推移不断地学习模仿,修正自己的策略,能够体现在不同的时间段、受到不同因素的影响下,各博弈主体的策略组合,从而为生产实际提供参考。
2、综合考虑了经济性、可靠性、环保型以及社会公信力等多方面的影响,能更准确地计算收益矩阵,使得演化博弈的计算模型更精确。
3、参数的变化对各个博弈主体的影响,从公式上明确了演化结果发生改变的拐点,为实际决策提供依据和参考。
4、三方博弈的情况下,每个博弈主体只有两个可能选择,简化了复制动态方程的计算。
本申请第二方面提供了一种基于三方演化博弈的配电网决策装置。
请参阅图3,本申请实施例中一种基于三方演化博弈的配电网决策装置的结构示意图,包括:
第一单元301,用于根据各博弈主体在参与博弈时所做出的可能选择所对应的概率和收益,确定各博弈主体对应的平均收益模型和各博弈主体参与博弈时做出肯定选择的期望收益模型,博弈主体包括:能源监管部门、电网、用户;
第二单元302,用于根据各博弈主体对应的平均收益模型和期望收益模型确定各博弈主体的复制动态方程;
第三单元303,用于根据各博弈主体对应的复制动态方程确定各博弈主体的动态趋势曲线;
第四单元304,用于根据各博弈主体对应的动态趋势曲线确定各博弈主体的博弈决策。
优选地,还包括:
获取单元300,用于获取由各博弈主体的可能选择所构成的所有策略组合、各个策略组合中各博弈主体的收益和各个策略组合中各博弈主体的可能选择所对应的概率。
本实施例中,将演化博弈应用于配电网的决策问题上,通过复制动态方程描述演化的趋势和稳定性的情况,分析参数的变化对演化趋势和稳定性的影响,从而指导各个部门做出决策。
本申请第三方面提供了一种基于三方演化博弈的配电网决策设备,设备包括处理器以及存储器:
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行如第一方面所描述的基于三方演化博弈的配电网决策方法。
本申请第四方面提供了一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行如第一方面所描述的基于三方演化博弈的配电网决策方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的待安装电网网络,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个待安装电网网络,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。