一种基于代价敏感支持向量机的发电企业识别方法

文档序号:31952696发布日期:2022-10-28 21:24阅读:来源:国知局

技术特征:
1.一种基于代价敏感支持向量机的发电企业识别方法,其特征在于,包括如下步骤:s1、获得发电企业的申报电量和申报电价数据;s2、构建发电企业的滥用市场力行为识别指标体系,指标包括:发电企业报价数据、各段申报电量份额、各段成交电量份额、各段申报成功比、是否为本段高价、高报价次数;s3、当报价段数较高时,使用主成分分析法对数据进行降维;s4、采取k-means算法对无标签样本进行初始“伪标签”指派,结合半监督支持向量机,采用成对交换标签的方式交换标记错误的标签,得到预测标签;s5、将处理后的滥用市场力数据集代入代价敏感直推式支持向量机,将求解问题转化为变分不等式问题,并使用定制邻近点算法进求解,通过判别函数确定样本标签y
i
,得到滥用市场力的发电企业。2.如权利要求1所述的一种基于代价敏感支持向量机的发电企业识别方法,其特征在于,所述步骤s1中,获得某一时期中m家发电企业的原始申报数据和和和分别表示第i个发电企业第j段的申报电价和申报电量。3.如权利要求2所述的一种基于代价敏感支持向量机的发电企业识别方法,其特征在于,所述步骤s2中,所述发电企业报价数据为指标1,计算公式为:式中:x
1i
表示发电企业的报价数据,分别表示第i个发电企业第j段的申报电价、申报电量及成交电量,i=1,2,

,m,j=1,2,

n,m为发电企业个数,n为报价段数;所述各段申报电量份额为指标2,计算公式为:式中:x
2ij
表示第i个企业的第j段申报电量份额;所述各段成交电量份额为指标3,计算公式为:式中:x
3ij
表示第i个企业的第j段成交电量份额;所述各段申报成功比为指标4,计算公式为:式中:x
4ij
表示第i个企业的第j段申报成功比;所述是否为本段高价为指标5,计算公式为:式中:x
5ij
表示第i个企业在第j段报价中是否为本段高价;
所述高报价次数为指标6,计算公式为:式中:x
6i
表示第i个发电企业第j段高报价次数。4.如权利要求3所述的一种基于代价敏感支持向量机的发电企业识别方法,其特征在于,所述步骤s3中,由于发电企业报价数据在报价段数多时维度较高,而支持向量机在数据高维度情形下适用性较差,因此使用主成分分析法pca对高维数据进行降维。5.如权利要求4所述的一种基于代价敏感支持向量机的发电企业识别方法,其特征在于,所述步骤s4中,构造的样本数据包含上述基于报价数据识别指标体系中的指标:发电企业报价数据x
1i
、各段申报电量份额x
2i
、各段成交电量份额x
3i
、各段申报成功比x
4i
、是否为本段高价x
5i
、高报价次数x
6i
以及发电企业滥用市场力标签y
i
;在所有样本中,设给定有标签样本集d
l
={(x1,y1),(x2,y2),

,(x
l
,y
l
)}和无标签样本集d
u
={(x
l+1
,y
l+1
),(x
l+2
,y
l+2
),

,(x
l+u
,y
l+u
)};其中l为有标签样本数量,u为无标签样本数量,l+u=h为总样本数量;y
i
∈{1,-1}为样本标签,1表示未违规,-1表示违规;设最优分类界面为ω
t
x+b=0,ctsvm的目标是为无标签样本集d
u
中样本给出预测标签其中ctsvm的二次规划模型为:式中:ξ为松弛向量,ξ
i
(i=1,2,

,l)对应有标签样本的松弛变量,ξ
i
(i=l+1,l+2,

,h)对应无标签样本的松弛变量;c
l
,c
u
分别对应有标签样本的惩罚系数和无标签样本的惩罚系数,表示两类样本的重要程度;其中惩罚系数c
l
和c
u
定义如下:且满足其中num1、num2分别表示有标签样本中正负样本个数;当样本点线性不可分时,还需要引入核函数,将其转化为线性可分数据进行处理;核函数的一般定义如下:k(x
i
,x
j
)=<φ(x
i
),φ(x
j
)>=φ
t
(x
i
)
·
φ(x
j
)其中<.,.>表示内积运算。6.如权利要求5所述的一种基于代价敏感支持向量机的发电企业识别方法,其特征在于,所述步骤s5中,由于tsvm本身存在时间复杂度高的问题,在样本数据量较大时,计算缓慢;并且tsvm采取成对交换标签的方式,这种方式虽然准确率高但速度较慢;为加快求解速度,将其求解问题转化为变分不等式问题,并使用定制邻近点算法对变分不等式问题进行求解,具体步骤如下:步骤1:根据拉格朗日对偶原理将式(7)转化为:
设矩阵将式(8)转化为矩阵形式,具体形式如下:式中:c为h
×
1的矩阵,c(i)=c
l
(i=1,2,

,l),c(i)=c
u
(i=l+1,l+2,

,h),而e则表示分量全为1的列向量;步骤2:设数据标签向量的零空间矩阵为z,因为y
t
α=0,则原问题中α可由矩阵z线性表示为α=zυ;然后原问题就可以转化为线性不等式约束的凸优化问题:步骤3:首先将凸优化问题写成lagrange函数形式:l(υ,λ)=θ(υ)-λ
t
(aυ-b)然后求其lagrange函数鞍点(υ
*

*
)相当于求解以下变分不等式问题:θ(υ)-θ(υ
*
)+(ω-ω
*
)
t
f(ω
*
)≥0,ω∈ω式中:步骤4:使用定制邻近点算法求解变分不等式问题;对于给定ω
k
=(υ
k

k
)定制邻近点算法具体表示如下:算法具体表示如下:将(10)式中θ(υ)代入上式得到基于cppa的k-ctsvm迭代算法:
式中:p=[z
t
hz+diag(r)]-1
;当r
·
s≥||a
t
a||时,cppa算法收敛;步骤5:使用判别函数f(x)=sgn[w
*
x+b
*
]确定样本标签当输出结果为-1时,说明该发电企业滥用市场力。

技术总结
本发明公开一种基于代价敏感支持向量机的发电企业识别方法。本发明结合发电企业的串谋识别指标体系和半监督学习算法代价敏感直推式支持向量机,将改进的支持向量机与变分不等式求解算法结合,实现了在只有少量发电企业有标签数据情形下仍可以准确实时地识别发电企业滥用市场力行为。本发明提出的基于改进代价敏感直推式支持向量机的发电企业滥用市场力智能识别方法,可以高效实时地识别电力市场交易中的滥用市场力行为,对防范电力市场交易风险、保障市场健康发展具有重要意义。保障市场健康发展具有重要意义。


技术研发人员:王文婷 安爱民 张展鹏 王茜茜 马臣斌 路佳伟 陈铜川 李海峰 俞桃花 李凤霞 关海娇
受保护的技术使用者:兰州理工大学
技术研发日:2021.12.17
技术公布日:2022/10/27
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1