一种基于动静态特征融合学习的服刑人员风险预测方法

文档序号:25679583发布日期:2021-06-29 23:54阅读:144来源:国知局
一种基于动静态特征融合学习的服刑人员风险预测方法

1.本发明涉及刑事司法领域,具体是一种基于动静态特征融合学习的服刑人员风险预测方法。


背景技术:

2.对监管场所内服刑人员进行持续的风险评估是保证监管场所平稳运行的重要手段。
3.现有监管场所大多采用使用人工制定的量表对服刑人员风险进行评估,比如[1]何川,马皑.罪犯危险性评估研究综述.河北北方学院学报:社会科学版,2014(02):72

77+90中写明最常用的是“水平评估量表”(lsir)有54个问题,分为犯罪史、教育/就业、经济状况、家庭/婚姻、物质滥用、情绪/人格、态度取向等10个分量表,并根据总得分将服刑人员分为低、中、高3个风险等级。类似的,[2]andrews d a,bonta j a,wormith j s.the recent past and near future of risk and/or need assessment.crime&delinquency,2006,52(1):7

27.中提出的“威斯康星危险性评估工具”(wrnai),包括酗酒、初犯年龄、一年内就业时间百分数等11个问题,每个问题有3个选项,每个选项依据其权重计分,最后根据总分判断其风险等级。这些评估方式更多地依赖感性经验以判断某种状态或行为对风险的影响,很容易受评估者对罪犯个人的感知的干扰,导致评估结果偏差,可靠性较差。


技术实现要素:

[0004]
为了克服已有技术的不足,本发明提供了一种基于动静态特征融合学习的服刑人员风险预测方法。
[0005]
本发明解决其技术问题所采用的技术方案是:
[0006]
一种基于动静态特征融合学习的服刑人员风险预测方法,该方法包括以下步骤:
[0007]
(1)高维动静态数据的时空特征提取:首先对静态数据进行降维提取重要特征;然后由动态数据业务表得到三维的动态特征张量;最后与静态特征矩阵融合得到动静态三维张量;
[0008]
(2)行为频域特性自适应的多模型融合预测:首先根据服刑人员历史风险特征的频域特性对服刑人员进行聚类标记,然后根据标记对所得到的动静态三维张量进行分解,分类别构建监督数据集,并进一步设置多种步长,得到不同类别不同步长的训练样本集;最后针对多类别多步长训练样本集构建多分类多尺度网络结构,对样本集进行训练,得出预测模型。
[0009]
进一步,所述步骤(1)中,静态数据降维提取重要特征的过程包括:首先,使用监督学习中的树型算法计算每个静态特征sf作为分裂节点时的总增益total_gain=f
tree
(s),其中s∈r
p
×
sf
,sf∈sf,p表示所有服刑人员的集合,sf表示所有静态特征的集合;然后,对total_gain进行排序得到所有特征对整个模型的相对贡献值顺序,选择排名靠前的n个特征得到降维后的特征矩阵s

∈r
p
×
sf


[0010]
再进一步,所述步骤(1)中,由动态数据业务表得到三维的动态特征张量的过程为:首先,对于每个动态时序数据业务表其中表示个体p∈p的时间

属性表df表示所有动态特征的集合,生成一条时间间隔固定的时间线lt,将每个中的t
p
∈t
p
与lt中t
l
∈lt进行比对,使用插值法补全缺失时间点的数据,使得t
p
=lt,并得到个体p的二维动态特征矩阵然后,将m
p
按照p在p中的顺序依次连接形成三维特征张量最后,对所有输入的业务表都进行以上操作后得到三维特征张量集合c
v
={v1,v2,v3,

},并在特征轴进行拼接,得到包含所有业务表的三维动态特征张量,
[0011]
更进一步,所述步骤(1)中,静态特征矩阵融合动态三维张量的过程为:首先,在不同时间轴节点,将v

分解为|lt|个动态二维矩阵的集合然后,对于所有的将与s

融合,其中定义df∪sf

=dsf;最后,对于在时间轴依次连接成动静态特征融合的三维张量
[0012]
所述步骤(2)中,对所得到的动态三维张量进行训练样本构建的过程为:首先,将历史风险值y(t)由时域转为频域数据y(w)=f
y
[y(t)],并选取特定频段上的数据作为特征,使用聚类算法将所有服刑人员p标记为m个类别然后,根据标记将所有服刑人员的特征张量u分解成m个对应类别的特征张量其中对于最后,对每个类别设定一组时间步长q,将每个转换为|q|个训练样本集
[0013]
所述步骤(2)中,所述的多分类多尺度网络结构的输入层包括m个子网络模块,每个子网络模块有|q|个子网络单元,每个子网络单元对应同时,其隐藏层包括一个子网络单元网络单元的输入/输出以及连接方式为:首先,对于每个将放入得到其对应的最后时刻k隐层状态以及所有时刻的隐层状态其次,将每个输入层子网络单元的所有时刻隐层状态输出融合,得到将out
all
放入隐含层子网络单元得到最后时刻的隐层状态再次,将每个输入层子网络单元的最后时刻隐层状态与隐藏层子网络单元的最后时刻的隐层状态融合,得到最后,将放入输出层训练,并通过目标激活函数将结果映射到0

1之间,得到服刑人员风险预测值。
[0014]
本发明的时空特征提取中,对静态数据进行降维提取重要特征;由动态数据业务表得到三维的动态特征张量;与静态特征矩阵融合得到动静态三维张量;多模型融合预测
中,根据服刑人员历史风险特征的频域特性对服刑人员进行聚类标记,根据标记对动静态三维张量进行分解,分类别构建监督数据集,并进一步设置多种步长,得到不同类别不同步长的训练样本集;针对多类别多步长训练样本集构建多分类多尺度网络结构,对样本集进行训练,得出预测模型。
[0015]
本发明的有益效果主要表现在:有效降低风险预测中的主观因素,在不依赖于专家经验的情况下实现客观预测。
附图说明
[0016]
图1是基于动静态特征融合学习的服刑人员风险预测方法流程图。
[0017]
图2是多分类多尺度网络结构图。
具体实施方式
[0018]
下面结合附图对本发明作进一步描述。
[0019]
参照图1和图2,一种基于动静态特征融合学习的服刑人员风险预测方法,该方法包括以下步骤:
[0020]
(1)高维动静态数据的时空特征提取:首先对静态数据进行降维提取重要特征;然后由动态数据业务表得到三维的动态特征张量;最后与静态特征矩阵融合得到动静态三维张量;
[0021]
(2)行为频域特性自适应的多模型融合预测:首先根据服刑人员历史风险特征的频域特性对服刑人员进行聚类标记,然后根据标记对所得到的动静态三维张量进行分解,分类别构建监督数据集,并进一步设置多种步长,得到不同类别不同步长的训练样本集;最后针对多类别多步长训练样本集构建多分类多尺度网络结构,对样本集进行训练,得出预测模型。
[0022]
所述步骤(1)中,静态数据降维提取重要特征的过程包括:首先,使用监督学习中的树型算法计算每个静态特征sf作为分裂节点时的总增益total_gain=f
tree
(s),其中s∈r
p
×
sf
,sf∈sf,p表示所有服刑人员的集合,sf表示所有静态特征的集合;然后,对total_gain进行排序得到所有特征对整个模型的相对贡献值顺序,选择排名靠前的n个特征得到降维后的特征矩阵s

∈r
p
×
sf


[0023]
所述步骤(1)中,由动态数据业务表得到三维的动态特征张量的过程为:首先,对于每个动态时序数据业务表其中表示个体p∈p的时间

属性表df表示所有动态特征的集合,生成一条时间间隔固定的时间线lt,将每个中的t
p
∈t
p
与lt中t
l
∈lt进行比对,使用插值法补全缺失时间点的数据,使得t
p
=lt,并得到个体p的二维动态特征矩阵然后,将m
p
按照p在p中的顺序依次连接形成三维特征张量最后,对所有输入的业务表都进行以上操作后得到三维特征张量集合c
v
={v1,v2,v3,

},并在特征轴进行拼接,得到包含所有业务表的三维动态特征张量,
[0024]
所述步骤(1)中,静态特征矩阵融合动态三维张量的过程为:首先,在不同时间轴节点,将v

分解为|lt|个动态二维矩阵的集合然后,对于所有的将与s

融合,其中定义df∪sf

=dsf;最后,对于在时间轴依次连接成动静态特征融合的三维张量
[0025]
所述步骤(2)中,对所得到的动态三维张量进行训练样本构建的过程为:首先,将历史风险值y(t)由时域转为频域数据y(w)=f
y
[y(t)],并选取特定频段上的数据作为特征,使用聚类算法将所有服刑人员p标记为m个类别然后,根据标记将所有服刑人员的特征张量u分解成m个对应类别的特征张量其中对于最后,对每个类别设定一组时间步长q,将每个转换为|q|个训练样本集
[0026]
所述步骤(2)中,所述的多分类多尺度网络结构的输入层包括m个子网络模块,每个子网络模块有|q|个子网络单元,每个子网络单元对应同时,其隐藏层包括一个子网络单元网络单元的输入/输出以及连接方式为:首先,对于每个将放入得到其对应的最后时刻隐层状态以及以及所有时刻的隐层状态其次,将每个输入层子网络单元的所有时刻隐层状态输出融合,得到将out
all
放入隐含层子网络单元得到最后时刻的隐层状态再次,将每个输入层子网络单元的最后时刻隐层状态与隐藏层子网络单元的最后时刻的隐层状态融合,得到最后,将放入输出层训练,并通过目标激活函数将结果映射到0

1之间,得到服刑人员风险预测值。
[0027]
本实施例中,使用监督学习中的树型算法计算每个静态特征作为分裂节点时的总增益,然后,对个特征总增益进行排序得到所有特征对整个模型的相对贡献值顺序,选择排名靠前的100个特征,得到降维后的特征矩阵。
[0028]
对于每个动态时序数据业务表,生成一条时间间隔为一天的时间线lt,将每个服刑人员时间

属性表中的时间线与lt中各个时间点进行比对,使用插值法补全服刑人员时间

属性表缺失时间点的数据,得到每个个体p的二维动态特征矩阵m
p
;然后,将m
p
按照p在p中的顺序依次连接形成三维特征张量v;最后,对所有输入的业务表都进行以上操作后得到三维特征张量集合c
v
={v1,v2,v3,

},并在特征轴进行拼接,得到包含所有业务表的三维动态特征张量v

∈r
p
×
lt
×
df

[0029]
对所得到的动态三维张量进行训练样本构建。首先,将历史风险值y(t)使用傅立叶变换由时域转为频域数据,并选取低频段上的数据作为特征,使用聚类算法将所有服刑人员标记为2个类别;然后,根据标记将所有服刑人员的特征张量u分解成个2对应类别的特
征张量最后,对每个类别设定一组时间步长{1,2,3,4},将p
1*
,p
2*
转换为4个训练样本集。
[0030]
根据多类别多步长训练样本集构建多分类多尺度网络结构,输入层包括2个子网络模块,每个子网络模块有个4子网络单元,同时,其隐藏层包括一个子网络单元。将全部数据的70%作为主要的训练样本,剩下的30%作为预测分类器的测试数据集,采取优化算法进行梯度下降,分类损失函数选用交叉熵损失函数,并设置正负样本的权重比例为输入数据本身的有无风险比例的交换值。将训练好的模型在测试集上预测并比较结果。
[0031]
本说明书的实施例所述的内容仅仅是对发明构思的实现形式的列举,仅作说明用途。本发明的保护范围不应当被视为仅限于本实施例所陈述的具体形式,本发明的保护范围也及于本领域的普通技术人员根据本发明构思所能想到的等同技术手段。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1