基于机器学习的审批工作流数据智能筛查方法与系统

文档序号:38639289发布日期:2024-07-12 11:42阅读:来源:国知局

技术特征:

1.基于机器学习的审批工作流数据智能筛查方法,其特征在于,包括:

2.如权利要求1所述的基于机器学习的审批工作流数据智能筛查方法,其特征在于,所述s20进一步包括:

3.如权利要求2所述的基于机器学习的审批工作流数据智能筛查方法,其特征在于,所述s210进一步包括:

4.如权利要求2所述的基于机器学习的审批工作流数据智能筛查方法,其特征在于,所述s220进一步包括:

5.如权利要求1所述的基于机器学习的审批工作流数据智能筛查方法,其特征在于,所述s40进一步包括s410,基于表征预设邻域ε()内样本数量的权重系数、任意两个样本之间的平均余弦距离以及任意样本之间最大余弦距离获取核心对象在所述预设邻域ε()内的样本密集程度,其中,所述权重系数为所述核心对象预设邻域ε()内的样本所占的面积与所述核心对象预设邻域ε()的整体面积的比值。

6.如权利要求1所述的基于机器学习的审批工作流数据智能筛查方法,其特征在于,所述s40进一步包括s420,基于各样本到核心对象的余弦距离、样本到核心对象的余弦距离的标准差、倾向系数获取核心对象分布倾向特征程度,所述倾向系数为所述核心对象的预设邻域ε(eps)内的一半面积范围内样本所占的面积与所述核心对象预设邻域ε(eps)内的一半面积的比值。

7.如权利要求1所述的基于机器学习的审批工作流数据智能筛查方法,其特征在于,所述s40进一步包括s430:通过八邻域各方向上的相邻样本的周期权重和周期表现来确定各方向上的周期性分布程度,对各方向上的周期性分布程度筛选最大值,从而获取核心对象的样本周期性分布程度,所述相邻样本的周期权重为相邻样本的余弦距离差异以及两所述相邻样本与样本平均距离的差异确定的;

8.如权利要求1所述的基于机器学习的审批工作流数据智能筛查方法,其特征在于,所述基于所述密度分布表现获取核心对象的扩展判断值,进一步包括:

9.如权利要求6所述的基于机器学习的审批工作流数据智能筛查方法,其特征在于,所述根据所述扩展判断值与判断值阈值的大小适应性调整所述预设邻域ε(eps),得到调整后的预设邻域,包括:

10.基于机器学习的审批工作流数据智能筛查系统,其特征在于,包括:


技术总结
本发明公开了一种基于机器学习的审批工作流数据智能筛查方法与系统,属于大数据处理技术领域,通过DBSCAN算法来获取审批工作表的核心对象;基于所述核心对象获取其在预设邻域中的密度分布表现,所述密度分布表现包括:样本密集程度、核心对象分布倾向特征程度、样本周期性分布程度;基于所述密度分布表现获取核心对象的扩展判断值,根据所述扩展判断值与判断值阈值的大小适应性调整所述预设邻域;基于调整后的所述预设邻域通过DBSCAN算法,获取所述核心对象在调整后的预设邻域下的样本数量M,基于所述样本数量M的大小判断样本是否异常。本发明显著提高了审批工作流数据的聚类的准确性,更易筛查出其中的异常和风险事件。

技术研发人员:先晓兵,张尔喜,钱心洲,李扬,应文豪
受保护的技术使用者:常熟理工学院
技术研发日:
技术公布日:2024/7/11
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1