一种特征库更新方法和系统与流程

文档序号:21460787发布日期:2020-07-14 16:34阅读:425来源:国知局
一种特征库更新方法和系统与流程

本发明属于计算机数据处理系统,涉及一种特征库更新方法和系统。



背景技术:

计算机数据系统中,需要用到特征库。

当出现特征库部分样本的特征异常时,传统的修复方式为重新计算异常样本的所有特征并更新。一方面影响更新的效率、另一方面很容易将非异常部分的特征覆盖。



技术实现要素:

本发明所要解决的技术问题是提供一种特征库更新方法和系统。

本发明解决上述技术问题所采取的技术方案如下:

一种特征库更新方法,包括:

对特征库中的特征进行分组,形成多个特征组;

对特征组进行拆分,并将每个特征组中的算子做成独立的部分;

当出现特征库的样本异常时,

根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算。

优选的是,将每个特征组中的算子做成独立的部分,包括:

根据用户基础信息特征组算子,行为特征组算子形成不同的算子。

优选的是,各个算子之间相互独立。

优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,具体包括:

根据异常特征,提取汇总涉及到的特征组算子列表,未发生异常的特征组不作考虑。

优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算后,还包括:

根据计算后的特征组更新特征库,由此实现特征库的精细化更新。

一种特征库更新系统,包括:

对特征库中的特征进行分组,形成多个特征组;

对特征组进行拆分,并将每个特征组中的算子做成独立的部分;

当出现特征库的样本异常时,

根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算。

优选的是,将每个特征组中的算子做成独立的部分,包括:

根据用户基础信息特征组算子,行为特征组算子形成不同的算子。

优选的是,各个算子之间相互独立。

优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,具体包括:

根据异常特征,提取汇总涉及到的特征组算子列表,未发生异常的特征组不作考虑。

优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算后,还包括:

根据计算后的特征组更新特征库,由此实现特征库的精细化更新。

本发明将特征组的计算进行了拆分,仅针对异常特征组进行重新计算,从而实现仅仅对有异常的特征进行更新的需求。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

下面结合附图对本发明进行详细的描述,以使得本发明的上述优点更加明确。其中,

图1是本发明特征库更新方法的实施例的示意图。

具体实施方式

以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。

另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

实施例一:

如图1所示,本发明设计了一种特征库更新方法,包括:

对特征库中的特征进行分组,形成多个特征组;

对特征组进行拆分,并将每个特征组中的算子做成独立的部分;

当出现特征库的样本异常时,

根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算。

优选的是,将每个特征组中的算子做成独立的部分,包括:

根据用户基础信息特征组算子,行为特征组算子形成不同的算子。

优选的是,各个算子之间相互独立。

优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,具体包括:

根据异常特征,提取汇总涉及到的特征组算子列表,未发生异常的特征组不作考虑。

优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算后,还包括:

根据计算后的特征组更新特征库,由此实现特征库的精细化更新。

本发明将特征组的计算进行了拆分,仅针对异常特征组进行重新计算,从而实现仅仅对有异常的特征进行更新的需求。

实施例二:

进一步结合实施例进行说明,具体来说,本发明首先将特征组的计算进行了拆分,仅针对异常特征组进行重新计算;其次通过指定特征的更新列表,从而实现仅仅对有异常的特征进行更新的需求。

具体包括:

1、特征组算子拆分。将每个特征组的算子做成独立的部分,例如:用户基础信息特征组算子,行为特征组算子等等。各个算子之间项目独立。

2、对异常特征组重新计算。当出现样本库异常时,根据异常特征,提取汇总涉及到的特征组算子列表,未发生异常的特征组不作考虑。然后将提取出的异常特征组进行重新计算。

3、更新特征库。使用步骤2中计算出的特征组结果来更新样本库,此时注意只更新异常的特征,防止为未发生异常的特征被修改,产生异常。

本发明具有以下的有益效果:

1、通过特征组算子的拆分,降低了修复特征异常时的计算成本。

2、通过近更新异常特征,保证了非异常特征的正确性。

实施例三:

与上述方法实施例相对应,本发明还提供了一种特征库更新系统,包括:

对特征库中的特征进行分组,形成多个特征组;

对特征组进行拆分,并将每个特征组中的算子做成独立的部分;

当出现特征库的样本异常时,

根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算。

优选的是,将每个特征组中的算子做成独立的部分,包括:

根据用户基础信息特征组算子,行为特征组算子形成不同的算子。

优选的是,各个算子之间相互独立。

优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,具体包括:

根据异常特征,提取汇总涉及到的特征组算子列表,未发生异常的特征组不作考虑。

优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算后,还包括:

根据计算后的特征组更新特征库,由此实现特征库的精细化更新。

本发明将特征组的计算进行了拆分,仅针对异常特征组进行重新计算,从而实现仅仅对有异常的特征进行更新的需求。

需要说明的是,对于上述方法实施例而言,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。

而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1