异常实体识别方法、装置、设备、存储介质及程序产品与流程

文档序号:29356364发布日期:2022-03-23 00:06阅读:187来源:国知局
异常实体识别方法、装置、设备、存储介质及程序产品与流程

1.本技术涉及知识图谱技术,尤其涉及一种异常实体识别方法、装置、设备、存储介质及程序产品。


背景技术:

2.随着电信网络新型违法犯罪的增多,银行等各类金融机构在办理业务的过程中,需要对客户及其账户等实体进行识别,以确定其是否为异常实体,进而减少交易风险。
3.现目前主要通过将待识别实体的信息与已有异常实体名单进行比对,由工作人员根据待识别实体是否出现在已有异常实体名单中、是否与异常实体存在关联等来识别异常实体。
4.由于人工识别的效率较低、主观性强,且获取异常实体信息的周期较长,导致现目前对异常实体的识别不够及时和准确。且只能确定待识别实体是否为异常实体,无法确定待识别实体在未来成为异常实体的可能性。


技术实现要素:

5.本技术提供一种异常实体识别方法、装置、设备、存储介质及程序产品,用以解决现有技术中对异常实体的识别不够及时和准确。且只能确定待识别实体是否为异常实体,无法确定待识别实体在未来成为异常实体的可能性的技术问题。
6.根据本技术的第一方面,提供一种异常实体识别方法,包括:
7.获取预先构建的包括异常实体和待识别实体的知识图谱,所述知识图谱中包括各实体之间的关联关系及各实体对应的关系数据;
8.根据待识别实体的关系数据计算待识别实体对应的关系强度;
9.根据所述待识别实体对应的关系强度及所述待识别实体与其他实体之间的关联关系计算所述待识别实体的异常疑似度传递系数;
10.根据待识别实体的异常疑似度传递系数确定所述待识别实体的异常疑似度;
11.根据待识别实体的异常疑似度识别所述待识别实体是否为异常实体。
12.根据本技术的第二方面,提供一种异常实体识别装置,包括:
13.获取模块,用于获取预先构建的包括异常实体和待识别实体的知识图谱,所述知识图谱中包括各实体之间的关联关系及各实体对应的关系数据;
14.第一计算模块,用于根据待识别实体的关系数据计算待识别实体对应的关系强度;
15.第二计算模块,用于根据所述待识别实体对应的关系强度及所述待识别实体与其他实体之间的关联关系计算所述待识别实体的异常疑似度传递系数;
16.确定模块,用于根据待识别实体的异常疑似度传递系数确定所述待识别实体的异常疑似度;
17.识别模块,用于根据待识别实体的异常疑似度识别所述待识别实体是否为异常实
体。
18.根据本技术的第三方面,提供一种电子设备,包括:存储器,处理器及收发器;
19.所述存储器,所述处理器及所述收发器电路互连;
20.所述存储器存储计算机执行指令;
21.所述收发器,用于收发数据;
22.所述处理器执行所述存储器存储的计算机执行指令时,以实现如第一方面所述的方法。
23.根据本技术的第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的方法。
24.根据本技术的第五方面,提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面所述的方法。
25.本技术的异常实体识别方法装置、设备、存储介质及程序成品,通过获取预先构建的包括异常实体和待识别实体的知识图谱,所述知识图谱中包括各实体之间的关联关系及各实体对应的关系数据,根据待识别实体的关系数据计算待识别实体对应的关系强度,能够将实体间的关系的紧密程度量化为关系强度,根据所述待识别实体对应的关系强度及所述待识别实体与其他实体之间的关联关系计算所述待识别实体的异常疑似度传递系数,将待识别实体被其他实体影响的程度量化为异常疑似度传递系数,根据待识别实体的异常疑似度传递系数确定所述待识别实体的异常疑似度,将其他实体的异常程度与待识别实体被其他实体影响的程度量化为异常疑似度,确定出待识别实体异常的程度,根据待识别实体的异常疑似度识别所述待识别实体是否为异常实体,能够将异常程度高的待识别实体识别为异常实体,因此,能够确定出待识别实体是否为异常实体以及待识别实体异常的程度。
附图说明
26.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
27.图1是为本技术实施例提供的异常实体识别方法的网络架构图;
28.图2是根据本技术第一实施例提供的异常实体识别方法流程示意图;
29.图3是根据本技术第二实施例提供的异常实体识别方法流程示意图;
30.图4是根据本技术的第三实施例提供的异常实体识别方法流程示意图;
31.图5是根据本技术的第四实施例提供的异常实体识别方法流程示意图;
32.图6是根据本技术的第五实施例提供的异常实体识别方法流程示意图;
33.图7是根据本技术的第六实施例提供的异常实体识别方法流程示意图;
34.图8是根据本技术的第七实施例提供的异常实体识别装置的结构示意图;
35.图9为本技术第八实施例提供的电子设备的框图。
36.通过上述附图,已示出本技术明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本技术构思的范围,而是通过参考特定实施例为本领域技术人员说明本技术的概念。
具体实施方式
37.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
38.首先对本技术所涉及的名词进行解释:
39.知识图谱:由互相有联系的实体、实体属性及实体间的关联关系构成,是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法。
40.实体:是指将客观存在且具有可区别性的某种事物抽象化后的对象。本技术中,实体可以包括客户及其账户。
41.实体属性:是指实体中的特征,例如实体是否为异常实体,实体的名称、归属地、联系方式等信息。
42.实体间的关联关系:是指实体和其他实体之间联系、实体和其他实体之间发生的行为及行为间的联系。示例性地,实体间的关联关系包括:客户持有账户,账户间发生转账,账户向同一账户转账。实体间的关系可以是一对一、一对多、多对一或多对多。
43.关系属性:是指实体间的关联关系所具有的特征或者组成关联关系的成分,一个关联关系可以具有一个关系属性或多个关系属性。
44.异常实体:是指存在异常的实体。本技术中,异常实体包括异常客户和异常账户。
45.关系强度:是指实体间的关联关系的紧密程度。示例性地,关联关系越紧密,关系强度越大。
46.异常疑似度:是对实体异常程度进行的量化评价的值,一般为大于0的实数。
47.异常疑似度传递系数:反应实体之间通过关联关系所能够传递的异常疑似度的比例。
48.下面对本技术所涉及的现有技术进行详细说明及分析。
49.目前,随着电信网络新型违法犯罪的增多,银行等各类金机构在办理业务的过程中,需要对客户及其账户等实体进行识别,以确定客户及其账户是否存在异常情况、是否为异常实体,进而有选择性的办理业务,减少交易风险。
50.现目前主要通过将待识别实体的信息与已有异常实体名单进行比对,由工作人员通过查看待识别实体是否为异常实体名单中的异常实体,或者,由工作人员对待识别实体进行背景调查,通过查看与待识别实体具有紧密关系的实体是否为异常实体名单中的异常实体来对待识别实体进行识别。由于人工识别的效率低、主观性强,在面对实体间复杂的关系时无法准确的判断各个关系之间的影响程度,进而无法对异常实体名单进行实时更新。同时,从第三方获取异常实体名单也无法确保异常实体名单的实时性。这些均导致了现有技术中对异常实体的识别不够及时和准确,且只能确定待识别实体是否为异常实体,无法确定待识别实体的异常疑似度以量化待识别实体异常的程度,无法确定待识别实体在未来成为异常实体的可能性。
51.所以,在面对现有技术中的技术问题时,发明人通过创造性研究的发现,提出本技术的技术方案,旨在解决现有技术的如上技术问题。为了提高对异常实体识别的及时性和准确性,同时确定待识别实体的异常疑似度,需要获取包括异常实体和待识别实体的知识
图谱,将实体异常程度进行量化得到异常疑似度。因此,发明人将实体间的关联关系强弱程度进行量化得到关系强度,通过关系强度确定出两个实体之间的异常疑似度传递系数,并通过异常疑似度传递系数以及知识图谱中已有的异常实体确定出所有待识别实体的异常疑似度,根据所确定的待识别实体的异常疑似度来确定待识别实体是否为异常实体不仅能够确定出待识别实体是否为异常实体,还能够确定出待识别实体的异常疑似度,在待识别实体不是异常实体时,确定其异常的程度。
52.下面对本技术实施例提供的异常实体识别方法的网络架构进行介绍。
53.图1是本技术实施例提供的一种应用场景对应的网络架构图,如图1所示,本技术实施例提供的一种应用场景对应的网络架构中包括:电子设备11和服务器12。电子设备11与服务器12通信连接。服务器12存储有异常实体和待识别实体的知识图谱,知识图谱中包括各实体之间的关联关系及各实体对应的关系数据。
54.其中,在一种应用场景中,电子设备11可以向服务器12发送知识图谱获取请求,服务器12可以向电子设备11发送包括异常实体和待识别实体的知识图谱。电子设备在接收到知识图谱后,可以根据待识别实体的关系数据计算待识别实体对应的关系强度,根据待识别实体对应的关系强度及待识别实体与其他实体之间的关联关系计算待识别实体的异常疑似度传递系数,根据待识别实体的异常疑似度传递系数确定待识别实体的异常疑似度,并根据待识别实体的异常疑似度识别待识别实体是否为异常实体。
55.在另一种应用场景中,电子设备11中搭载异常实体识别应用软件的客户端或电子设备11访问到异常实体识别方法的网址。用户通过打开异常实体识别应用软件的客户段,在客户端的操作界面中触发异常实体识别请求。或者,用户通过在电子设备搭载的搜索引擎中输入异常实体识别方法对应的网址访问到对应的网页页面,并在网页页面上触发异常实体识别请求。异常实体识别请求中可以包括判断一个或多个实体是否为异常实体或获取一个或多个实体的异常疑似度。在用户触发异常实体识别请求后,电子设备11接收用户触发的异常实体识别请求。电子设备可以在接收用户触发的异常实体识别请求前或接收用户触发的异常实体识别请求后向服务器12发送知识图谱获取请求并接收服务器发送的知识图谱。用户可以是需要进行异常实体识别的金融机构的业务员、需要获取异常实体和待识别实体的异常疑似度的单位或机关的业务员等。
56.在电子设备确定待识别实体的异常疑似度,并根据待识别实体的异常疑似度识别待识别实体是否为异常实体后,可以将异常实体识别请求中的一个或多个实体依次与待识别实体或异常实体进行对应,以判断一个或多个实体是否为异常实体,或确定一个或多个实体的异常疑似度,并实时显示在异常实体识别应用软件的客户端操作界面或网页页面中,使用户能够实时查看到一个或多个实体是否为异常实体,并且还可显示一个或多个实体的异常疑似度,使用户能够实时查看到一个或多个实体对应的异常疑似度。
57.下面以具体地实施例对本技术的技术方案以及本技术的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。本发明实施例的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
58.以下将参照附图来具体描述本技术的实施例。
59.实施例一
60.图2是根据本技术第一实施例提供的异常实体识别方法流程示意图,如图2所示,本技术的执行主体为异常实体识别装置。该异常实体识别装置位于电子设备中。本实施例提供的异常实体识别方法包括以下几个步骤。
61.步骤201,获取预先构建的包括异常实体和待识别实体的知识图谱,知识图谱中包括各实体之间的关联关系及各实体对应的关系数据。
62.本实施例中,电子设备可以定期向服务器发送知识图谱获取请求,并接收服务器发送的知识图谱。电子设备也可以直接被设置为定期接收服务器发送的知识图谱。知识图谱为预先构建的包括异常实体和待识别实体的知识图谱,知识图谱中包括各实体之间的关联关系及各实体对应的关系数据。本实施例中,实体可以是客户或账户。实体之间的关联关系是指实体和实体之间的某种联系,这种联系可以是实体属性间的联系,如属性相同,实体的成分联系,如成分相同,实体行为上的联系,如同时发生某种行为。
63.示例性的,若客户同为一家企业的员工,则这些客户之间具有同事关系,若两客户为夫妻,则这两客户间具有夫妻关系,若客户持有账户,则客户与账户间具有持有关系,若某些账户在同一时间或一段时间内使用办理同一金融业务,则这些账户间具有同时办理同一业务关系,若两个账户之间发生过交易,则这两个账户之间具有交易关系。关联关系可以包括家庭关系、共用联系方式、具有共同联系人、邮件关系、通话关系、上下级关系、交易、借贷、共用物理地址(mac地址)、共用互联网协议地址(ip地址)、同时或相近时间内共同电话进线等。
64.实体对应的关系数据包括与该实体具有关联关系的其他实体以及所具有的关联关系。
65.本实施例中,可以通过以下步骤预先构建知识图谱:获取银行等金融机构多年积累的客户数据、账户数据和交易数据;对客户数据和账户数据进行实体抽取,将客户和账户确定为实体;对客户数据、账户数据和交易数据进行属性抽取,得到实体属性,实体属性可以包括客户信息和账户信息,客户信息可以包括客户归属地、客户联系方式、客户姓名、客户持有的账户等,账户信息可以包括账户开始时间、账户开户机构和账户交易信息等,账户交易信息可以包括交易时间、交易金额、交易ip地址等。通过比对不同实体间的实体属性得到实体间关联关系,示例性地,开户机构为同一机构的属性具有关联关系;基于实体和实体间关联关系,将实体与实体间关联关系进行匹配,构建知识图谱并形成各实体对应的关系数据。
66.步骤202,根据待识别实体的关系数据计算待识别实体对应的关系强度。
67.本实施例中,为了便于描述,将与待识别实体存在关联关系的其他实体简称为关联实体。
68.待识别实体的关系数据包括:关联实体以及待识别实体与关联实体之间的关联关系。
69.关系强度是指实体跟与其他实体之间的关系联系的紧密程度,可以是一个关联关系的紧密程度量化后的值,也可以是所有关联关系的紧密程度量化后的值的集合。
70.待识别实体对应的关系强度是指待识别实体与关联实体间的关系强度。本实施例中,可以预先对所有可能的关联关系设置不同的属性值,从待识别实体的关系数据中确定
关联实体以及待识别实体与关联实体间的关联关系,并在预设的关联关系的属性值中查询待识别实体与关联实体的关联关系的属性值,若确定关联关系的数量为1,则将该关联关系的属性值作为待识别实体对应的关系强度,若确定关联关系的数量为多个,则将所有关联关系的所有属性值的集合作为待识别实体对应的关系强度。
71.除了上述实施方式之外,还可以使用其他方式计算待识别实体的关系强度,本实施例对此不做限定。
72.步骤203,根据待识别实体对应的关系强度及待识别实体与其他实体之间的关联关系计算待识别实体的异常疑似度传递系数。
73.待识别实体的异常疑似度传递系数是指待识别实体与关联实体之间的异常疑似度传递系数。本实施例中,在步骤202之后,能够得到待识别实体与所有关联实体的关系强度,若得到的关系强度为1个值,待识别实体的异常疑似度传递系数可以为:该值;若得到的关系强度为多个值的集合,待识别实体的异常疑似度传递系数可以为:该集合中所有值的平均值。
74.除了上述实施方式之外,还可以使用其他方式计算待识别实体的异常疑似度传递系数,本实施例对此不做限定。
75.步骤204,根据待识别实体的异常疑似度传递系数确定待识别实体的异常疑似度。
76.本实施例中,在异常实体识别方法第一次进行时,可以设置所有异常实体的异常疑似度为srmax,所有待识别实体的异常疑似度为0。在异常实体识别方法的非第一次进行时,可以设置异常实体的异常疑似度为srmax,待识别实体的异常疑似度为上一次异常实体识别方法确定的异常疑似度,也可以重新置0。
77.具体地,可以使用待识别实体的异常疑似度传递系数与关联实体的异常疑似度进行乘法运算,并运算结果记为待识别实体的异常疑似度。在待识别实体具有多个关联实体时,可以使用待识别实体与多个关联实体之间的异常疑似度传递系数分别与多个关联实体作乘法运算,并将多个运算结果求和后记为待识别实体的异常疑似度。
78.步骤205,根据待识别实体的异常疑似度识别待识别实体是否为异常实体。
79.本实施例中,可以预设疑似度阈值,判断待识别实体的异常疑似度是否大于该预设疑似度阈值,若确定大于预设疑似度阈值则,则确定待识别实体为异常实体;若确定不大于预设疑似度阈值,则确定待识别实体不是异常实体。可选地,预设疑似度阈值可以是异常实体的异常疑似度的预定比例,示例性地,预设疑似度阈值为异常实体的异常疑似度的90%。
80.本实施例提供的异常实体识别方法,通过获取预先构建的包括异常实体和待识别实体的知识图谱,知识图谱中包括各实体之间的关联关系及各实体对应的关系数据,根据待识别实体的关系数据计算待识别实体对应的关系强度,根据待识别实体对应的关系强度及待识别实体与其他实体之间的关联关系计算待识别实体的异常疑似度传递系数,根据待识别实体的异常疑似度传递系数确定待识别实体的异常疑似度,根据待识别实体的异常疑似度识别待识别实体是否为异常实体。本技术提供的异常实体识别方法,能够计算出待识别实体与其他实体之间的关系强度,关系强度能够量化反应实体间关联关系的强弱程度,通过将关系强度作为异常疑似度传递系数,计算出待识别实体的异常疑似度,并通过异常疑似度来确定待识别实体是否为异常实体,不仅能够确定待识别实体是否为异常实体,还
能够将实体异常的程度进行量化,以确定待识别实体在未来成为异常实体的可能性。从实际经验可以得知,异常实体之间通常具有较为紧密的关联关系,例如,具有亲属关系、朋友关系、共用物理地址等。因此,通过对关联关系进行量化,并根据待识别实体的所有关联实体的异常疑似度确定的待识别实体的异常疑似度,能够得到待识别实体异常的程度,进而确定待识别实体在未来成为异常实体的可能性。
81.实施例二
82.图3是根据本技术第二实施例提供的异常实体识别方法流程示意图,如图3所示,本实施例提供的异常实体识别方法在实施例一提供的异常实体识别方法的基础上,步骤201中,关系数据包括固定类关系数据和行为类关系数据。
83.步骤202根据待识别实体的关系数据计算待识别实体对应的关系强度细化为步骤301至步骤302。
84.步骤301,分别计算固定类关系数据和行为类关系数据对应的关系强度。
85.固定类关系数据包括待识别实体与关联实体的所有固定关联关系。行为类关系数据包括待识别实体与关联实体的所有行为关联关系。具体地,从待识别实体的关系数据中获取待识别实体与关联实体的所有关联关系,并一一确定每一个关联关系为固定关联关系或行为关联关系。固定关联关系是指实体间的关联关系,行为关联关系是指实体行为间的关联关系。示例性地,上下级、夫妻等为实体间的关联关系,为固定关联关系;通话、借贷、共用物理地址等为实体行为间的关联关系,为行为关联关系。
86.可以将每一个固定关联关系预先设置的属性值的平均值作为固定类关系数据的关系强度。
87.可以将每一个行为关联关系的属性值与该行为的权重的加权平均值作为行为类关系数据的关系强度。行为关联关系的属性值可以通过将该关联关系的关系属性中最能够代表该关联关系的属性的值量纲化得到。示例性地,选取借贷关系中的借贷的金额值为借贷的属性值。行为的权重可以根据异常实体识别方法的不同应用场景预先设置。示例性地,待识别实体与关联实体的行为类关系数据包括借贷和通话,预先设置借贷关系的权重为第一权重、通话关系的权重为第二权重,将借贷的金额量纲化后作为借贷关系的属性值,将通话的次数量纲化后作为通话关系的属性值,则行为类关系数据的关系强度为:(借贷关系的属性值
×
第一权重+通话关系的属性值
×
第二权重)/2。
88.步骤302,将固定类关系数据对应的关系强度和行为类关系数据对应的关系强度进行求和,以获得待识别实体对应的关系强度。
89.具体地,将待识别实体与关联实体的固定类关系数据对应的关系强度和行为类关系数据对应的关系强度进行求和,将求和后的值作为待识别实体与关联实体对应的关系强度。
90.本实施例中,通过分别计算固定类关系数据和行为类关系数据对应的关系强度后求和,能够得到更准确的反应实体间的关系强弱程度的关系强度,进而获得更准确的实体间的异常疑似度传递系数,以获得更准确的实体的异常疑似度。
91.实施例三
92.图4是根据本技术的第三实施例提供的异常实体识别方法流程示意图,如图4所示,本实施例提供的异常实体识别方法在实施例二的提供的异常实体识别方法的基础上,
步骤301细化包括步骤401至步骤402。
93.步骤401,获取固定类关系数据的每个固定关联关系的关系强度。
94.具体地,可以预先设置所有可能的固定关联关系的关系强度,并查找固定类关系数据中每个关联关系的关系强度。
95.步骤402,根据每个固定关联关系对应的关系强度计算固定类关系数据对应的关系强度。
96.具体地,可以挑取关系强度大于预定值的固定关联关系,并将挑选出的固定关联关系的关系强度的集合作为固定类关系数据对应的关系强度。也可以将所有固定关联关系的关系强度的值形成集合,并将该集合作为固定类关系数据对应的关系强度。
97.作为一种可选的实施方式,步骤402细化包括步骤4021至步骤4023。
98.步骤4021,确定每个固定关联关系的属性的数量。
99.具体地,可以直接在关系数据中查询每个固定关联关系的属性,统计查询到的属性的数量。
100.步骤4022,若确定属性的数量为一个,将属性的量化分值作为固定关联关系的关系强度。
101.若确定固定关联关系的属性数量为一个,即该固定关联关系只有一个属性,那么,直接将该属性的量化分值作为固定关联关系的关系强度。属性的量化分值可以通过预设的量化方法属性进行量化得到。对与不同的固定关联关系,可以预设不同的量化方法对其属性进行量化。
102.步骤4023,若确定属性的数量为多个,将关键属性的量化分值作为固定关联关系的关系强度;
103.若确定固定关联关系的属性数量为多个,可以选取其关键属性的量化分值作为固定关联关系的关系强度。对于具有多个属性的固定关联关系,可以根据异常实体识别的场景预先设置其关键属性。示例性地,夫妻关系具有亲密度、婚姻持续时间等多个属性,预先设置亲密度为其关键属性,则其关系强度为亲密度的量化分值。
104.除了上述实施方式之外,还可以使用其他方式计算固定类关系数据对应的关系强度,本实施例对此不做限定。
105.本实施例中,通过预先设置固定关联关系的量化分值,确定固定类关联关系的关系强度,使得关系强度能够更准确的反应实体间的联系的紧密程度,进而,使得后续确定的异常疑似度传递系数和异常疑似度更准确,提高确定待识别实体是否为异常实体的准确度。
106.实施例四
107.图5是根据本技术的第四实施例提供的异常实体识别方法流程示意图,如图5所示,本实施例提供的异常实体识别方法在实施例二提供的异常实体识别方法的基础上,步骤301细化包括步骤501至步骤502。
108.步骤501,确定行为类关系数据的每个行为关联关系对应的属性、时间衰减系数、属性的量化分值以及属性权重。
109.在各实体对应的关系数据中查询每个行为关联关系具有的属性以确定每个行为关联关系对应的属性。每个行为关联关系对应的属性可以为一个或多个。
110.在各实体对应的关系数据中查询每个行为关联关系发生的时间,并根据发生的时间确定时间衰减系数。时间衰减系数可以通过预设的时间衰减函数计算得出,预设的时间衰减函数可以为线性函数、指数函数、高斯函数等。通过查询每个等级的行为类关系数据发生的时间,以当前时间为参考,使得和当前时间间隔越久发生的关联关系的时间衰减系数越大,和当前时间间隔越短发生的关联关系的时间衰减系数越小。时间衰减系数可以为0至1之间的数。示例性地,获取时间衰减函数为e-α
×
t
,其中e为自然常数,α为时间衰减率。α可以是预先设置的数,用于调节时间衰减系数随时间变化的速率。t为行为发生时间与当前时间的间隔时长,t可以为当前时间减去行为发生时间后的天数,如果计算结果小于0,则取0。进一步地,t还可以为当前时间减去行为发生时间后的天数再减去偏移修正时长,偏移修正时长用于设置一个行为类关系数据的时间衰减系数不进行衰减的时间范围,示例性地,设置最近3天发生的关联关系的时间衰减系数不进行衰减,偏移修正时长的值为3天。
111.对每个行为关联关系具有的属性进行量纲化以获得属性的量化分值。由于行为关联关系中各属性的单位存在差异,同一属性中的值计算出来也可能差距很大,不利于后续计算。示例性地,借贷关系中的金额属性,每次借贷的金额可能差距很大。因此,需要对行为关联关系具有的属性进行量纲化,例如,归一化,在使数字不是去相对意义的前提下,方面后续的计算。例如,将借贷关系中所有的金额值压缩在0到1的范围。
112.对于不同的行为关联关系,属性权重可以根据需要进行异常实体识别的不同场景来预先设置或者在异常实体识别方法的过程中训练得到。
113.步骤502,根据每个行为关联关系对应的属性、时间衰减系数、属性的量化分值以及属性权重确定每个行为关联关系对应的关系强度。
114.可以将每个行为关联关系对应的属性、时间衰减系数、属性的量化分值以及属性的权重进行乘法运算,将乘积作为该行为关联关系的关系强度。
115.本实施例中,对于只具有一个属性的行为关联关系,可以将其属性的量化分值与时间衰减系数的乘积作为该行为关联关系的关系强度。对于具有多个属性的行为关联关系,可以将其每个属性的量化分值、属性的权重与时间衰减系数的乘积的平均值作为该行为关联关系的关系强度。
116.步骤503,求取所有行为关联关系对应的关系强度,以获得行为类关系数据对应的关系强度。
117.本实施例中,行为类关系数据只有一个行为关联关系时,该行为关联关系的关系强度为行为类关系数据对应的关系强度。行为类关系数据有多个行为关联关系时,将所有行为关联关系的关系强度的集合作为行为类关系数据对应的关系强度。
118.作为一种可选的实施方式,步骤502细化包括步骤5021。
119.步骤5021,将每个行为关联关系对应的属性、时间衰减系数、属性的量化分值以及属性权重进行乘法运算,以获得每个行为关联关系对应的关系强度。
120.本实施例中,每个行为关联关系对应的关系强度可以是该行为关联关系的每个属性对应的关系强度的和。每个属性对应的关系强度可以是:该属性的量化分值
×
该属性的权重
×
时间衰减系数。
121.本实施例中,通过计算行为类关系数据中每个行为关联关系对应的关系强度,将行为类关系数据对应的关系强度与固定类关系数据对应的关系强度分别计算,使得关系强
度能够更准确的反应实体间的联系的紧密程度,进而,使得后续确定的异常疑似度传递系数和异常疑似度更准确,提高确定待识别实体是否为异常实体的准确度。同时,对于每个行为关联关系,对其每个属性对应的关系强度分别计算,使得行为类关系数据对应的关系强度更加准确。
122.实施例五
123.图6是根据本技术的第五实施例提供的异常实体识别方法流程示意图,如图6所示,本实施例提供的异常实体识别方法在上述任意一个实施例的基础上,步骤203细化为步骤601至步骤603。
124.步骤601,根据待识别实体与其他实体之间的关联关系确定关系权重。
125.本实施例中,具体地,确定待识别实体与其他实体之间的是否存在关联关系,若确定存在关联关系,则确定所有关联关系的关系权重。任意一个关联关系的关系权重可以是根据关联关系的不同预先设置的,具体地,可以根据异常实体识别方法应用的不同场景来预先设置每一个可能的关联关系的权重。
126.步骤602,若确定待识别实体与其他一个实体之间具有关联关系,则计算待识别实体对应的关系强度与关系权重的乘积的平均值,以获得待识别实体的异常疑似度传递系数。
127.待识别实体的异常疑似度传递系数为待识别实体与关联实体间的异常疑似度传递系数。具体地,若确定待识别实体与其他一个实体之间具有关联关系,待识别实体的异常疑似度传递系数为:所有关系数据对应的关系强度与每个关联关系对应的权重的乘积的平均值,具体地,由于关系数据对应的关系强度中包括多个关联关系对应的关系强度,可以将每个关联关系对应的关系强度与该关联关系对应的权重做乘法运算得到乘积,将所有乘积的平均值作为待识别实体的异常疑似度传递系数。
128.步骤603,若确定待识别实体与其他实体之间具有多个关联关系,则计算待识别实体对应的关系强度与所有关系权重的乘积的平均值,以获得待识别实体的异常疑似度传递系数。
129.若确定待识别实体与其他实体之间具有多个关联关系,待识别实体的异常疑似度传递系数为:待识别实体与所有关联实体之间的异常疑似度传递系数的集合,对于待识别实体与每一个关联实体之间的异常疑似度传递系数,可以使用步骤602中的方法得到。本实施例中,通过对不同的关联关系预先设置不同的权重,以获得不同的情况下,待识别实体的异常疑似度传递系数,使得异常实体识别方法能够适用于不同的应用场景。
130.实施例六
131.图7是根据本技术的第六实施例提供的异常实体识别方法流程示意图,如图7所示,本实施例提供的异常实体识别方法在上述任意一个实施例的基础上,步骤204细化为步骤701至步骤702。
132.步骤701,确定与待识别实体存在关联关系的上游待识别实体的数量。
133.本实施例中,可以从待识别实体的关系数据中确定与其存在关联关系的上游待识别实体,将与待识别实体存在关联关系的所有其他实体均作为上游待识别实体。
134.步骤702,若确定上游待识别实体为一个,则确定上游待识别实体的异常疑似度。
135.若确定上游待识别实体为一个,则确定上游待识别实体的异常疑似度,当上游实
体为异常实体时,确定上游实体的异常疑似度为srmax,当上游实体为待识别实体时,确定上游实体的异常疑似度为0或这为上一次确定出的异常疑似度。
136.步骤703,根据上游待识别实体对应的异常疑似度及待识别实体的异常疑似度传递系数确定待识别实体的异常疑似度。
137.具体地,将上游待识别实体对应的异常疑似度与待识别实体的异常疑似度传递系数的乘积确定为待识别实体的异常疑似度。
138.作为一种可选的实施方式,在上述任意一个实施例的基础上,步骤204还包括步骤711至步骤713。
139.步骤711,若确定上游待识别实体为多个,则确定多个上游待识别实体的异常疑似度。
140.具体地,每个上游待识别实体的异常疑似度可以使用步骤702中的方法确定。
141.步骤712,计算多个上游待识别实体对应的异常疑似度与待识别实体的异常疑似度传递系数的乘积。
142.具体地,计算每个上游待识别实体对应的异常疑似度与待识别实体的异常疑似度传递系数中该上游待识别实体的异常疑似度传递系数的乘积。
143.步骤713,将多个乘积的和确定为待识别实体的异常疑似度。
144.根据步骤702,得到待识别实体与从每个上游实体处传递得来的异常疑似度,将待识别实体从所有上游实体处传递得来的异常疑似度求和,得到待识别实体的异常疑似度。即,求取每个上游待识别实体对应的异常疑似度与待识别实体的异常疑似度传递系数中该上游待识别实体的异常疑似度传递系数的乘积的和作为待识别实体的异常疑似度。
145.作为一种可选的实施方式,在上述任意一个实施例的基础上,步骤205细化为步骤2051至步骤2052。
146.步骤2051,判断待识别实体的异常疑似度是否大于或等于异常实体对应的异常疑似度。
147.步骤2052,若确定待识别实体的异常疑似度大于或等于异常实体对应的异常疑似度,则确定待识别实体为异常实体。
148.本实施例中,可以设置异常实体对应的异常疑似度为srmax,在步骤204之后,能够得到待识别实体的异常疑似度,判断待识别实体的异常疑似度是否大于或等于异常实体对应的异常疑似度,若确定待识别实体的异常疑似度大于或等于异常实体对应的异常疑似度,则确定待识别实体为异常实体,同时,可以将确定为异常实体的异常疑似度设置为srmax。
149.作为一种可选的方案,对于被确定为异常实体的待识别实体,还可以加入审核环节,对其是否为异常实体进行进一步确定
150.本实施例通过待识别实体与上游待识别实体的关联关系,确定出待识别实体的异常疑似度,能够确定出知识图谱中所有待识别实体的异常疑似度,同时,根据确定出的待识别实体的异常疑似度判断待识别实体是否为异常实体,不需要工作人员对待识别实体进行识别,不依赖工作人员的主观识别,能够提高对异常实体识别的及时度和准确度。
151.实施例七
152.图8是根据本技术第七实施例提供的异常实体识别装置的结构示意图,如图8所
示,本实施例提供的异常实体识别装置位于电子设备中。该异常实体识别装置80包括:获取模块801,第一计算模块802,第二计算模块803,确定模块804,识别模块805。
153.其中,获取模块801用于获取预先构建的包括异常实体和待识别实体的知识图谱,知识图谱中包括各实体之间的关联关系及各实体对应的关系数据;第一计算模块802,用于根据待识别实体的关系数据计算待识别实体对应的关系强度;第二计算模块803,用于根据待识别实体对应的关系强度及待识别实体与其他实体之间的关联关系计算待识别实体的异常疑似度传递系数;确定模块804,用于根据待识别实体的异常疑似度传递系数确定待识别实体的异常疑似度;识别模块805,用于根据待识别实体的异常疑似度识别待识别实体是否为异常实体。
154.本实施例提供的异常实体识别装置可以执行上述实施例一提供的异常实体识别方法。具体的实现方式与原理类似,不再一一赘述。
155.可选地,本实施例提供的异常实体识别装置,获取模块801所获取的各实体对应的关系数据包括固定类关系数据和行为类关系数据,第一计算模块802具体用于,分别计算固定类关系数据和行为类关系数据对应的关系强度;将固定类关系数据和行为类关系数据对应的关系强度进行求和,以获得待识别实体对应的关系强度
156.可选地,本实施例提供的异常实体识别装置,第一计算模块802具体用于,获取固定类关系数据的每个固定关联关系的关系强度;根据每个固定关联关系的关系强度计算固定类关系数据对应的关系强度。
157.可选地,本实施例提供的异常实体识别装置,第一计算模块802具体用于,确定每个固定关联关系的属性的数量;若确定属性的数量为一个,将属性的量化分值作为固定关联关系的关系强度;若确定属性的数量为多个,将关键属性的量化分值作为固定关联关系的关系强度。
158.可选地,本实施例提供的异常实体识别装置,第一计算模块802具体用于,确定行为类关系数据的每个行为关联关系对应的属性、时间衰减系数、属性的量化分值以及属性权重;根据每个行为关联关系对应的属性、时间衰减系数、属性的量化分值以及属性权重确定每个行为关联关系对应的关系强度;求取所有行为关联关系对应的关系强度,以获得行为类关系数据对应的关系强度。
159.可选地,本实施例提供的异常实体识别装置,第一计算模块802具体用于,将每个行为关联关系对应的属性、时间衰减系数、属性的量化分值以及属性权重进行乘法运算,以获得每个行为关联关系对应的关系强度。
160.可选地,本实施例提供的异常实体识别装置,第二计算模块803具体用于,确定待识别实体与其他实体之间的关联关系以及关联关系的关系权重;若确定待识别实体与其他实体之间具有一个关联关系,则计算待识别实体对应的关系强度与关系权重的乘积的平均值,以获得待识别实体的异常疑似度传递系数;若确定待识别实体与其他实体之间具有多个关联关系,则计算待识别实体对应的关系强度与所有关系权重的乘积的平均值,以获得待识别实体的异常疑似度传递系数。
161.可选地,本实施例提供的异常实体识别装置,确定模块804具体用于,确定与待识别实体存在关联关系的上游待识别实体的数量;若确定上游待识别实体为一个,则确定上游待识别实体的异常疑似度;根据上游待识别实体对应的异常疑似度及待识别实体的异常
疑似度传递系数确定待识别实体的异常疑似度。
162.可选地,本实施例提供的异常实体识别装置,若确定上游待识别实体为多个,则确定模块804具体用于,确定多个上游待识别实体的异常疑似度;计算多个上游待识别实体对应的异常疑似度与待识别实体的异常疑似度传递系数的乘积;将多个乘积的和确定为待识别实体的异常疑似度。
163.可选地,本实施例提供的异常实体识别装置,识别模块805具体用于,判断待识别实体的异常疑似度是否大于或等于异常实体对应的异常疑似度;若确定待识别实体的异常疑似度大于或等于异常实体对应的异常疑似度,则确定待识别实体为异常实体。
164.本实施例提供的异常实体识别装置可以执行上述实施例二至实施例六任一个实施例提供的异常实体识别方法。具体的实现方式与原理类似,不再一一赘述
165.实施例八
166.图9为本技术第八实施例提供的电子设备的框图,如图8所示,本实施例提供的电子设备90包括存储器91,处理器92及收发器93。
167.其中,存储器91,处理器92及收发器93电路互连。
168.存储器91存储计算机执行指令。
169.收发器93,用于收发数据。
170.处理器92执行存储器91存储的计算机执行指令时,以实现任意一个实施例提供的异常实体识别方法。
171.相关说明可以对应参见任意一个实施例提供的异常实体识别方法的步骤所对应的相关描述和效果进行理解,此处不做过多赘述。
172.其中,电子设备90还可以包括其他部件,本实施例中对此不作限定。
173.本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如任意一个实施例提供的异常实体识别方法。
174.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本技术所必须的。
175.进一步需要说明的是,虽然流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
176.应该理解,上述的装置实施例仅是示意性的,本技术的装置还可通过其它的方式实现。例如,上述实施例中单元/模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如,多个单元、模块或组件可以结合,或者可以集成到另一个系统,或一
些特征可以忽略或不执行。
177.另外,若无特别说明,在本技术各个实施例中的各功能单元/模块可以集成在一个单元/模块中,也可以是各个单元/模块单独物理存在,也可以两个或两个以上单元/模块集成在一起。上述集成的单元/模块既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
178.集成的单元/模块如果以硬件的形式实现时,该硬件可以是数字电路,模拟电路等等。硬件结构的物理实现包括但不局限于晶体管,忆阻器等等。若无特别说明,人工智能处理器可以是任何适当的硬件处理器,比如cpu、gpu、fpga、dsp和asic等等。若无特别说明,存储单元可以是任何适当的磁存储介质或者磁光存储介质,比如,阻变式存储器rram(resistive random access memory)、动态随机存取存储器dram(dynamic random access memory)、静态随机存取存储器sram(static random-access memory)、增强动态随机存取存储器edram(enhanced dynamic random access memory)、高带宽内存hbm(high-bandwidth memory)、混合存储立方hmc(hybrid memory cube)等等。
179.集成的单元/模块如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
180.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本技术的其它实施方案。本技术旨在涵盖本技术的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本技术的一般性原理并包括本技术未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本技术的真正范围和精神由下面的权利要求书指出。
181.应当理解的是,本技术并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本技术的范围仅由所附的权利要求书来限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1