本发明涉及大数据和人工智能,更具体地涉及一种收入计算方法、装置、电子设备和介质。
背景技术:
1、在金融机构的授信审批流程中,贷款识别和关联交易的认定是计算客户收入的重要环节。然而,上述两个过程通常依赖人工主观判断,这种主观性判断容易受到个人经验和偏见的影响,导致在多级审批流程中,不同层级的审批人员可能会对同一交易记录产生不同的认定结果。同时,客户交易记录通常包含大量的交易条目,手工处理交易数据耗时耗力,容易引发错误和疏漏。
2、可见,这种主观性和多级审批的过程可能会导致审批效率低下和审批结果的不一致,同时会消耗大量的人力资源。
技术实现思路
1、鉴于上述问题,根据本发明的第一方面,提供了一种收入计算方法,所述方法包括:获取目标交易流水,其中,所述目标交易流水包括目标客户信息、转入方信息、交易附言和交易金额;将所述交易附言和所述交易金额输入预先构建的贷款识别模型以判断所述目标交易流水是否为贷款,输出贷款识别结果;基于所述目标客户信息,获取对应的目标客户关联方知识图谱,其中,所述目标客户关联方知识图谱中包括多个实体和多个边,所述实体表示为目标客户和目标客户的关联方,所述边表示为所述目标客户和所述目标客户的关联方之间的控股关系、往来资金关系和法人关系;利用所述目标客户关联方知识图谱对所述转入方信息进行遍历,获取关联交易识别结果;以及基于所述贷款识别结果和所述关联交易识别结果,获得所述目标交易流水的收入。
2、根据一些示例性实施例,预先构建贷款识别模型,具体包括:获取历史交易流水信息,其中,所述历史交易流水信息包括历史交易所属行业、历史交易附言、历史贷款识别人员和历史贷款认定结果;对所述历史交易所属行业、历史交易附言、历史贷款识别人员和所述历史贷款认定结果进行分组聚合,获得分组聚合结果;基于所述分组聚合结果,获取每个分组对应的历史贷款认定总次数;以及利用所述分组聚合结果和所述历史贷款认定总次数,构建所述贷款识别模型。
3、根据一些示例性实施例,在所述对所述历史交易所属行业、历史交易附言、历史贷款识别人员和所述历史贷款认定结果进行分组聚合,获得分组聚合结果之前,所述方法还包括:对所述历史交易附言进行自然语言处理和专家规则处理,获取关联历史交易附言,其中,所述关联历史交易附言之间的相似度高于预设的第一阈值;将所述关联历史交易附言映射为标准化词汇;以及利用映射后的关联历史交易附言更新所述历史交易附言。
4、根据一些示例性实施例,所述利用所述分组聚合结果和所述历史贷款认定总次数,构建所述贷款识别模型,具体包括:利用决策树模型构建所述贷款识别模型,其中,所述贷款识别模型包括n个决策树子模型,每个子模型对应所述分组聚合结果中的一种分组,n为正整数;所述将所述交易附言和所述交易金额输入预先构建的贷款识别模型以判断所述目标交易流水是否为贷款,输出贷款识别结果,具体包括:将所述交易附言匹配所述历史交易附言,以获取所述目标交易流水对应的决策树子模型;基于所述交易附言和所述交易金额提取目标特征;从根节点开始,根据所述目标特征的特征值沿所述对应的决策树子模型的分支向下遍历;在每个节点上,根据所述特征值的条件,选择对应的子节点,直到达到叶节点,其中,基于所述交易附言中的关键词设置所述特征值的条件;以及基于所述叶节点,输出贷款识别结果。
5、根据一些示例性实施例,所述利用所述分组聚合结果和所述历史贷款认定总次数,构建所述贷款识别模型,具体包括:利用比例计算模型构建所述贷款识别模型;所述将所述交易附言和所述交易金额输入预先构建的贷款识别模型以判断所述目标交易流水是否为贷款,输出贷款识别结果,具体包括:基于所述交易附言,获取所述目标交易流水对应的分组聚合结果中的分组和历史贷款认定总次数;基于所述对应的分组聚合结果中的分组和历史贷款认定总次数,计算历史贷款识别比例;以及基于所述历史贷款识别比例输出所述贷款识别结果。
6、根据一些示例性实施例,所述获取目标交易流水,具体包括:基于交易的类型,在授信信息系统中实施埋点;以及通过埋点捕获的数据,获取所述目标交易流水。
7、根据一些示例性实施例,所述对所述历史交易所属行业、历史交易附言、历史贷款识别人员和所述历史贷款认定结果进行分组聚合,获得分组聚合结果,具体包括:利用hive或spark引擎,编写sql查询语句以执行分组聚合运算;以及通过所述分组聚合运算,获得所述分组聚合结果。
8、根据一些示例性实施例,将所述sql查询语句保存到脚本文件中,其中,对所述sql查询语句设置定时任务。
9、根据一些示例性实施例,构建所述目标客户关联方知识图谱,具体包括:获取历史交易流水信息,其中,所述历史交易流水信息包括历史客户信息、历史转账方信息和历史交易附言;对所述历史客户信息、所述历史交易附言和所述历史转账方信息进行自然语言处理和专家规则处理,获取多组历史目标客户、历史目标客户的关联方以及历史目标客户和历史目标客户的关联方的关联信息;以及利用所述多组历史目标客户、历史目标客户的关联方以及历史目标客户和历史目标客户的关联方的关联信息,构建多个目标客户关联方知识图谱。
10、根据一些示例性实施例,对所述历史客户信息、所述历史交易附言和所述历史转账方信息进行自然语言处理和专家规则处理,获取多组历史目标客户、历史目标客户的关联方以及历史目标客户和历史目标客户的关联方的关联信息,具体包括:基于所述历史客户信息和所述历史转账方信息,获取历史客户和历史转账方之间的控股关系、关联转账数量或法人身份与资金关系;以及响应于能够构成所述控股关系或所述法人身份与资金关系,或所述关联转账数量高于预设的第二阈值,将所述历史转账方确定为所述历史客户的关联方,将所述控股关系、所述法人身份与资金关系或所述关联转账信息作为所述关联信息。
11、根据本发明的第二方面,提出了一种收入计算装置,所述装置包括:目标交易流水获取模块,用于:获取目标交易流水,其中,所述目标交易流水包括目标客户信息、转入方信息、交易附言和交易金额;贷款识别结果输出模块,用于:将所述交易附言和所述交易金额输入预先构建的贷款识别模型以判断所述目标交易流水是否为贷款,输出贷款识别结果;目标客户关联方知识图谱获取模块,用于:基于所述目标客户信息,获取对应的目标客户关联方知识图谱,其中,所述目标客户关联方知识图谱中包括多个实体和多个边,所述实体表示为目标客户和目标客户的关联方,所述边表示为所述目标客户和所述目标客户的关联方之间的控股关系、往来资金关系和法人关系;关联交易识别结果获取模块,用于:利用所述目标客户关联方知识图谱对所述转入方信息进行遍历,获取关联交易识别结果;以及收入数据获取模块,用于:基于所述贷款识别结果和所述关联交易识别结果,获得所述目标交易流水的收入。
12、根据一些示例性实施例,所述目标交易流水获取模块可以包括埋点单元和目标交易流水获取单元。
13、根据一些示例性实施例,所述埋点单元可以用于基于交易的类型,在授信信息系统中实施埋点。
14、根据一些示例性实施例,所述目标交易流水获取单元可以用于通过埋点捕获的数据,获取所述目标交易流水。
15、根据一些示例性实施例,所述贷款识别结果输出模块可以包括历史交易流水信息获取单元、分组聚合模块、历史贷款认定总次数计算单元和贷款识别模型构建模块。
16、根据一些示例性实施例,所述历史交易流水信息获取单元可以用于获取历史交易流水信息,其中,所述历史交易流水信息包括历史交易所属行业、历史交易附言、历史贷款识别人员和历史贷款认定结果。
17、根据一些示例性实施例,所述分组聚合模块可以用于对所述历史交易所属行业、历史交易附言、历史贷款识别人员和所述历史贷款认定结果进行分组聚合,获得分组聚合结果。
18、根据一些示例性实施例,所述历史贷款认定总次数计算单元可以用于基于所述分组聚合结果,获取每个分组对应的历史贷款认定总次数。
19、根据一些示例性实施例,所述贷款识别模型构建模块可以用于利用所述分组聚合结果和所述历史贷款认定总次数,构建所述贷款识别模型。
20、根据一些示例性实施例,所述贷款识别结果输出模块还可以包括标准化词汇映射模块。
21、根据一些示例性实施例,所述标准化词汇映射模块可以包括关联历史交易附言获取单元、标准化词汇映射单元和更新单元。
22、根据一些示例性实施例,所述关联历史交易附言获取单元可以用于对所述历史交易附言进行自然语言处理和专家规则处理,获取关联历史交易附言,其中,所述关联历史交易附言之间的相似度高于预设的第一阈值。
23、根据一些示例性实施例,所述标准化词汇映射单元可以用于将所述关联历史交易附言映射为标准化词汇。
24、根据一些示例性实施例,所述更新单元可以用于利用映射后的关联历史交易附言更新所述历史交易附言。
25、根据一些示例性实施例,所述分组聚合模块可以包括分组聚合运算单元和分组聚合结果获取单元。
26、根据一些示例性实施例,所述分组聚合运算单元可以用于利用hive或spark引擎,编写sql查询语句以执行分组聚合运算。
27、根据一些示例性实施例,所述分组聚合结果获取单元可以用于通过所述分组聚合运算,获得所述分组聚合结果。
28、根据一些示例性实施例,所述贷款识别模型构建模块可以包括第一模型构建模块和第二模型构建模块。
29、根据一些示例性实施例,所述第一模型构建模块可以包括决策树子模型获取单元、目标特征提取单元、遍历单元、子节点选择单元和第一贷款识别结果输出单元。
30、根据一些示例性实施例,所述决策树子模型获取单元可以用于将所述交易附言匹配所述历史交易附言,以获取所述目标交易流水对应的决策树子模型。
31、根据一些示例性实施例,所述目标特征提取单元可以用于基于所述交易附言和所述交易金额提取目标特征。
32、根据一些示例性实施例,所述遍历单元可以用于从根节点开始,根据所述目标特征的特征值沿所述对应的决策树子模型的分支向下遍历。
33、根据一些示例性实施例,所述子节点选择单元可以用于在每个节点上,根据所述特征值的条件,选择对应的子节点,直到达到叶节点,其中,基于所述交易附言中的关键词设置所述特征值的条件。
34、根据一些示例性实施例,所述第一贷款识别结果输出单元可以用于基于所述叶节点,输出贷款识别结果。
35、根据一些示例性实施例,所述第二模型构建模块可以包括分组获取单元、历史贷款识别比例计算单元和第二贷款识别结果输出单元。
36、根据一些示例性实施例,所述分组获取单元可以用于基于所述交易附言,获取所述目标交易流水对应的分组聚合结果中的分组和历史贷款认定总次数。
37、根据一些示例性实施例,所述历史贷款识别比例计算单元可以用于基于所述对应的分组聚合结果中的分组和历史贷款认定总次数,计算历史贷款识别比例。
38、根据一些示例性实施例,所述第二贷款识别结果输出单元可以用于基于所述历史贷款识别比例输出所述贷款识别结果。
39、根据一些示例性实施例,所述目标客户关联方知识图谱获取模块可以包括信息获取单元、处理模块和知识图谱构建单元。
40、根据一些示例性实施例,所述信息获取单元可以用于获取历史交易流水信息,其中,所述历史交易流水信息包括历史客户信息、历史转账方信息和历史交易附言。
41、根据一些示例性实施例,所述处理模块可以用于对所述历史客户信息、所述历史交易附言和所述历史转账方信息进行自然语言处理和专家规则处理,获取多组历史目标客户、历史目标客户的关联方以及历史目标客户和历史目标客户的关联方的关联信息。
42、根据一些示例性实施例,所述知识图谱构建单元可以用于利用所述多组历史目标客户、历史目标客户的关联方以及历史目标客户和历史目标客户的关联方的关联信息,构建多个目标客户关联方知识图谱。
43、根据一些示例性实施例,所述处理模块可以包括关系获取单元以及关联方和关联信息确定单元。
44、根据一些示例性实施例,所述关系获取单元可以用于基于所述历史客户信息和所述历史转账方信息,获取历史客户和历史转账方之间的控股关系、关联转账数量或法人身份与资金关系。
45、根据一些示例性实施例,所述关联方和关联信息确定单元可以用于响应于能够构成所述控股关系或所述法人身份与资金关系,或所述关联转账数量高于预设的第二阈值,将所述历史转账方确定为所述历史客户的关联方,将所述控股关系、所述法人身份与资金关系或所述关联转账信息作为所述关联信息。
46、根据本发明的第三方面,提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上所述的方法。
47、根据本发明的第四方面,提供一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如上所述的方法。
48、根据本发明的第五方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上所述的方法。
49、上述一个或多个实施例具有如下优点或有益效果:根据本发明提供的收入计算方法,通过贷款识别模型能够获取更加准确统一的贷款识别结果;通过对每个客户建立知识图谱,能够简化大规模的图谱数据处理,提高计算速度;同时,通过计算机系统自动化处理交易流水信息,从而能够提供操作简便性、结果准确性和更快的响应,以提高用户体验。