一种商户分类方法、装置、电子设备及介质与流程

文档序号:25613034发布日期:2021-06-25 15:26阅读:96来源:国知局
一种商户分类方法、装置、电子设备及介质与流程

1.本申请实施例涉及人工智能技术领域,尤其涉及一种商户分类方法、装置、电子设备及介质。


背景技术:

2.在商户收单交易中,商户类型的不同会影响收单交易的费用率。而目前对于商户类型的录入的方式一般为,在商户档案建立的时候手工录入,采用人工对商户进行分类的方法,工作量过于繁重,并且具有一定的主观性,不同的人对于商户分类标准的理解不同会导致产生不同的分类结果,影响商户分类的准确性。
3.另外,还可以根据交易中付款位置信息,确定商户的交易区域。将商户经营区域信息与交易规模、买家规模等其他信息结合来确定商户分类模型,然后使用训练的模型对未知商户进行分类,实现商户经营区域信息与其他经营信息结合。该技术方案依赖于商户交易时付款信息的定位和买家信息的获取,但是通常在交易中,上述信息并不容易获取,因此该方案具有一定的局限性,并且该方案使用的k近邻算法计算复杂度高,k值得选择在很大程度上依赖于数据训练的结果,k值不合适会使得分类很难达到预期效果。


技术实现要素:

4.本发明实施例提供一种商户分类方法、装置、电子设备及介质,以提高商户分类的准确性。
5.将各预设单位时间内采集的预设数量的商户交易数据输入至循环神经网络中,得到第一输出数据;
6.将所述第一输出数据输入至卷积神经网络中,得到第二输出数据;
7.基于归一化函数,对所述第二输出数据进行处理,得到商户分类结果。
8.在另一个实施例中,本申请实施例还提供了一种商户分类装置,该装置包括:
9.第一处理模块,用于将各预设单位时间内采集的预设数量的商户交易数据输入至循环神经网络中,得到第一输出数据;
10.第二处理模块,用于将所述第一输出数据输入至卷积神经网络中,得到第二输出数据;
11.分类模块,用于基于归一化函数,对所述第二输出数据进行处理,得到商户分类结果。
12.在又一个实施例中,本申请实施例还提供了一种电子设备,包括:一个或多个处理器;
13.存储器,用于存储一个或多个程序;
14.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本申请实施例任一项所述的商户分类方法。
15.在再一个实施例中,本申请实施例还提供了一种计算机可读存储介质,其上存储
有计算机程序,该程序被处理器执行时实现如本申请实施例中任一项所述的商户分类方法。
16.本申请实施例中,将各预设单位时间内采集的预设数量的商户交易数据输入至循环神经网络中,得到第一输出数据;将所述第一输出数据输入至卷积神经网络中,得到第二输出数据;基于归一化函数,对所述第二输出数据进行处理,得到商户分类结果。上述方案解决了目前对对商户进行分类时,采用人工分类的方法或其他模型分类方法得到的分类准确率低问题,从而通过循环神经网络确定不同时间的商户交易数据的关联特征,通过卷积神经网络进一步确定商户交易数据的上文之间的特征,从未提高了分类的准确性。
附图说明
17.图1为本发明一种实施例提供的商户分类方法的流程图;
18.图2为本发明一种实施例提供的循环神经网络示意图;
19.图3为本发明另一实施例提供的商户分类方法的流程图;
20.图4为本发明另一实施例提供的卷积神经网络示意图;
21.图5为本发明另一实施例提供的商户分类方法神经网络结构图;
22.图6为本发明另一实施例提供的归一化网络示意图;
23.图7为本发明一种实施例提供的商户分类装置的结构示意图;
24.图8为本发明一种实施例提供的电子设备的结构示意图。
具体实施方式
25.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
26.图1为本发明一种实施例提供的商户分类方法的流程图。本申请实施例提供的商户分类方法可适用于对商户进行分类的情况。典型的,本申请实施例适用于基于神经网络对模型进行分类的情况。该方法具体可以由商户分类装置执行,该装置可以由软件和/或硬件的方式实现,该装置可以集成在能够实现商户分类方法的电子设备中。参见图1,本申请实施例的方法具体包括:
27.s110、将各预设单位时间内采集的预设数量的商户交易数据输入至循环神经网络中,得到第一输出数据。
28.其中,预设单位时间可以根据实际情况进行确定,例如可以确定为1分钟、1小时、12小时等。预设数量也可以根据实际情况进行确定。例如,预设数量可以取100,一个商户在1小时内的商户交易数据为1000个,则从1000个商户交易数据中选取100个商户交易数据用于进行商户分类。本申请实施例中的商户交易数据为实际类型待测的商户的交易数据。在进行商户分类之前,预先根据不同商户类型的商户交易数据以及商户类型标签作为训练数据,对神经网络进行训练。
29.示例性的,将预设单位之间内采集的预设数量的商户交易数据输入至循环神经网络中,得到第一输出数据。循环神经网络可以确定商户交易数据之间不同时间序列之间的上下文关系,从而精确地获知不同时间序列的商户交易数据之间的关系,确定商户交易数
据包含的特征。
30.在本申请实施例中,将各预设单位时间内采集的预设数量的商户交易数据输入至循环神经网络中,得到第一输出数据,包括:将当前层的循环神经网络的输出数据,输入至下一层循环神经网络的输入层,经过下一层循环神经网络的处理得到第一输出数据。
31.示例性的,如图2所示,图2中为一层循环神经网络,在本申请实施例中还可以设置更多层的循环神经网络,例如可以为2层、3层等。将当前层循环神经网络的输出数据,输入至下一层循环神经网络的输入层,经过下一层循环神经网络的处理得到第一输出数据。本申请实施例中之处的当前层和下一层并不是特指一个,可以是多个。将第1层循环神经网络作为当前层循环神经网络时,则第2层循环神经网络为下一层循环神经网络,第2层循环神经网络为当前层循环神经网络时,则第3层循环神经网络为下一层循环神经网络。
32.在本申请实施例中,将当前层的循环神经网络的输出数据,输入至下一层循环神经网络的输入层,经过下一层循环神经网络的处理得到第一输出数据,包括:将当前层的循环网络的输出数据分为预设组数的组;将每组的输出数据汇总,输入下一层循环神经网络的输入层节点。
33.示例性的,下一层循环神经网络的输入层节点个数可以与当前层循环神经网络输出层节点个数可以不同,例如,下一层循环神经网络的输入节点个数可以少于当前循环神经网络的输出节点个数。当下一层循环神经网络的输入节点个数少于当前循环神经网络的输出节点个数时,将当前层的循环神经网络的输出数据分为预设组数的组,将每组的输出数据汇总后,输入下一层循环神经网络的输入层节点。
34.在本申请实施例中,将每组的输出数据汇总,输入下一层循环神经网络的输入层节点,包括:将每组的输出数据进行拼接,得到拼接输入矩阵;将所述拼接输入矩阵,输入下一层循环神经网络的输入层节点。
35.示例性的,将当前层的每组的输出数据进行向量拼接,拼接的顺序不作具体限制,例如将5个1*10的输出向量拼接为1个5*10的拼接输入向量,将拼接输入矩阵输入下一层循环神经网络的输入层节点中。一层循环神经网络的感知域一般是20个时间步,也就是说当单位时间内交易流水数据较多的时候,一旦超过20时间段就会丢失信息,无法继续向后传递前面节点中的交易数据特征。多层rnn的结构可以扩大循环神经网络系统的感知域,使得整个单位时间内的交易流水之间相互影响。
36.s120、将所述第一输出数据输入至卷积神经网络中,得到第二输出数据。
37.其中,卷积神经网络的层数可以根据实际情况进行确定,例如可以确定为2层。卷积核的大小可以根据实际情况或者实际的训练过程进行确定。
38.示例性的,将第一输出数据输入至卷积神经网络中,得到第二输出数据,从而通过卷积神经网络,提取商户交易数据的特征,以便于后续根据商户交易数据的特征,对商户进行分类。
39.s130、基于归一化函数,对所述第二输出数据进行处理,得到商户分类结果。
40.示例性的,为了能使第二输出数据表示为0

1中的数据,表示该商户为某一类别的概率,因此需基于归一化函数,对第二输出数据进行归一化处理,从而使第二输出数据位于0

1之间,第二输出数据的列向量的和等于1,从而更加直观准确地确定该商户所述的商户类别。
41.本申请实施例中,将各预设单位时间内采集的预设数量的商户交易数据输入至循环神经网络中,得到第一输出数据;将所述第一输出数据输入至卷积神经网络中,得到第二输出数据;基于归一化函数,对所述第二输出数据进行处理,得到商户分类结果。上述方案解决了目前对对商户进行分类时,采用人工分类的方法或其他模型分类方法得到的分类准确率低问题,从而通过循环神经网络确定不同时间的商户交易数据的关联特征,通过卷积神经网络进一步确定商户交易数据的上文之间的特征,从未提高了分类的准确性。
42.图3为本发明另一实施例提供的商户分类方法的流程图。本申请实施例为对上述实施例的进一步优化,未在本申请实施例中详细描述的细节详见上述实施例。参见图3,本申请实施例提供的商户分类方法可以包括:
43.s210、将各预设单位时间内采集的预设数量的商户交易数据表示为列向量的形式。
44.示例性的,例如在第一个预设单位时间内采集了20个商户交易数据,则将该预设单位时间内采集的20个商户交易数据标识为1*20的列向量。其他预设单位时间中采集的商户交易数据同理,从而得到与预设单位时间数量等数量的列向量。
45.s220、将各列向量形式的预设单位时间内采集的预设数量的商户交易数据输入至输入层的各个节点中,得到第一输出数据。
46.示例性的,如图2所示,图2的每一个输入数据x,表示一个预设单位时间内采集到的预设数量的商户交易数据,也就是一个预设单位时间对应的列向量。输入层输入的x1、x2、

、x
t
‑1、x
t
为t条按时间排列的商户交易数据。隐藏层t时刻的输出同时由t时刻的输入和上一隐藏层的值共同决定。用公式表达如下:
47.o
t
=g(vgs
t
)
48.s
t
=f(ugx
t
+wgs
t
‑1)
49.其中,o
t
表示当前输出节点的输出数据。s
t
表示当前层的传递值,u、v和w可以根据实际情况选取,g和f为激活函数,可以根据实际情况进行确定。
50.s230、将第一输出数据输入至卷积层和池化层进行处理,得到第二输出数据。
51.示例性的,如图4和图5所示,将第一输出数据输入至卷积层提取商户交易数据的特征,再输入至池化层进行降维,提取商户交易数据的统计特征。
52.在本申请实施例中,将第一输出数据输入至卷积层和池化层进行处理,得到第二输出数据,包括:基于第一预设卷积核,对所述第一输出数据进行处理,得到卷积层输出数据基于第二预设卷积核,对所述卷积层输出数据进行降维处理,得到池化层输出数据,作为第二输出数据。经过卷积的数据可以表示为:
[0053][0054]
其中,的c
t
是卷积的输出结果,x是原始数据集,下标是卷积的输出结果,x是原始数据集,下标为时间步标识,t为总时间长度,l是卷积核长度,卷积核就是公式中的ω,f是卷积之后的结果的一个激活函数。b是一个偏差变量。在本申请实施例中,第一预设卷积和和第二预设卷积和的大小可以根据实际情况确定。
[0055]
s240、将所述第二输出数据表示为指数数据。
[0056]
示例性的,将第二输出数据表示为指数数据,从而保证第二输出数据的非负性,保证后续计算概率时为正的概率值。
[0057]
在本申请实施例中,如图6所示,将所述第二输出数据表示为指数数据,包括:以的形式,表示所述第二输出数据;其中,z
i
为所述第二输出数据。
[0058]
s250、将所述指数数据进行归一化处理,得到商户分类结果。
[0059]
示例性的,将指数数据进行归一化处理,从而使指数数据转化为0

1之间的概率数据,便于直观准确地商户的分类类别。
[0060]
在本申请实施例中,将所述指数数据进行归一化处理,得到商户分类结果数据,包括:基于如下公式,确定商户分类为预设商户列别的概率:
[0061][0062]
其中,z
j
为第j个节点输出的第二输出数据,k为输出节点的个数。k为输出节点的个数,即分类的类别个数。归一化函数可以为softmax函数。k是由在前面的神经网络训练中得到。softmax函数的输入为一个的向量,输出也是一个的向量,输出的向量中每个值表示这个样本属于每个类的概率,取概率最大的类即为该流水对应的商户分类。
[0063]
本申请实施例中的方案,通过将各预设单位时间内采集的预设数量的商户交易数据表示为列向量的形式。将各列向量形式的预设单位时间内采集的预设数量的商户交易数据输入至输入层的各个节点中,得到第一输出数据。将第一输出数据输入至卷积层和池化层进行处理,得到第二输出数据。将所述第二输出数据表示为指数数据。将所述指数数据进行归一化处理,得到商户分类结果,从而实现了根据商户交易数据对商户进行准确地分类,解决了分类结果容易受到k值影响导致分类不准确的问题。
[0064]
在本申请实施例中,将所述第一输出数据输入至卷积神经网络中,得到第二输出数据,包括:将第一输出数据输入至卷积层、池化层和全连接层进行处理,得到第二输出数据。即在池化层之后,加入全连接层对商户交易数据进行处理。
[0065]
图7为本发明一种实施例提供的商户分类装置的结构示意图。该装置可适用于对商户进行分类的情况。典型的,本申请实施例适用于基于神经网络对模型进行分类的情况。该装置可以由软件和/或硬件的方式实现,该装置可以集成在电子设备中。参见图7,该装置具体包括:
[0066]
第一处理模块310,用于将各预设单位时间内采集的预设数量的商户交易数据输入至循环神经网络中,得到第一输出数据;
[0067]
第二处理模块320,用于将所述第一输出数据输入至卷积神经网络中,得到第二输出数据;
[0068]
分类模块330,用于基于归一化函数,对所述第二输出数据进行处理,得到商户分类结果。
[0069]
在本申请实施例中,第一处理模块310,包括:
[0070]
向量表示单元,用于将各预设单位时间内采集的预设数量的商户交易数据表示为列向量的形式;
[0071]
输入单元,用于将各列向量形式的预设单位时间内采集的预设数量的商户交易数
据输入至输入层的各个节点中。
[0072]
在本申请实施例中,第一处理模块310,包括:
[0073]
传递单元,用于将当前层的循环神经网络的输出数据,输入至下一层循环神经网络的输入层,经过下一层循环神经网络的处理得到第一输出数据。
[0074]
在本申请实施例中,传递单元,包括:
[0075]
分组子单元,用于将当前层的循环网络的输出数据分为预设组数的组;
[0076]
后续输入子单元,用于将每组的输出数据汇总,输入下一层循环神经网络的输入层节点。
[0077]
在本申请实施例中,后续输入子单元,具体用于:
[0078]
将每组的输出数据进行拼接,得到拼接输入矩阵;
[0079]
将所述拼接输入矩阵,输入下一层循环神经网络的输入层节点。
[0080]
在本申请实施例中,第二处理模块320,,具体用于:
[0081]
将第一输出数据输入至卷积层和池化层进行处理,得到第二输出数据。
[0082]
在本申请实施例中,第二处理模块320,,具体用于:
[0083]
基于第一预设卷积核,对所述第一输出数据进行处理,得到卷积层输出数据
[0084]
基于第二预设卷积核,对所述卷积层输出数据进行降维处理,得到池化层输出数据,作为第二输出数据。
[0085]
在本申请实施例中,第二处理模块320,,具体用于:
[0086]
将第一输出数据输入至卷积层、池化层和全连接层进行处理,得到第二输出数据。
[0087]
在本申请实施例中,分类模块330,包括:
[0088]
指数表示单元,用于将所述第二输出数据表示为指数数据;
[0089]
归一化处理单元,用于将所述指数数据进行归一化处理,得到商户分类结果。
[0090]
在本申请实施例中,
[0091]
指数表示单元,具体用于:
[0092]
用于以的形式,表示所述第二输出数据;其中,z
i
为所述第二输出数据。
[0093]
在本申请实施例中,归一化处理单元,具体用于:
[0094]
基于如下公式,确定商户分类为预设商户列别的概率:
[0095][0096]
其中,z
j
为第j个节点输出的第二输出数据,k为输出节点的个数。
[0097]
在本申请实施例中,所述归一化函数为softmax函数。
[0098]
本申请实施例所提供的商户分类装置可执行本申请任意实施例所提供的商户分类方法,具备执行方法相应的功能模块和有益效果。
[0099]
图8为本发明一种实施例提供的电子设备的结构示意图。图8示出了适于用来实现本申请实施例的示例性电子设备412的框图。图8显示的电子设备412仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
[0100]
如图8所示,电子设备412可以包括:一个或多个处理器416;存储器428,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器416执行,使得所述一个
或多个处理器416实现本申请实施例所提供的商户分类方法,包括:
[0101]
将各预设单位时间内采集的预设数量的商户交易数据输入至循环神经网络中,得到第一输出数据;
[0102]
将所述第一输出数据输入至卷积神经网络中,得到第二输出数据;
[0103]
基于归一化函数,对所述第二输出数据进行处理,得到商户分类结果。
[0104]
电子设备412的组件可以包括但不限于:一个或者多个处理器或者处理器416,存储器428,连接不同设备组件(包括存储器428和处理器416)的总线418。
[0105]
总线418表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,处理型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
[0106]
电子设备412典型地包括多种计算机设备可读存储介质。这些存储介质可以是任何能够被电子设备412访问的可用存储介质,包括易失性和非易失性存储介质,可移动的和不可移动的存储介质。
[0107]
存储器428可以包括易失性存储器形式的计算机设备可读存储介质,例如随机存取存储器(ram)430和/或高速缓存存储器432。电子设备412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机设备存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易失性磁存储介质(图8未显示,通常称为“硬盘驱动器”)。尽管图8中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd

rom,dvd

rom或者其它光存储介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据存储介质接口与总线418相连。存储器428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
[0108]
具有一组(至少一个)程序模块442的程序/实用工具440,可以存储在例如存储器428中,这样的程序模块442包括但不限于操作设备、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块442通常执行本发明所描述的实施例中的功能和/或方法。
[0109]
电子设备412也可以与一个或多个外部设备414(例如键盘、指向设备、显示器424等)通信,还可与一个或者多个使得用户能与该电子设备412交互的设备通信,和/或与使得该电子设备412能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口422进行。并且,电子设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图8所示,网络适配器420通过总线418与电子设备412的其它模块通信。应当明白,尽管图8中未示出,可以结合电子设备412使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid设备、磁带驱动器以及数据备份存储设备等。
[0110]
处理器416通过运行存储在存储器428中的多个程序中其他程序的至少一个,从而执行各种功能应用以及数据处理,例如实现本申请实施例所提供的一种商户分类方法。
[0111]
本发明一种实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可
执行指令在由计算机处理器执行时用于执行商户分类方法,包括:
[0112]
将各预设单位时间内采集的预设数量的商户交易数据输入至循环神经网络中,得到第一输出数据;
[0113]
将所述第一输出数据输入至卷积神经网络中,得到第二输出数据;
[0114]
基于归一化函数,对所述第二输出数据进行处理,得到商户分类结果。
[0115]
本申请实施例的计算机存储介质,可以采用一个或多个计算机可读的存储介质的任意组合。计算机可读存储介质可以是计算机可读信号存储介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的设备、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形存储介质,该程序可以被指令执行设备、装置或者器件使用或者与其结合使用。
[0116]
计算机可读的信号存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号存储介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行设备、装置或者器件使用或者与其结合使用的程序。
[0117]
计算机可读存储介质上包含的程序代码可以用任何适当的存储介质传输,包括——但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0118]
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或设备上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0119]
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1