本发明涉及互联网技术领域,尤其涉及一种数据处理方法、装置和设备。
背景技术:
随着互联网的不断发展,线上购物方式已经成为人们生活中普遍采用的购物方式。但是,这并不意味着线上购物方式已经完全取代了线下购物方式,目前,线上和线下购物方式并存。
一件商品的产业链可能会经过4个环节,分别是工厂、代理商、销售商以及消费者,每一个环节都在产业链中扮演着一个角色。不同的角色会对商品进行各种不同的操作,这些操作往往都会淹没在线上的海量数据中。
在一些场景下,挖掘不同用户(比如不同角色的用户之间,或者同一角色的不同用户之间)在产业链上的关系即供求关系或者称为进货关系,具有重要意义。比如,张三已经被确定售假,如果发现其分别向李四和王五进货,并发现赵六也在向张三进货再进行兜售,那么就会发现这条售假链路。
技术实现要素:
本发明实施例提供一种数据处理方法、装置和设备,用以挖掘出用户之间的供求关系。
第一方面,本发明实施例提供一种数据处理方法,包括:
根据资金流向数据确定第一用户存在资金流入第二用户;
确定所述第一用户对应的第一商品类目以及所述第二用户对应的第二商品类目;
若所述第一商品类目与所述第二商品类目之间具有相关性,则确定所述第一用户与所述第二用户之间存在供求关系。
第二方面,本发明实施例提供一种数据处理装置,包括:
第一确定模块,用于根据资金流向数据确定第一用户存在资金流入第二用户;
第二确定模块,用于确定所述第一用户对应的第一商品类目以及所述第二用户对应的第二商品类目;
第三确定模块,用于若所述第一商品类目与所述第二商品类目之间具有相关性,则确定所述第一用户与所述第二用户之间存在供求关系。
第三方面,本发明实施例提供一种电子设备,该电子设备包括处理器和存储器,其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行第一方面中的数据处理方法。
本发明实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行第一方面中的数据处理方法。
另外,本发明实施例还提供一种数据处理方法,包括:
根据交互记录确定第一用户与第二用户之间存在交互行为;
确定所述第一用户对应的第一对象特征以及所述第二用户对应的第二对象特征,其中,第一对象与第二对象均与所述交互行为相关;
若所述第一对象特征与所述第二对象特征之间具有相关性,则确定所述第一用户与所述第二用户之间存在依赖关系。
在本发明实施例中,针对某条资金流向数据,假设根据该资金流向数据的资金流向确定出这是条第一用户向第二用户转入资金的数据,为了确定第一用户与第二用户之间是否存在供求关系,首先,确定第一用户对应的第一商品类目即第一用户所销售的商品所属的类目,以及确定第二用户对应的第二商品类目即第二用户所销售的商品所属的类目。其次,判断第一商品类目与第二商品类目之间是否具有相关性,若第一商品类目与第二商品类目之间具有相关性,则确定第一用户与第二用户之间存在供求关系,即存在第一用户向第二用户进货的关系。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据处理方法的流程图;
图2为本发明实施例提供的另一种数据处理方法的流程图;
图3为本发明实施例提供的一种基于资金关系推测用户所销售的商品类目的示意图;
图4为与图2所示实施例对应的一种识别供求关系的场景示意图;
图5为本发明实施例提供的又一种数据处理方法的流程图;
图6为与图5所示实施例对应的一种识别供求关系的场景示意图;
图7为本发明实施例提供的一种数据处理装置的结构示意图;
图8为与图7所示实施例提供的数据处理装置对应的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
另外,下述各方法实施例中的步骤时序仅为一种举例,而非严格限定。
本发明实施例提供的数据处理方法可以用于判断出存在资金往来的两个用户之间是否存在供求关系(可以称为产业链关系、进货关系)。而供求关系判断的核心就是判断购买者(资金流出者)所购买的商品是否与自己销售的商品存在相关性。比如:某用户a下单从用户b处购买了电脑品类的产品,而自己本身就是销售电脑品类的,则可以认为用户a与用户b存在进货关系。
下面结合如下的一些实施例说明如何挖掘出不同用户之间的供求关系。
图1为本发明实施例提供的一种数据处理方法的流程图,该数据处理方法比如可以由电商平台侧的设备来执行,比如服务器。如图1所示,该方法包括如下步骤:
101、根据资金流向数据确定第一用户存在资金流入第二用户。
本实施例中,资金流向数据是指表明资金流向的数据,实际应用中,比如订单数据、转账数据都可以表明资金流向,因此都可以作为资金流向数据。
其中,对于订单数据:当某用户通过在线购物方式购买某商家的商品并完成支付时,会生成对应于本次交易的订单数据,订单数据中包括购买者、销售者、商品、金额等相关信息。
对于转账数据:某商家可能线下从某厂家或某代理商处购买了一批商品,通过线上支付手段向该厂家或代理商进行付款,从而会形成一条转账数据,该条转账数据中包括付款者、收款者、转账时间、转账金额等相关信息。
基于此,作为本发明实施例执行主体的服务器中可以维护有电商平台侧产生的若干订单数据,以及支付平台侧产生的若干转账数据。服务器可以基于人为触发或周期性地对一段时间内产生的订单数据、转账数据进行分析,以挖掘出不同用户之间存在的供求关系。
因此,在一可选方式中,步骤101可以实现为:获取订单数据,若订单数据中包含的购买者和销售者分别为第一用户和第二用户,则确定第一用户存在资金流入第二用户。
在另一可选方式中,步骤101可以实现为:获取转账数据,若转账数据中包含的付款者和收款者分别为第一用户和第二用户,则确定第一用户存在资金流入第二用户。
102、确定第一用户对应的第一商品类目以及第二用户对应的第二商品类目。
如前文所述:供求关系判断的核心就是判断购买者(资金流出者)所购买的商品是否与自己销售的商品存在相关性。因此,步骤102中确定第一用户对应的第一商品类目实际上就是确定第一用户所销售的商品所属的类目;确定第二用户对应的第二商品类目实际上就是确定第二用户所销售的商品所属的类目,换句话说,也是确定第一用户从第二用户购买的商品所属的类目。
下面以订单数据作为资金流向数据的情况为例,对上述第一商品类目与第二商品类目的一种确定方式进行举例说明,转账数据的情形以及其他确定方式在后续实施例中会举例说明。
在以订单数据作为资金流向数据的情况下,由于第一用户向第二用户购买某商品才导致该订单数据的产生,该订单数据中包括所购买的商品信息,因此此时,可以确定第二用户对应的第二商品类目为订单数据中包含的商品所属的类目,比如,在第二用户对应的线上商铺中查询第一用户所购买的商品归属于哪个类目下。
另外,第一用户如果是线上商家即具有线上商铺,此时,可以查询第一用户的线上商铺中所包含的商品类目为第一用户对应的第一商品类目。
103、若第一商品类目与第二商品类目之间具有相关性,则确定第一用户与第二用户之间存在供求关系。
本发明实施例中,商品类目之间的相关性可以通过如下两个维度定义:相似度、进销关系。这两个维度是择一的关系。
具体来说,如果第一商品类目与第二商品类目之间的相似度大于或等于设定阈值,则确定第一商品类目与第二商品类目之间具有相关性。或者,如果第一商品类目与第二商品类目之间存在进销关系,则确定第一商品类目与第二商品类目之间具有相关性。
下面分别介绍如何进行第一商品类目与第二商品类目之间相似度、进销关系的确定。
首先,电商平台中全部线上商铺所对应的所有商品类目的总数一般是有限的,比如在几百个左右,而且这些商品类目是相对稳定的,并不会频繁地更新,因此,可以预先针对所有商品类目进行两两相似度的计算,从而,在需要计算第一商品类目与第二商品类目的相似度时,仅需要查询已经获得的相似度计算结果即可。
可选地,两两商品类目之间的相似度可以是人为预先标记的。具体来说,可以设定商品类目取为二级类目,结构上表示为a/b,其中,a代表一级类目,b代表二级类目。从而,比如:如果两个商品类目的一级类目和二级类目均相同,则认为两者的相似度为f1,如果两个商品类目的一级类目相同而二级类目均不同,则认为两者的相似度为f2,如果两个商品类目的一级类目和二级类目均不同,则认为两者的相似度为f3。可以理解的是,f1、f2和f3为预设值,f1大于f2,f2远大于f3,另外,可以设置阈值为介于f3与f2之间的某数值,从而,如果两个商品类目之间的相似度为f2或f1,则这两个商品类目之间具有相关性。
可选地,本文还提供另一种计算商品类目之间相似度的方法——word2vec。
word2vec方法的目的就是将每一个word进行向量化,变成编码向量vector的形式,如果两个word越相似,那么它们的编码向量vector也越相近,即对应向量之间的夹角越小(或者余弦距离越大)。这里我们使用word2vec将每一个商品类目进行向量化,具体可以通过如下步骤实现:
分别获取多个线上商铺各自销售的多个商品类目;
根据每个线上商铺对应的多个商品类目的组合情况,构建每个线上商铺对应的共现关系对,其中,一个共现关系对由多个商品类目中的两个不同商品类目构成;
根据共现关系对确定多个商品类目各自对应的编码向量;
根据两两编码向量之间的距离,确定对应的两个商品类目之间的相似度。
具体来说,线上商铺是指在电商平台侧开设有网店的商家,在线上商铺的界面中一般都会包含有相应商家所经营的各种商品所对应的商品类目信息,基于此,可以提取出每个线上商铺即每个商家所销售的多种商品类目。
举例来说,假设任一商家所销售的商品类目如下:绿植园艺/营养土;绿植园艺/花艺包装纸;绿植园艺/铲子。由于该商家共销售3种商品类目,3种商品类目两两组合可以构成3个共现关系对:
绿植园艺/营养土~绿植园艺/花艺包装纸;
绿植园艺/营养土~绿植园艺/铲子;
绿植园艺/花艺包装纸~绿植园艺/铲子。
针对各个线上商铺都进行上述共现关系对的构建,从而,最终可以将所有线上商铺所对应的共现关系对作为训练样本,提供给word2vec进行建模学习,最终得到每一个商品类目的编码向量。如果任意两个商品类目对应的编码向量之间的余弦距离大于或等于某一个设定阈值(如0.7),则可以认为这两个商品类目存在相关性。
下表示意了几种商品类目的相似度计算结果:
假设上述步骤中的第一商品类目为:药材/鸡血藤,第二商品类目为:药材/丝瓜络,则通过查询上述相似度计算结果可知,两者之间的相似度为0.74,大于设定阈值0.7,从而,两者之间具有相关性。
以上介绍了两个商品类目之间相似度的计算方式。
下面介绍如何判断两个商品类目之间是否存在进销关系,具体可以通过如下步骤实现:
分别获取多个线上商铺各自购买的n个商品类目以及销售的m个商品类目,m和n均为大于或等于1的整数;
根据每个线上商铺对应的n个商品类目和m个商品类目的组合情况,构建每个线上商铺对应的m*n个进销关系对,其中,一个进销关系对由n个商品类目中的一个和m个商品类目中的一个构成;
筛选出出现次数和条件概率符合设定阈值的目标进销关系对。
具体来说,针对任一线上商铺,统计所购买的n个商品类目和销售的m个商品类目,然后将它们两两组合成m*n个进销关系对,*代表乘号。其中,某线上商铺所销售的m个商品类目可以通过查询电商平台中相应的商铺界面即可获得。其中,某线上商铺所购买的n个商品类目,可以通过统计一段时间内该线上商铺的订单数据,由订单数据中各商品所归属的商品类目而得到。
举例来说,假设某线上商铺购买的n个商品类目为:园艺/多肉植物,园艺/花盆,园艺/营养液。该线上商铺所销售的m个商品类目为:绿植/园艺植物,绿植/果树。则可以构成如下m*n=6个进销关系对:
园艺/多肉植物~绿植/园艺植物;
园艺/花盆~绿植/园艺植物;
园艺/营养液~绿植/园艺植物;
园艺/多肉植物~绿植/果树;
园艺/花盆~绿植/果树;
园艺/营养液~绿植/果树。
针对各个线上商铺都进行上述进销关系对的构建,从而,汇总所有线上商铺所对应的进销关系,计算每一个进销关系对出现的次数以及概率,最终通过阈值判断来确定最终的目标进销关系对。
举例来说,针对任一进销关系对的出现次数和概率可以通过如下方式确定:假设汇总的结果表明,有100个线上商铺购买了园艺/花盆这个商品类目,在此基础上,其中有30个线上商铺销售绿植/果树这个商品类目,那么由园艺/花盆~绿植/果树构成的这个进销关系对的出现次数为30次,概率为30%。可以分别设定出现次数阈值和概率阈值,如果某进销关系对的出现次数高于出现次数阈值,并且概率高于概率阈值,则认为该进销关系对为一条目标进销关系对。
基于此,针对前述步骤中的第一商品类目和第二商品类目来说,若最终获得的目标进销关系对中包含由第一商品类目与第二商品类目构成的进销关系对,则确定第一商品类目与第二商品类目之间具有相关性。
图2为本发明实施例提供的另一种数据处理方法的流程图,如图2所示,可以包括如下步骤:
201、获取订单数据,若订单数据中包含的购买者和销售者分别为第一用户和第二用户,则确定第一用户存在资金流入第二用户。
202、确定第二用户对应的第二商品类目为订单数据中包含的商品所属的类目。
在本实施例中第一用户通过线上购物方式从第二用户处购买商品的场景下,第二用户对应的第二商品类目即为第一用户所购买商品的商品类目,亦即为第二用户所销售的该商品所属的类目。
203、若第一用户不存在线上商铺,则获取向第一用户进行转账的多个第三用户,多个第三用户分别具有线上商铺。
204、若多个第三用户彼此的线上商铺所包含的商品类目中,至少部分商品类目之间具有相关性,并且多个第三用户的数量符合设定阈值,则确定第一用户对应的第一商品类目为所述至少部分商品类目。
在本实施例中第一用户通过线上购物方式从第二用户处购买商品的场景下,确定第一用户对应的第一商品类目即为确定第一用户所销售的商品类目。此时,若第一用户存在线上商铺,即为电商平台侧的商家,则可以直接确定第一用户对应的第一商品类目为其线上商铺中包含的商品类目。但是,如果第一用户不存在线上商铺,比如第一用户可能是某个线下代理商,此时,本文提供了基于资金关系来推测第一用户所销售的商品类目的方案。
基于资金关系来推测某用户所销售的商品类目的方案的核心思想是:如果某用户x的下游用户(即向该用户转入资金的用户)中有多个用户所销售的商品类目存在明显的共性(比如7个下游用户中有4个下游用户所销售的商品类目之间的相似度较高),则认为该用户x也应该是销售该相似商品类目的。
具体来说,可以汇总一段时间内第一用户的资金往来记录,从而得到向第一用户转账的用户。实际上,向第一用户转账的用户中可能既包含存在线上商铺的商家,也包含不存在线上商铺的商家,将其中的存在线上商铺的商家称为多个第三用户。之后,统计得到多个第三用户中每个第三用户所销售的商品类目,计算不同第三用户所销售的商品类目之间的相关性,如果存在一定数量的商品类目之间具有相关性,并且多个第三用户的数量符合设定阈值,则确定第一用户对应的第一商品类目为该一定数量的商品类目。
结合图3来举例说明:假设第一用户为图中示意的用户x,根据用户x的资金往来记录发现存在如下四个用户向用户x转账:用户a,用户b,用户c和用户d。通过对这四个用户的线上商铺的遍历发现,这四个用户都是服装店,并且,这四个服装店所经营的商品类目具有明显的相似度,则可以认为用户x也具有该相似的商品类目,从而,该用户x可能也是服装店,或者是服装代理、服装厂商。
205、若第一商品类目与第二商品类目之间具有相关性,并且第一用户与第二用户之间的订单汇总信息符合设定条件,则确定第一用户与第二用户之间存在供求关系。
值得说明的是,当第一商品类目为多个,第二商品类目也为多个时,可以分别计算多个第一商品类目与多个第二商品类目的每种组合情况是否满足相关性要求。如果满足相关性要求的组合个数的占比大于设定值,则认为多个第一商品类目与多个第二商品类目之间具有相关性。
另外,本发明实施例中,对于存在资金关系的两个用户之间是否存在供求关系的确定,除了考虑两个用户各自销售的商品类目之间的相关性外,还考虑两个用户之间的订单汇总信息,以避免正常的消费行为对供求关系判断结果的影响。举例来说,在判断第一用户对应的第一商品类目与第二用户对应的第二商品类目之间具有相关性之后,还进一步考虑第一用户与第二用户之间的订单数量、交易的商品数量、订单总金额等订单汇总信息,只有这些订单汇总信息满足设定条件比如订单数量大于100个,交易的商品数量大于100个,订单总金额大于5000元,才认为第一用户与第二用户之间具有供求关系。
综上,本实施例以订单数据为基础,介绍了基于订单数据进行用户间供求关系识别的过程。为更佳直观地理解该过程,结合图4举例说明。如图4所示,分别有鞋店a、水果店b、鞋店c以及普通消费者d向用户x下单购买了鞋类产品,由于其中鞋店a和鞋店c所购买的鞋类产品同时也是自己所销售的,存在高度相关性,依此判定鞋店a和鞋店c与用户x的关系为供求关系。
图5为本发明实施例提供的又一种数据处理方法的流程图,如图5所示,可以包括如下步骤:
501、获取转账数据,若转账数据中包含的付款者和收款者分别为第一用户和第二用户,则确定第一用户存在资金流入第二用户。
本实施例中以转账数据作为基础,介绍了用户之间供求关系的识别过程。
502、若第一用户存在线上商铺,则确定第一用户对应的第一商品类目为线上商铺中包含的商品类目。
相对地,如果第一用户不存在线上商铺,则可以参考图2所示实施例中的方式确定第一用户对应的第一商品类目。
503、若第二用户不存在线上商铺,则获取向第二用户进行转账的多个第四用户,多个第四用户分别具有线上商铺。
504、若多个第四用户彼此的线上商铺所包含的商品类目中,至少部分商品类目之间具有相关性,并且多个第四用户的数量符合设定阈值,则确定第二用户对应的第二商品类目为所述至少部分商品类目。
505、若第一商品类目与第二商品类目之间具有相关性,并且第一用户与第二用户之间的转账汇总信息符合设定条件,则确定第一用户与第二用户之间存在供求关系。
本实施例中,转账汇总信息比如可以是第一用户与第二用户之间在一定时间段内的转账总次数,总金额等。
本实施例中未详细描述的部分,可以参考图2所示实施例中的相关说明,与之类似,不再赘述。
为更佳直观地理解本实施例中介绍的供求关系识别过程,结合图6举例说明。如图6所示,分别有用户a、用户b、用户c、用户d和用户e对用户x有转账行为,其中,用户a、用户b和用户c均为服装店,用户d为零食店,用户e为消费者。由于当仅知道这些用户对用户x有转账行为但是并不知道转账的意图时,可以基于前述介绍的用户销售的商品类目的确定方式确定这些用户各自对应的商品类目,假设得知用户a、用户b和用户c销售的是服装类目,并且推测出用户x也是销售服装类目的,但是,用户a与用户x的转账汇总信息不满足设定的条件(比如用户a在一段时间内仅向用户x转账一次,且金额较低),从而最终确定用户b和用户c分别与用户x存在供求关系。
通过以上各实施例,在商品交易场景下,可以确定第一用户与第二用户之间在商品交易上是否存在供求关系即大量的、长期稳定的买卖关系。而在其他应用场景中,不同用户之间可能也会存在着其他的某种依赖关系。因此,为了挖掘各种场景下不同用户之间是否存在着某种依赖关系,本发明实施例还提供了如下的通用性方案:
根据交互记录确定第一用户与第二用户之间存在交互行为;
确定第一用户对应的第一对象特征以及第二用户对应的第二对象特征,其中,第一对象与第二对象均与所述交互行为相关;
若第一对象特征与第二对象特征之间具有相关性,则确定第一用户与第二用户之间存在依赖关系。
其中,对象与交互行为相关,是指在不同用户之间存在某种交互行为时,挖掘不同用户之间是否存在某种依赖关系的标的物是某种对象。
其中,当交互记录为资金流向数据,第一对象和第二对象均为商品,而度量商品特征的指标采用商品类目时,即为前述实施例中确定第一用户与第二用户之间是否存在商品上的供求关系的方案。
再比如,在某一实施例中,可以挖掘不同用户之间的车位租赁关系。此时,交互记录可以体现为某种共享凭证的传输记录,该共享凭证比如是数字验证码、二维码,以供进入某停车场的用户通过该数字校验码或二维码解锁车位锁。
在该场景下,用户a具有某车位的所有权,在其不使用该车位的时候可以将车位出租给其他用户使用。假设在车位上部署有智能车位锁,只有用户输入正确的数字验证码或刷正确的二维码才能解锁该车位锁。比如用户b租了用户a的车位,那么用户a可以将数字验证码或二维码通过某app发送至用户b,那么该app对应的服务端就可以获取用户a向用户b发送该数字验证码或二维码的交互信息。
另外,用户a作为登记者,可以预先将自己的车辆信息以及用户信息发送至该服务端进行登记。其中,车辆信息可以包括诸如车牌号、车型、车辆颜色等信息,用户信息可以包括用户的人脸图像。
而针对车位来说,位于该车位处的车位锁上可以部署有图像采集装置,每当有车辆意图驶入该车位时,图像采集装置都可以采集当前车辆的车辆信息以及用户信息(假设为用户b),并在车位锁被正确解锁时,将采集到的车辆信息和用户信息发送至服务端。
从而,服务器可以根据车位锁上传的车辆信息和用户信息与该车位对应的登记者的用户信息和车辆信息进行对比,以确定是否是登记者的停车行为。如果不是登记者的停车行为,则服务端确定采集到的用户信息所对应的用户b与登记者即用户a具有租赁关系。
在上述举例中,用户a和用户b分别为第一用户和第二用户。第一对象特征为用户a的用户信息以及车辆信息,第二对象特征为用户b的用户信息以及车辆信息。第一对象特征与第二对象特征之间的相关性体现为:如果两个对象特征不一致,则认为两者具有相关性。
以下将详细描述本发明的一个或多个实施例的数据处理装置。本领域技术人员可以理解,这些数据处理装置均可使用市售的硬件组件通过本方案所教导的步骤进行配置来构成。
图7为本发明实施例提供的一种数据处理装置的结构示意图,该数据处理装置某服务器中,该服务器可以管理或查询电商平台的订单数据以及各种转账数据。如图7所示,该装置包括:第一确定模块11、第二确定模块12、第三确定模块13。
第一确定模块11,用于根据资金流向数据确定第一用户存在资金流入第二用户。
第二确定模块12,用于确定所述第一用户对应的第一商品类目以及所述第二用户对应的第二商品类目。
第三确定模块13,用于若所述第一商品类目与所述第二商品类目之间具有相关性,则确定所述第一用户与所述第二用户之间存在供求关系。
可选地,所述第一确定模块11可以用于:获取订单数据;若所述订单数据中包含的购买者和销售者分别为所述第一用户和所述第二用户,则确定所述第一用户存在资金流入所述第二用户。
可选地,所述第一确定模块11可以用于:获取转账数据;若所述转账数据中包含的付款者和收款者分别为所述第一用户和所述第二用户,则确定所述第一用户存在资金流入所述第二用户。
可选地,所述第二确定模块12可以用于:确定所述第二用户对应的第二商品类目为所述订单数据中包含的商品所属的类目。
可选地,所述第二确定模块12可以用于:若所述第一用户存在线上商铺,则确定所述第一用户对应的第一商品类目为所述线上商铺中包含的商品类目。
可选地,所述第二确定模块12可以用于:若所述第一用户不存在线上商铺,则获取向所述第一用户进行转账的多个第三用户,所述多个第三用户分别具有线上商铺;
若所述多个第三用户彼此的线上商铺所包含的商品类目中,至少部分商品类目之间具有相关性,并且所述多个第三用户的数量符合设定阈值,则确定所述第一用户对应的第一商品类目为所述至少部分商品类目。
可选地,所述第二用户不存在线上商铺,所述第二确定模块12可以用于:获取向所述第二用户进行转账的多个第四用户,所述多个第四用户分别具有线上商铺;若所述多个第四用户彼此的线上商铺所包含的商品类目中,至少部分商品类目之间具有相关性,并且所述多个第四用户的数量符合设定阈值,则确定所述第二用户对应的第二商品类目为所述至少部分商品类目。
可选地,所述第三确定模块13可以用于:若所述第一商品类目与所述第二商品类目之间具有相关性,并且所述第一用户与所述第二用户之间的订单汇总信息符合设定条件,则确定所述第一用户与所述第二用户之间存在供求关系。
可选地,所述第三确定模块13可以用于:若所述第一商品类目与所述第二商品类目之间具有相关性,并且所述第一用户与所述第二用户之间的转账汇总信息符合设定条件,则确定所述第一用户与所述第二用户之间存在供求关系。
可选地,所述第三确定模块13可以用于:若所述第一商品类目与所述第二商品类目之间的相似度大于或等于设定阈值,则确定所述第一商品类目与所述第二商品类目之间具有相关性。
可选地,所述第三确定模块13可以用于:分别获取多个线上商铺各自销售的多个商品类目;根据每个线上商铺对应的多个商品类目的组合情况,构建每个线上商铺对应的共现关系对,其中,一个共现关系对由多个商品类目中的两个不同商品类目构成;根据所述共现关系对确定所述多个商品类目各自对应的编码向量;根据两两编码向量之间的距离,确定对应的两个商品类目之间的相似度;若通过查询已经得到的各相似度确定所述第一商品类目与所述第二商品类目之间的相似度大于或等于设定阈值,则确定所述第一商品类目与所述第二商品类目之间具有相关性。
可选地,所述第三确定模块13可以用于:若所述第一商品类目与所述第二商品类目之间存在进销关系,则确定所述第一商品类目与所述第二商品类目之间具有相关性。
可选地,所述第三确定模块13可以用于:分别获取多个线上商铺各自购买的n个商品类目以及销售的m个商品类目,m和n均为大于或等于1的整数;根据每个线上商铺对应的n个商品类目和m个商品类目的组合情况,构建每个线上商铺对应的m*n个进销关系对,其中,一个进销关系对由n个商品类目中的一个和m个商品类目中的一个构成;筛选出出现次数和条件概率符合设定阈值的目标进销关系对;若所述目标进销关系对中包含由所述第一商品类目与所述第二商品类目构成的进销关系对,则确定所述第一商品类目与所述第二商品类目之间具有相关性。
图7所示装置可以执行前述各实施例中的方法,本实施例未详细描述的部分,可参考前述实施例的相关说明,在此不再赘述。
在一个可能的设计中,上述图7所示的数据处理装置的结构可实现为一电子设备,比如为服务器。如图8所示,该电子设备可以包括:处理器21、存储器22。其中,所述存储器22上存储有可执行代码,当所述可执行代码被所述处理器21执行时,至少使所述处理器21完成如下步骤:
根据资金流向数据确定第一用户存在资金流入第二用户;
确定所述第一用户对应的第一商品类目以及所述第二用户对应的第二商品类目;
若所述第一商品类目与所述第二商品类目之间具有相关性,则确定所述第一用户与所述第二用户之间存在供求关系。
其中,该配网设备的结构中还可以包括通信接口23,用于与其他设备或通信网络通信。
另外,本发明实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行前述各实施例中的各步骤。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和软件结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程设备的处理器以产生一个机器,使得通过计算机或其他可编程设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。