作弊订单识别方法、装置及系统的制作方法
【专利摘要】本申请公开了作弊订单识别方法、装置及系统。所述方法的一【具体实施方式】包括:获取订单信息集合;根据所述地区信息,将所述订单信息集合分成至少一个订单信息子集;对于每一个订单信息子集,构建订单关系网络;对于每一条订单信息,计算该订单信息的订单处理方特征信息、订单申请方特征信息以及该订单信息所属的订单信息子集的连通图的健康度指标;对于每一条订单信息,对健康度指标、订单处理方特征信息和订单申请方特征信息进行加权求和得到该订单信息的加权值,并根据所述加权值来对该订单信息进行识别。该实施方式能够实现对作弊订单的有效识别。
【专利说明】
作弊订单识别方法、装置及系统
技术领域
[0001]本申请涉及信息处理技术领域,具体涉及信息识别技术领域,尤其涉及作弊订单识别方法、装置及系统。
【背景技术】
[0002]日常生活中,人们出行的选择有多种,如乘坐公交车、地铁、出租车和私家车等。其中,乘坐公交车具有线路固定,乘客承载量大的优势,而对于地铁,除了公交车的优势外,还具有准时、故障率低、不受地面交通影响等特点,成为广大公司职员主要的交通选择。
[0003]虽然公交车和地铁具有上述的各种优势,但公交车和地铁都是按照特定的线路运行的,多数情况下,行车线路无法到达人们乘车的最终目的地。私家车和出租车不受行车线路的影响,可以根据人们的目的地自由选择行车线路,但私家车的购买和维护费用较高,且遇到某些交通管制(如单双号限行)时无法使用,并且会影响地面交通,增加了交通拥堵的情况。出租车不受私家车的很多限制(如单双号限行),也无需人们投入很多财力,极大地方便了人们的出行。但出租车也有自己的不足,现有的出租车主要靠司机在行车过程中观察是否有人乘坐出租车,这种方式既不利于司机寻找乘客,也不利于乘客找出租车,并且在很多情况下出现出租车拒载等情况,严重降低了出租车的使用效率。为此,很多出租车都加装了打车软件,一方面能够及时发现附近的出租车乘坐信息;另一方面也能获得打车软件商家的鼓励,获取相应的订单补助,增加司机收入。某些情况下,订单补助甚至比出租车司机正常收入还要高,随之出现了某些出租车司机利用打车软件进行订单作弊,恶意生成作弊订单(B卩,作弊订单是司机和乘客利用软件商家的鼓励政策骗取补助金而生成的订单)的行为,而由于出租车司机的工作性质问题,对于作弊订单的识别有很大困难。
【发明内容】
[0004]本申请提供了作弊订单识别方法、装置及系统,以解决【背景技术】中提到的问题。
[0005]—方面,本申请提供了一种作弊订单识别方法,所述方法包括:获取订单信息集合,其中,订单信息包括订单处理方信息、订单申请方信息和订单内容信息,所述订单内容信息包括地区信息;根据所述地区信息,将所述订单信息集合分成至少一个订单信息子集;对于每一个订单信息子集,构建订单关系网络,其中,所述订单关系网络包括基于该订单信息子集得到的连通图;对于每一条订单信息,计算该订单信息的订单处理方特征信息、订单申请方特征信息以及该订单信息所属的订单信息子集的连通图的健康度指标,其中,订单处理方特征信息用于表征订单处理方作弊的概率,所述订单申请方特征信息用于表征订单申请方作弊的概率,所述健康度指标用于表征所述连通图为作弊连通图的概率;对于每一条订单信息,对健康度指标、订单处理方特征信息和订单申请方特征信息进行加权求和得到该订单信息的加权值,并根据所述加权值来对该订单信息进行识别。
[0006]在一些实施例中,所述对于每一个订单信息子集,构建订单关系网络包括:通过订单信息构建有向图,所述有向图的起点对应所述订单处理方信息,所述有向图的终点对应所述订单申请方信息,所述有向图的从起点到终点的弧对应所述订单内信息;将所述有向图聚合在一起生成连通图。
[0007]在一些实施例中,所述对于每一条订单信息,计算该订单信息所属的订单信息子集的连通图的健康度指标,包括:计算对应所述连通图的连通图特征参数,所述连通图特征参数包括均匀度、密度、复杂度、生长速度中的至少一项,所述均匀度通过所述连通图中各个起点和终点之间的活跃度的方差表征,所述密度通过所述连通图中各个起点和终点之间的活跃度的均值表征,所述复杂度通过所述连通图中起点、终点和弧的数量之和表征,所述生长速度通过所述连通图的生成时间最早的订单和生成时间最晚的订单的时间差表征;对所述连通图特征参数加权得到健康度指标。
[0008]在一些实施例中,所述对于每一条订单信息,计算该订单信息的订单处理方特征信息,包括:计算对应所述订单处理方信息的订单处理方特征参数,所述订单处理方特征参数包括订单周期、订单轨迹、补贴收益和订单申请方重复度中的至少一项,所述订单周期通过订单的生成时刻和完成时刻表征,所述订单轨迹通过订单对应的完成路线表征,所述补贴收益通过对应订单处理方收到的金额与订单申请方实际支付金额的差值表征,所述订单申请方重复度通过同一订单申请方占同一订单处理方全部订单中的比例表征;对所述订单处理方特征参数加权求和得到订单处理方特征信息。
[0009]在一些实施例中,所述对于每一条订单信息,计算该订单信息的订单申请方特征信息,包括:计算对应所述订单申请方信息的订单申请方特征参数,所述订单申请方特征参数包括所述订单周期、所述订单轨迹、实际支付金额和订单处理方重复度中的至少一项,所述实际支付金额通过订单申请方支付的金额表征,所述订单处理方重复度通过同一订单处理方占同一订单申请方全部订单中的比例表征;对所述订单申请方特征参数加权求和得到订单申请方特征信息。
[0010]在一些实施例中,所述对于每一条订单信息,计算该订单信息所属的订单信息子集的连通图的健康度指标,还包括:当通过订单处理方特征信息确认订单处理方为作弊订单处理方,和/或通过订单申请方特征信息确认订单申请方为作弊订单申请方时,所述健康度指标的计算过程还包括:计算对应所述连通图的异常节点占比和异常弧占比,其中,所述异常节点占比通过连通图中已知的作弊订单处理方对应的起点数量和已知的作弊订单申请方对应的终点数量之和,与连通图中起点总数和终点总数之和的比值表征,所述异常弧占比通过连通图中已知的作弊订单对应的弧与连通图中弧的总数之间的比值表征。
[0011]在一些实施例中,所述对于每一条订单信息,对健康度指标、订单处理方特征信息和订单申请方特征信息进行加权求和得到该订单信息的加权值,并根据所述加权值来对该订单信息进行识别,包括:提取订单信息对应的健康度指标、订单处理方特征信息和订单申请方特征信息;对所述健康度指标、订单处理方特征信息和订单申请方特征信息加权求和得到所述订单信息的加权值;当所述加权值小于预订的作弊阈值时,对应所述加权值的订单为作弊订单。
[0012]第二方面,本申请提供了一种作弊订单识别装置,所述装置包括:订单信息集合获取单元,用于获取订单信息集合,其中,订单信息包括订单处理方信息、订单申请方信息和订单内容信息,所述订单内容信息包括地区信息;订单信息子集获取单元,用于根据所述地区信息,将所述订单信息集合分成至少一个订单信息子集;订单关系网络构建单元,用于对每一个订单信息子集构建订单关系网络,其中,所述订单关系网络包括基于该订单信息子集得到的连通图;订单特性信息计算单元,用于对每一条订单信息,计算该订单信息的订单处理方特征信息、订单申请方特征信息以及该订单信息所属的订单信息子集的连通图的健康度指标,其中,订单处理方特征信息用于表征订单处理方作弊的概率,所述订单申请方特征信息用于表征订单申请方作弊的概率,所述健康度指标用于表征所述连通图为作弊连通图的概率;订单信息识别单元,用于对每一条订单信息,对健康度指标、订单处理方特征信息和订单申请方特征信息进行加权求和得到该订单信息的加权值,并根据所述加权值来对该订单信息进行识别。
[0013]在一些实施例中,所述订单关系网络构建单元包括:有向图构建子单元,用于通过订单信息构建有向图,所述有向图的起点对应所述订单处理方信息,所述有向图的终点对应所述订单申请方信息,所述有向图的从起点到终点的弧对应所述订单内信息;连通图生成子单元,用于将所述有向图聚合在一起构成连通图。
[0014]在一些实施例中,所述订单特性信息计算单元包括:连通图特征参数计算子单元,用于计算对应所述连通图的连通图特征参数,所述连通图特征参数包括均匀度、密度、复杂度、生长速度中的至少一项,所述均匀度通过所述连通图中各个起点和终点之间的活跃度的方差表征,所述密度通过所述连通图中各个起点和终点之间的活跃度的均值表征,所述复杂度通过所述连通图中起点、终点和弧的数量之和表征,所述生长速度通过所述连通图的生成时间最早的订单和生成时间最晚的订单的时间差表征;健康度指标计算子单元,用于对所述连通图特征参数加权得到健康度指标。
[0015]在一些实施例中,所述订单特性信息计算单元还包括:订单处理方特征参数计算子单元,用于计算对应所述订单处理方信息的订单处理方特征参数,所述订单处理方特征参数包括订单周期、订单轨迹、补贴收益和订单申请方重复度中的至少一项,所述订单周期通过订单的生成时刻和完成时刻表征,所述订单轨迹通过订单对应的完成路线表征,所述补贴收益通过对应订单处理方收到的金额与订单申请方实际支付金额的差值表征,所述订单申请方重复度通过同一订单申请方占同一订单处理方全部订单中的比例表征;订单处理方特征信息计算子单元,用于对所述订单处理方特征参数加权求和得到订单处理方特征信息。
[0016]在一些实施例中,所述订单特性信息计算单元还包括:订单申请方特征参数计算子单元,用于计算对应所述订单申请方信息的订单申请方特征参数,所述订单申请方特征参数包括所述订单周期、所述订单轨迹、实际支付金额和订单处理方重复度中的至少一项,所述实际支付金额通过订单申请方支付的金额表征,所述订单处理方重复度通过同一订单处理方占同一订单申请方全部订单中的比例表征;订单申请方特征信计算子单元,用于对所述订单申请方特征参数加权求和得到订单申请方特征信息。
[0017]在一些实施例中,所述健康度指标计算子单元还包括:异常节点占比和异常弧占比计算模块,用于在通过订单处理方特征信息确认订单处理方为作弊订单处理方,和/或通过订单申请方特征信息确认订单申请方为作弊订单申请方时,计算对应所述连通图的异常节点占比和异常弧占比,其中,所述异常节点占比通过连通图中已知的作弊订单处理方对应的起点数量和已知的作弊订单申请方对应的终点数量之和,与连通图中起点总数和终点总数之和的比值表征,所述异常弧占比通过连通图中已知的作弊订单对应的弧与连通图中弧的总数之间的比值表征。
[0018]在一些实施例中,所述订单信息识别单元包括:订单特性信息提取子单元,用于提取订单信息对应的健康度指标、订单处理方特征信息和订单申请方特征信息;订单信息加权值计算子单元,用于对所述健康度指标、订单处理方特征信息和订单申请方特征信息加权求和得到所述订单信息的加权值;订单信息识别子单元,用于在所述加权值小于预订的作弊阈值时,对应所述加权值的订单为作弊订单。
[0019]第三方面,本申请提供了一种作弊订单识别系统,所述系统包括上述第二方面的作弊订单识别装置。
[0020]本申请提供的作弊订单识别方法、装置及系统,首先按照地区信息将订单信息集合分成订单信息子集,并根据每个订单信息子集内的订单信息构建订单关系网络;然后计算订单信息的订单处理方特征信息和订单申请方特征信息,能够识别出订单处理方和/或订单申请方是否作弊;计算该订单信息所属的订单信息子集的连通图的健康度指标,能够对连通图整体的订单作弊情况进行判断;最后基于健康度指标、订单处理方特征信息和订单申请方特征信息,计算订单信息的加权值,实现对每一条订单信息的作弊识别。
【附图说明】
[0021]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0022]图1是根据本申请的可以应用于其中的示例性系统架构图;
[0023]图2是根据本申请的作弊订单识别方法的一个实施例流程图;
[0024]图3是根据本实施例的作弊订单识别方法的应用场景的一个示意图;
[0025]图4是对应图3的数据处理架构图;
[0026]图5是根据本申请的作弊订单识别装置的一个实施例结构示意图;
[0027]图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。
【具体实施方式】
[0028]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
[0029]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0030]图1示出了可以应用本申请的作弊订单识别方法或作弊订单识别装置的实施例的示例性系统架构100。
[0031]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0032]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送订单信息等。终端设备101、102、103上可以安装有各种订单应用和网络应用,例如订单信息提示软件和浏览器等。
[0033]终端设备101、102、103可以是具有显示屏并且支持浏览器的各种电子设备,包括但不限于智能手机、平板电脑和笔记本等。
[0034]服务器105可以是提供各种订单信息的服务器,例如为终端设备101、102、103提供订单信息的订单服务器。
[0035]需要说明的是,本申请实施例所提供的作弊订单识别方法一般由服务器105执行,相应地,作弊订单识别装置一般设置于服务器105中。
[0036]应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0037]继续参考图2,图2示出了作弊订单识别方法的一个实施例的流程图200。
[0038]如图2所示,本实施例的作弊订单识别方法包括以下步骤:
[0039]步骤201,获取订单信息集合。
[0040]在本实施例中,作弊订单识别方法运行于其上的电子设备(例如图1所示的服务器105)可以通过有线连接方式或者无线连接方式与终端设备(例如图1所示的终端设备101、102、103)进行数据传递,实现对作弊订单的识别。本实施例的作弊订单是指订单处理方和订单申请方通过订单作弊的方式,使订单处理方恶意获得补贴收益而生成的订单。
[0041]本实施例首先获取订单信息集合,订单信息集合中包含了各种订单信息,其中,订单信息包括订单处理方信息、订单申请方信息和订单内容信息,所述订单内容信息包括地区信息。以打车订单为例,用户需要先在打车软件中注册,填写乘客信息(如,姓名、性别、所在地、联系电话),然后乘客通过智能终端(如手机、平板)上的打车软件发布打车订单,打车软件在乘客的智能终端上显示乘客所在位置及周围可能接单的出租车信息(如出租车所在位置、与乘客的距离),当有出租车司机接单时,显示该出租车的信息(如司机名称、联系电话、到达乘客处需要的时间),当出租车搭载乘客后,打车订单正式生成,系统服务器(如图1中的服务器105)记录打车内容信息(如乘客信息、始发地、目的地、所用时间、乘客支付费用和司机费用及补助)。即,订单信息集合可以包含司机信息(即订单处理方信息)、乘客信息(订单申请方信息)和打车内容信息(即订单内容信息)。打车订单的地区信息就是该打车订单所在的地理区域,如,北京地区的某乘客乘坐出租车,则对应的打车订单的地区信息就是北京。
[0042]步骤202,根据所述地区信息,将所述订单信息集合分成至少一个订单信息子集。
[0043]订单信息集合中包含了各种订单信息,为了便于对订单信息的分析,可以将订单信息按设定条件进行分类分析。由于作弊订单一定是在同一地区完成的(本实施例不考虑跨地区的情况),所以,本实施例以地区信息为设定条件,按订单信息所在的地区信息将订单信息分成多个订单信息子集,每个订单信息子集中至少包含一个订单信息。
[0044]步骤203,对于每一个订单信息子集,构建订单关系网络。
[0045]其中,所述订单关系网络包括基于该订单信息子集得到的连通图。
[0046]订单信息子集中通常包括多个订单信息,通过订单信息构建订单关系网络,能够根据订单信息之间的相互关系对订单信息做出判断。连通图是将订单信息图形化后得到的显示图,能够表明订单信息自身的特性,以及订单信息之间的相互关系。
[0047]在本实施例的一些可选的实现方式中,所述对于每一个订单信息子集,构建订单关系网络包括:
[0048]第一步,通过订单信息构建有向图。
[0049]所述有向图的起点对应所述订单处理方信息,所述有向图的终点对应所述订单申请方信息,所述有向图的从起点到终点的弧对应所述订单内信息。有向图能够清晰地表明订单中的订单处理方信息、订单申请方信息和订单内容信息,进而对订单信息是否为作弊订单做出判断。
[0050]第二步,将所述有向图聚合在一起生成连通图。
[0051]将满足某一地区信息的所有有向图聚合在一起,就生成了该地区的订单信息对应的连通图。连通图中的有向图可以单独存在,也可以多个有向图组合存在。例如,司机和乘客之间只生成过一次打车订单没有生成第二次(或更多)打车订单,此时,在连通图中会出现一条有向图;当同一司机和多个乘客之间只生成过一次打车订单时,在连通图中会以该司机为公共初始点,多个乘客为终点的有向图;当同一司机和同一乘客之间生成第二次(或更多)打车订单,则在连通图中会由该司机和乘客之间的多条弧构成的有向图。
[0052]步骤204,对于每一条订单信息,计算该订单信息的订单处理方特征信息、订单申请方特征信息以及该订单信息所属的订单信息子集的连通图的健康度指标。
[0053]其中,订单处理方特征信息用于表征订单处理方作弊的概率,所述订单申请方特征信息用于表征订单申请方作弊的概率,所述健康度指标用于表征所述连通图为作弊连通图的概率,其中,作弊连通图为存在订单处理方作弊、订单申请方作弊,或订单处理方和订单申请方同时作弊的连通图。
[0054]在本实施例的一些可选的实现方式中,所述对于每一条订单信息,计算该订单信息所属的订单信息子集的连通图的健康度指标,包括:
[0055]第一步,计算对应所述连通图的连通图特征参数。
[0056]所述连通图特征参数包括均匀度、密度、复杂度、生长速度中的至少一项。所述均匀度通过所述连通图中各个起点和终点之间的活跃度的方差表征;所述密度通过所述连通图中各个起点和终点之间的活跃度的均值表征;所述复杂度通过所述连通图中起点、终点和弧的数量之和表征;所述生长速度通过所述连通图的生成时间最早的订单和生成时间最晚的订单的时间差表征。
[0057]其中,活跃度为对应的节点的出度和入度之和。出度为节点作为起点的订单数量;入度为节点作为终点的订单数量;通常情况下,一个节点可以是起点,也可以是终点,还可以同时为起点和终点。还以打车订单为例,在打车订单对应的连通图中,对于司机而言,活跃度为以该司机为起点的订单数量(对应出度);对于乘客而言,活跃度为以该乘客为终点的订单数量(对应入度);实际中还存在一种情况,即,某司机上班时搭载乘客,此时,该司机在订单信息中作为起点,当司机下班后又作为乘客打车,此时,该司机在订单信息中作为终点,即出现某些节点同时为起点和终点的情况。具体的,某一司机作为起点的出度为10,作为终点的入度为2,则该司机对应的节点的活跃度为12。
[0058]有了活跃度以后,就可以计算连通图的均匀度和密度。复杂度、生长速度也可以根据订单信息求得。
[0059]第二步,对所述连通图特征参数加权得到健康度指标。
[0060]实际中,连通图特征参数被赋予不同的权重,然后求得各个连通图特征参数与权重的乘积,并求和得到对应连通图的健康度指标。
[0061]在本实施例的一些可选的实现方式中,对于每一条订单信息,计算该订单信息的订单处理方特征信息,包括:
[0062]第一步,计算对应所述订单处理方信息的订单处理方特征参数。
[0063]所述订单处理方特征参数包括订单周期、订单轨迹、补贴收益和订单申请方重复度中的至少一项。所述订单周期通过订单的生成时刻和完成时刻表征;所述订单轨迹通过订单对应的完成路线表征,即订单对应的实际线路;所述补贴收益通过对应订单处理方收到的金额与订单申请方实际支付金额的差值表征,以打车为例,司机得到的金额与乘客支付的金额只差就是补贴收益;所述订单申请方重复度通过同一订单申请方占同一订单处理方全部订单中的比例表征,以打车为例,某一司机有10个订单信息,其中,一个乘客和该司机有3个订单信息,则对应该乘客的订单申请方重复度为3/10。
[0064]第二步,对所述订单处理方特征参数加权求和得到订单处理方特征信息。
[0065]和上述连通图特征参数类似,订单处理方特征参数也需要赋予不同的权重,然后求得各个订单处理方特征参数与权重的乘积,并求和得到订单处理方特征信息。当订单处理方特征信息低于订单处理方阈值时,可以判断订单处理方为作弊订单处理方。
[0066]在本实施例的一些可选的实现方式中,对于每一条订单信息,计算该订单信息的订单申请方特征信息,包括:
[0067]第一步,计算对应所述订单申请方信息的订单申请方特征参数。
[0068]所述订单申请方特征参数包括所述订单周期、所述订单轨迹、实际支付金额和订单处理方重复度中的至少一项。其中,订单周期和订单轨迹与计算订单处理方特征参数时相同,此处不再赘述。所述实际支付金额通过订单申请方支付的金额表征;所述订单处理方重复度通过同一订单处理方占同一订单申请方全部订单中的比例表征,以打车为例,某一乘客有10个订单信息,其中,一个司机与该乘客有4个订单信息,则对应该司机的订单处理方重复度为4/10。
[0069]第二步,对所述订单申请方特征参数加权求和得到订单申请方特征信息。
[0070]和上述连通图特征参数类似,订单申请方特征参数也需要赋予不同的权重,然后求得各个订单申请方特征参数与权重的乘积,并求和得到订单申请方特征信息。当订单申请方特征信息低于订单申请方阈值时,可以判断订单申请方为作弊订单申请方。
[0071]在本实施例的一些可选的实现方式中,所述对于每一条订单信息,计算该订单信息所属的订单信息子集的连通图的健康度指标,还包括:
[0072]当通过订单处理方特征信息确认订单处理方为作弊订单处理方,和/或通过订单申请方特征信息确认订单申请方为作弊订单申请方时,所述健康度指标的计算过程还包括:
[0073]计算对应所述连通图的异常节点占比和异常弧占比,其中,所述异常节点占比通过连通图中已知的作弊订单处理方对应的起点数量和已知的作弊订单申请方对应的终点数量之和,与连通图中起点总数和终点总数之和的比值表征,所述异常弧占比通过连通图中已知的作弊订单对应的弧与连通图中弧的总数之间的比值表征。当异常节点占比和异常弧占比发生变化时,需要将异常节点占比和异常弧占比也加权计入计算健康度指标的过程中。
[0074]步骤205,对于每一条订单信息,对健康度指标、订单处理方特征信息和订单申请方特征信息进行加权求和得到该订单信息的加权值,并根据所述加权值来对该订单信息进行识别。
[0075]对某一特征的订单信息来说,需要综合考虑订单处理方特征信息、订单申请方特征信息和该订单信息所在的连通图的健康度指标,对健康度指标、订单处理方特征信息和订单申请方特征信息进行加权求得该订单信息的加权值,进而识别出该订单信息是否是作弊订单。
[0076]在本实施例的一些可选的实现方式中,步骤205还可以包括以下步骤:
[0077]第一步,提取订单信息对应的健康度指标、订单处理方特征信息和订单申请方特征信息。
[0078]首先提取对应某一订单信息的订单处理方特征信息和订单申请方特征信息,以及该订单信息所在的连通图的健康度指标。
[0079]第二步,对所述健康度指标、订单处理方特征信息和订单申请方特征信息加权求和得到所述订单信息的加权值。
[0080]健康度指标、订单处理方特征信息和订单申请方特征信息的权值根据实际情况而定。通常,作弊订单需要订单处理方和订单申请方一起完成,所以,当订单处理方特征信息和订单申请方特征信息的取值都较低时,订单处理方为作弊订单的可能性很大。需要分别为订单处理方和订单申请方赋予较小的权值。订单信息所在的连通图可能有多个其他订单信息,其他订单对该订单信息是否为作弊订单影响不大,可以给健康度指标赋予较大的权值,最终得到该订单信息的加权值。
[0081 ]第三步,当所述加权值小于预订的作弊阈值时,对应所述加权值的订单为作弊订单。
[0082]继续参见图3,图3是根据本实施例的作弊订单识别方法的应用场景的一个示意图。图4是对应图3的数据处理架构图。图3代表某一地区的打车订单构成的连通图,每个数字编号都代表一个司机或乘客,司机到乘客的有向图代表了订单信息。由图3可知,编号为1473875378的节点在多数有向图中为起点,在2个订单中为终点,即编号为1473875378对应司机,且编号为1473875378在与编号为1723278531的节点的打车订单中为乘客。编号为1723278531的节点所有的打车订单都为起点,则编号为1723278531的节点为司机。编号为771006573的节点在其所有打车订单中都是终点,所以编号为771006573的节点为乘客。编号为2167302708的节点和编号为1374712778的节点的大部分打车订单都与编号为1473875378的节点有关,且订单频繁(即订单处理方重复度很高)。当编号为2167302708的节点、编号为1374712778的节点和编号为1473875378的节点自身的订单申请方特征信息取值较低时,并且图3的连通图的健康度指标也较低时,编号为2167302708的节点、编号为1374712778的节点和编号为1473875378的节点之间的订单信息为作弊订单的可能性就很高,具体取值需要根据实际订单信息考虑。图4是根据图3中各个打车订单信息,识别作弊订单的数据处理架构图,图4的数据处理过程和上述识别作弊订单的过程相同,此处不再一一赘述。
[0083]本申请的上述实施例提供的方法首先按照地区信息将订单信息集合分成订单信息子集,并根据每个订单信息子集内的订单信息构建订单关系网络;然后计算订单信息的订单处理方特征信息和订单申请方特征信息,能够识别出订单处理方和/或订单申请方是否作弊;计算该订单信息所属的订单信息子集的连通图的健康度指标,能够对连通图整体的订单作弊情况进行判断;最后基于健康度指标、订单处理方特征信息和订单申请方特征信息,计算订单信息的加权值,实现对每一条订单信息的作弊识别。
[0084]进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种作弊订单识别装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
[0085]如图5所示,本实施例上述的作弊订单识别装置500包括:订单信息集合获取单元501、订单信息子集获取单元502、订单关系网络构建单元503、订单特性信息计算单元504和订单信息识别单元505。其中,订单信息集合获取单元501用于获取订单信息集合,其中,订单信息包括订单处理方信息、订单申请方信息和订单内容信息,所述订单内容信息包括地区信息;订单信息子集获取单元502用于根据所述地区信息,将所述订单信息集合分成至少一个订单信息子集;订单关系网络构建单元503用于对每一个订单信息子集构建订单关系网络,其中,所述订单关系网络包括基于该订单信息子集得到的连通图;订单特性信息计算单元504用于对每一条订单信息,计算该订单信息的订单处理方特征信息、订单申请方特征信息以及该订单信息所属的订单信息子集的连通图的健康度指标,其中,订单处理方特征信息用于表征订单处理方作弊的概率,所述订单申请方特征信息用于表征订单申请方作弊的概率,所述健康度指标用于表征所述连通图为作弊连通图的概率;订单信息识别单元505用于对每一条订单信息,对健康度指标、订单处理方特征信息和订单申请方特征信息进行加权求和得到该订单信息的加权值,并根据所述加权值来对该订单信息进行识别。
[0086]在本实施例的一些可选的实现方式中,所述订单关系网络构建单元503包括有向图构建子单元(图中未示出)和连通图生成子单元(图中未示出)。其中,有向图构建子单元用于通过订单信息构建有向图,所述有向图的起点对应所述订单处理方信息,所述有向图的终点对应所述订单申请方信息,所述有向图的从起点到终点的弧对应所述订单内信息;连通图生成子单元用于将所述有向图聚合在一起构成连通图。
[0087]在本实施例的一些可选的实现方式中,所述订单特性信息计算单元504包括:连通图特征参数计算子单元(图中未示出)和健康度指标计算子单元。其中,连通图特征参数计算子单元用于计算对应所述连通图的连通图特征参数,所述连通图特征参数包括均匀度、密度、复杂度、生长速度中的至少一项,所述均匀度通过所述连通图中各个起点和终点之间的活跃度的方差表征,所述密度通过所述连通图中各个起点和终点之间的活跃度的均值表征,所述复杂度通过所述连通图中起点、终点和弧的数量之和表征,所述生长速度通过所述连通图的生成时间最早的订单和生成时间最晚的订单的时间差表征;健康度指标计算子单元用于对所述连通图特征参数加权得到健康度指标。
[0088]在本实施例的一些可选的实现方式中,所述订单特性信息计算单元504还包括:订单处理方特征参数计算子单元(图中未示出)和订单处理方特征信息计算子单元(图中未示出)。其中,订单处理方特征参数计算子单元用于计算对应所述订单处理方信息的订单处理方特征参数,所述订单处理方特征参数包括订单周期、订单轨迹、补贴收益和订单申请方重复度中的至少一项,所述订单周期通过订单的生成时刻和完成时刻表征,所述订单轨迹通过订单对应的完成路线表征,所述补贴收益通过对应订单处理方收到的金额与订单申请方实际支付金额的差值表征,所述订单申请方重复度通过同一订单申请方占同一订单处理方全部订单中的比例表征;订单处理方特征信息计算子单元用于对所述订单处理方特征参数加权求和得到订单处理方特征信息。
[0089]在本实施例的一些可选的实现方式中,所述订单特性信息计算单元504还包括:订单申请方特征参数计算子单元(图中未示出)和订单申请方特征信计算子单元(图中未示出)。其中,订单申请方特征参数计算子单元用于计算对应所述订单申请方信息的订单申请方特征参数,所述订单申请方特征参数包括所述订单周期、所述订单轨迹、实际支付金额和订单处理方重复度中的至少一项,所述实际支付金额通过订单申请方支付的金额表征,所述订单处理方重复度通过同一订单处理方占同一订单申请方全部订单中的比例表征;订单申请方特征信计算子单元用于对所述订单申请方特征参数加权求和得到订单申请方特征?目息O
[0090]在本实施例的一些可选的实现方式中,所述健康度指标计算子单元还包括异常节点占比和异常弧占比计算模块(图中未示出),用于在通过订单处理方特征信息确认订单处理方为作弊订单处理方,和/或通过订单申请方特征信息确认订单申请方为作弊订单申请方时,计算对应所述连通图的异常节点占比和异常弧占比,其中,所述异常节点占比通过连通图中已知的作弊订单处理方对应的起点数量和已知的作弊订单申请方对应的终点数量之和,与连通图中起点总数和终点总数之和的比值表征,所述异常弧占比通过连通图中已知的作弊订单对应的弧与连通图中弧的总数之间的比值表征。
[0091 ]在本实施例的一些可选的实现方式中,所述订单信息识别单元505包括:订单特性信息提取子单元(图中未示出)、订单信息加权值计算子单元(图中未示出)和订单信息识别子单元(图中未示出)。其中,订单特性信息提取子单元用于提取订单信息对应的健康度指标、订单处理方特征信息和订单申请方特征信息;订单信息加权值计算子单元用于对所述健康度指标、订单处理方特征信息和订单申请方特征信息加权求和得到所述订单信息的加权值;订单信息识别子单元用于在所述加权值小于预订的作弊阈值时,对应所述加权值的订单为作弊订单。
[0092]本实施例还提供了一种作弊订单识别系统,上述系统包括上述的作弊订单识别装置。
[0093]下面参考图6,其示出了适于用来实现本申请实施例的订单信息服务器的计算机系统600的结构示意图。
[0094]如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(R0M)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 60KROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线 604。
[0095]以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606 ;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口 605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
[0096]特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
[0097]附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0098]描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括订单信息集合获取单元、订单信息子集获取单元、订单关系网络构建单元、订单特性信息计算单元和订单信息识别单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,订单信息识别单元还可以被描述为“用于识别订单信息的单元”。
[0099]作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:获取订单信息集合,其中,订单信息包括订单处理方信息、订单申请方信息和订单内容信息,所述订单内容信息包括地区信息;根据所述地区信息,将所述订单信息集合分成至少一个订单信息子集;对于每一个订单信息子集,构建订单关系网络,其中,所述订单关系网络包括基于该订单信息子集得到的连通图;对于每一条订单信息,计算该订单信息的订单处理方特征信息、订单申请方特征信息以及该订单信息所属的订单信息子集的连通图的健康度指标,其中,订单处理方特征信息用于表征订单处理方作弊的概率,所述订单申请方特征信息用于表征订单申请方作弊的概率,所述健康度指标用于表征所述连通图为作弊连通图的概率;对于每一条订单信息,对健康度指标、订单处理方特征信息和订单申请方特征信息进行加权求和得到该订单信息的加权值,并根据所述加权值来对该订单信息进行识别。
[0100]以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
【主权项】
1.一种作弊订单识别方法,其特征在于,所述方法包括: 获取订单信息集合,其中,订单信息包括订单处理方信息、订单申请方信息和订单内容信息,所述订单内容信息包括地区信息; 根据所述地区信息,将所述订单信息集合分成至少一个订单信息子集; 对于每一个订单信息子集,构建订单关系网络,其中,所述订单关系网络包括基于该订单信息子集得到的连通图; 对于每一条订单信息,计算该订单信息的订单处理方特征信息、订单申请方特征信息以及该订单信息所属的订单信息子集的连通图的健康度指标,其中,订单处理方特征信息用于表征订单处理方作弊的概率,所述订单申请方特征信息用于表征订单申请方作弊的概率,所述健康度指标用于表征所述连通图为作弊连通图的概率; 对于每一条订单信息,对健康度指标、订单处理方特征信息和订单申请方特征信息进行加权求和得到该订单信息的加权值,并根据所述加权值来对该订单信息进行识别。2.根据权利要求1所述的方法,其特征在于,所述对于每一个订单信息子集,构建订单关系网络包括: 通过订单信息构建有向图,所述有向图的起点对应所述订单处理方信息,所述有向图的终点对应所述订单申请方信息,所述有向图的从起点到终点的弧对应所述订单内信息;将所述有向图聚合在一起生成连通图。3.根据权利要求1所述的方法,其特征在于,所述对于每一条订单信息,计算该订单信息所属的订单信息子集的连通图的健康度指标,包括: 计算对应所述连通图的连通图特征参数,所述连通图特征参数包括均匀度、密度、复杂度、生长速度中的至少一项,所述均匀度通过所述连通图中各个起点和终点之间的活跃度的方差表征,所述密度通过所述连通图中各个起点和终点之间的活跃度的均值表征,所述复杂度通过所述连通图中起点、终点和弧的数量之和表征,所述生长速度通过所述连通图的生成时间最早的订单和生成时间最晚的订单的时间差表征; 对所述连通图特征参数加权得到健康度指标。4.根据权利要求3所述的方法,其特征在于,所述对于每一条订单信息,计算该订单信息的订单处理方特征信息,包括: 计算对应所述订单处理方信息的订单处理方特征参数,所述订单处理方特征参数包括订单周期、订单轨迹、补贴收益和订单申请方重复度中的至少一项,所述订单周期通过订单的生成时刻和完成时刻表征,所述订单轨迹通过订单对应的完成路线表征,所述补贴收益通过对应订单处理方收到的金额与订单申请方实际支付金额的差值表征,所述订单申请方重复度通过同一订单申请方占同一订单处理方全部订单中的比例表征; 对所述订单处理方特征参数加权求和得到订单处理方特征信息。5.根据权利要求4所述的方法,其特征在于,所述对于每一条订单信息,计算该订单信息的订单申请方特征信息,包括: 计算对应所述订单申请方信息的订单申请方特征参数,所述订单申请方特征参数包括所述订单周期、所述订单轨迹、实际支付金额和订单处理方重复度中的至少一项,所述实际支付金额通过订单申请方支付的金额表征,所述订单处理方重复度通过同一订单处理方占同一订单申请方全部订单中的比例表征; 对所述订单申请方特征参数加权求和得到订单申请方特征信息。6.根据权利要求5所述的方法,其特征在于,所述对于每一条订单信息,计算该订单信息所属的订单信息子集的连通图的健康度指标,还包括: 当通过订单处理方特征信息确认订单处理方为作弊订单处理方,和/或通过订单申请方特征信息确认订单申请方为作弊订单申请方时,所述健康度指标的计算过程还包括: 计算对应所述连通图的异常节点占比和异常弧占比,其中,所述异常节点占比通过连通图中已知的作弊订单处理方对应的起点数量和已知的作弊订单申请方对应的终点数量之和,与连通图中起点总数和终点总数之和的比值表征,所述异常弧占比通过连通图中已知的作弊订单对应的弧与连通图中弧的总数之间的比值表征。7.根据权利要求1-6任一的所述方法,其特征在于,所述对于每一条订单信息,对健康度指标、订单处理方特征信息和订单申请方特征信息进行加权求和得到该订单信息的加权值,并根据所述加权值来对该订单信息进行识别,包括: 提取订单信息对应的健康度指标、订单处理方特征信息和订单申请方特征信息; 对所述健康度指标、订单处理方特征信息和订单申请方特征信息加权求和得到所述订单信息的加权值; 当所述加权值小于预订的作弊阈值时,对应所述加权值的订单为作弊订单。8.一种作弊订单识别装置,其特征在于,所述装置包括: 订单信息集合获取单元,用于获取订单信息集合,其中,订单信息包括订单处理方信息、订单申请方信息和订单内容信息,所述订单内容信息包括地区信息; 订单信息子集获取单元,用于根据所述地区信息,将所述订单信息集合分成至少一个订单信息子集; 订单关系网络构建单元,用于对每一个订单信息子集构建订单关系网络,其中,所述订单关系网络包括基于该订单信息子集得到的连通图; 订单特性信息计算单元,用于对每一条订单信息,计算该订单信息的订单处理方特征信息、订单申请方特征信息以及该订单信息所属的订单信息子集的连通图的健康度指标,其中,订单处理方特征信息用于表征订单处理方作弊的概率,所述订单申请方特征信息用于表征订单申请方作弊的概率,所述健康度指标用于表征所述连通图为作弊连通图的概率; 订单信息识别单元,用于对每一条订单信息,对健康度指标、订单处理方特征信息和订单申请方特征信息进行加权求和得到该订单信息的加权值,并根据所述加权值来对该订单?目息进行识别。9.根据权利要求8所述的装置,其特征在于,所述订单关系网络构建单元包括: 有向图构建子单元,用于通过订单信息构建有向图,所述有向图的起点对应所述订单处理方信息,所述有向图的终点对应所述订单申请方信息,所述有向图的从起点到终点的弧对应所述订单内信息; 连通图生成子单元,用于将所述有向图聚合在一起构成连通图。10.根据权利要求8所述的装置,其特征在于,所述订单特性信息计算单元包括: 连通图特征参数计算子单元,用于计算对应所述连通图的连通图特征参数,所述连通图特征参数包括均匀度、密度、复杂度、生长速度中的至少一项,所述均匀度通过所述连通图中各个起点和终点之间的活跃度的方差表征,所述密度通过所述连通图中各个起点和终点之间的活跃度的均值表征,所述复杂度通过所述连通图中起点、终点和弧的数量之和表征,所述生长速度通过所述连通图的生成时间最早的订单和生成时间最晚的订单的时间差表征; 健康度指标计算子单元,用于对所述连通图特征参数加权得到健康度指标。11.根据权利要求10所述的装置,其特征在于,所述订单特性信息计算单元还包括: 订单处理方特征参数计算子单元,用于计算对应所述订单处理方信息的订单处理方特征参数,所述订单处理方特征参数包括订单周期、订单轨迹、补贴收益和订单申请方重复度中的至少一项,所述订单周期通过订单的生成时刻和完成时刻表征,所述订单轨迹通过订单对应的完成路线表征,所述补贴收益通过对应订单处理方收到的金额与订单申请方实际支付金额的差值表征,所述订单申请方重复度通过同一订单申请方占同一订单处理方全部订单中的比例表征; 订单处理方特征信息计算子单元,用于对所述订单处理方特征参数加权求和得到订单处理方特征信息。12.根据权利要求11所述的装置,其特征在于,所述订单特性信息计算单元还包括: 订单申请方特征参数计算子单元,用于计算对应所述订单申请方信息的订单申请方特征参数,所述订单申请方特征参数包括所述订单周期、所述订单轨迹、实际支付金额和订单处理方重复度中的至少一项,所述实际支付金额通过订单申请方支付的金额表征,所述订单处理方重复度通过同一订单处理方占同一订单申请方全部订单中的比例表征; 订单申请方特征信计算子单元,用于对所述订单申请方特征参数加权求和得到订单申请方特征信息。13.根据权利要求12所述的装置,其特征在于,所述健康度指标计算子单元还包括: 异常节点占比和异常弧占比计算模块,用于在通过订单处理方特征信息确认订单处理方为作弊订单处理方,和/或通过订单申请方特征信息确认订单申请方为作弊订单申请方时,计算对应所述连通图的异常节点占比和异常弧占比,其中,所述异常节点占比通过连通图中已知的作弊订单处理方对应的起点数量和已知的作弊订单申请方对应的终点数量之和,与连通图中起点总数和终点总数之和的比值表征,所述异常弧占比通过连通图中已知的作弊订单对应的弧与连通图中弧的总数之间的比值表征。14.根据权利要求8-13任一的所述装置,其特征在于,所述订单信息识别单元包括: 订单特性信息提取子单元,用于提取订单信息对应的健康度指标、订单处理方特征信息和订单申请方特征信息; 订单信息加权值计算子单元,用于对所述健康度指标、订单处理方特征信息和订单申请方特征信息加权求和得到所述订单信息的加权值; 订单信息识别子单元,用于在所述加权值小于预订的作弊阈值时,对应所述加权值的订单为作弊订单。15.—种作弊订单识别系统,其特征在于,所述系统包括权利要求8-14任一的所述作弊订单识别装置。
【文档编号】G06Q30/06GK105894360SQ201610197403
【公开日】2016年8月24日
【申请日】2016年3月31日
【发明人】刘坤
【申请人】百度在线网络技术(北京)有限公司