本公开实施例涉及信息展示技术领域,尤其涉及一种价值分布函数的确定方法、装置、电子设备及可读介质。
背景技术:
处于经济飞速发展,信息爆炸式增长的时代,了解信息展示的价值也成为了行业内的重要技术。
价值分布函数是以价值为横坐标,每个价值上分布的数目为纵坐标的函数,通过价值分布函数能够确定每个价值上所分布的数目多少,还能够确定当前价值能够应能信息展示的概率的高低,因此,价值分布函数对于信息展示来说,尤为重要。但是业界目前并没有能够确定信息展示流量的价值分布函数的方法。
技术实现要素:
本公开实施例提供一种价值分布函数的确定方法、装置、电子设备及可读介质,可以实现能够通过已有数据确定信息展示的价值分布函数的效果。
第一方面,本公开实施例提供了一种价值分布函数的确定方法,该方法包括:
根据样本数据至少一个特征的特征可选值,确定至少一个特征的价值分布函数散度;
根据所述至少一个特征的价值分布函数散度,构建决策树;
根据所述决策树确定目标数据的价值分布函数。
进一步的,根据样本数据至少一个特征的特征可选值,确定至少一个特征的价值分布函数散度,包括:
针对样本数据中每一特征,确定该特征的各特征可选值的价值分布函数;
对该特征的各特征可选值进行候选分组形成多个候选集合对,并确定各候选集合对之间的价值分布函数的散度值;
根据各候选集合对之间的价值分布函数的散度值,确定该特征的价值分布函数散度。
进一步的,根据所述至少一个特征的价值分布函数散度,构建决策树,包括:
针对当前节点,将最大价值分布函数散度的特征作为分裂依据,将当前节点分裂为两个子节点;
遍历所有的节点,构建二叉决策树。
进一步的,在针对当前节点,将最大价值分布函数散度的特征作为分裂依据,将当前节点分裂为两个子节点之前,所述方法还包括:
若当前节点内样本数据数量小于预设数量阈值,或者,若当前节点的高度达到预设高度阈值,则停止对当前节点的分裂。
进一步的,根据所述决策树确定目标数据的价值分布函数,包括:
根据决策树中节点内样本数据每一特征的特征可选值,确定目标数据的价值分布函数。
进一步的,根据决策树中节点内样本数据每一特征的特征可选值,确定目标数据的价值分布函数,包括:
获取目标数据的目标特征的目标可选值;
根据所述决策树中节点内样本数据每一特征的特征可选值与所述目标可选值的相似度,确定与目标数据匹配的匹配节点;
根据所述匹配节点内的样本数据的价值分布函数,确定目标数据的价值分布函数。
进一步的,在根据所述决策树确定目标数据的价值分布函数之后,所述方法还包括:
根据所述目标数据的价值分布函数,确定目标数据的期望价值。
第二方面,本公开实施例还提供了一种价值分布函数的确定装置,该装置包括:
价值分布函数散度确定模块,用于根据样本数据至少一个特征的特征可选值,确定至少一个特征的价值分布函数散度;
决策树构建模块,用于根据所述至少一个特征的价值分布函数散度,构建决策树;
价值分布函数确定模块,根据所述决策树确定目标数据的价值分布函数。
进一步的,所述价值分布函数散度确定模块包括:
特征可选值分布确定单元,用于针对样本数据中每一特征,确定该特征的各特征可选值的价值分布函数;
候选集合对散度值确定单元,用于对该特征的各特征可选值进行候选分组形成多个候选集合对,并确定各候选集合对之间的价值分布函数的散度值;
价值分布函数散度确定单元,用于根据各候选集合对之间的价值分布函数的散度值,确定该特征的价值分布函数散度。
进一步的,所述决策树构建模块包括:
节点分裂单元,用于针对当前节点,将最大价值分布函数散度的特征作为分裂依据,将当前节点分裂为两个子节点;
二叉决策树构建单元,用于遍历所有的节点,构建二叉决策树。
进一步的,所述决策树构建模块还包括:
终止分裂确定单元,用于若当前节点内样本数据数量小于预设数量阈值,或者,若当前节点的高度达到预设高度阈值,则停止对当前节点的分裂。
进一步的,所述价值分布函数确定模块包括:
价值分布函数确定单元,用于根据决策树中节点内样本数据每一特征的特征可选值,确定目标数据的价值分布函数。
进一步的,所述价值分布函数确定单元包括:
目标可选值确定子单元,用于获取目标数据的目标特征的目标可选值;
目标可选值匹配子单元,用于根据所述决策树中节点内样本数据每一特征的特征可选值与所述目标可选值的相似度,确定与目标数据匹配的匹配节点;
价值分布函数确定子单元,用于根据所述匹配节点内的样本数据的价值分布函数,确定目标数据的价值分布函数。
进一步的,所述装置还包括:
期望价值确定模块,用于根据所述目标数据的价值分布函数,确定目标数据的期望价值。
第三方面,本公开实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本公开实施例所述的价值分布函数的确定方法。
第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例所述的价值分布函数的确定方法。
本公开实施例所提供的技术方案,通过根据样本数据至少一个特征的特征可选值,确定至少一个特征的价值分布函数散度;根据所述至少一个特征的价值分布函数散度,构建决策树;根据所述决策树确定目标数据的价值分布函数。通过采用本公开所提供的技术方案,可以实现能够通过已有数据确定信息展示的价值分布函数的效果。
附图说明
图1是本公开实施例一提供的价值分布函数的确定方法的流程图;
图2是本公开实施例一提供的价值分布函数的确定方法的流程图;
图3是本公开实施例一提供的价值分布函数的确定方法的流程图;
图4是本公开实施例二提供的价值分布函数的确定装置的结构示意图;
图5是本公开实施例三提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本公开,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
下述各实施例中,每个实施例中同时提供了可选特征和示例,实施例中记载的各个特征可进行组合,形成多个可选方案,不应将每个编号的实施例仅视为一个技术方案。
实施例一
图1是本公开实施例一提供的价值分布函数的确定方法的流程图,本实施例可适用信息展示的情况,该方法可以由本公开实施例所提供的价值分布函数的确定装置来执行,该装置可以由软件和/或硬件的方式来实现,并可集成于客户端、终端以及服务器等电子设备中。
如图1所示,所述价值分布函数的确定方法包括:
s110、根据样本数据至少一个特征的特征可选值,确定至少一个特征的价值分布函数散度。
其中,样本数据可以是对历史信息展示的数据的随机抽取的结果,由于信息展示可能涉及到一个或者多个特征。其中,特征可以是观看展示信息的用户的特征,如年龄段特征,可以是16-18岁、19-22岁以及23-26岁等,省份特征,可以是北京市、上海市以及广东省等,性别特征,可以是男和女,以及其他任何方式划分得到的特征。除此之外,特征还可以是展示信息本身的特征,如展示信息的类型,可以是电商类、饮食生活类以及游戏类等。在本实施例中,特征可以通过信息展示的历史数据中所包含的各个维度的标签来进行划分。
由上述内容可以知道,每个特征可以包含两个及以上特征可选值,不同的特征可选值,都可能会对价值分布函数造成影响。如对性别特征中的男和女来说,如果展示的信息为游戏类型,则男生的价值分布函数可以相对于女生要有所不同,因为男生可能对于游戏类型的展示信息更加关注,下载转化率较高,所以游戏类对于男生的展示信息所确定的价值更高。
根据样本数据至少一个特征的特征可选值,确定至少一个特征的价值分布函数散度。其中,价值分布函数的散度可以是价值分布函数的相对熵,即kl散度(kullback-leible散度)。相对熵可以衡量两个随机分布之间的距离,当两个随机分布相同时,它们的相对熵为零,当两个随机分布的差别增大时,它们的相对熵也会增大。所以相对熵(kl散度)可以用于比较两个数据之间的相似度。通过统计散度的方式来确定特征的价值分布函数散度,可以把价值分布函数较为接近以及价值分布函数截然不同的特征可选值确定出来,同时,还可以确定一个特征中每个特征可选值的价值分布函数之间的差距。
s120、根据所述至少一个特征的价值分布函数散度,构建决策树。
其中,决策树可以是包括一个根节点,和至少两个叶节点构成,如根节点1分裂为节点2和节点3,节点3又分裂为节点4和节点5,则可以把节点3称为中间节点,节点2、节点4和节点5称为叶节点。由此可见,如果只进行一次分裂,则决策树可以不包括中间节点,如果进行多次分裂,则包括中间节点。其中,节点的高度可以是由根节点分裂至当前节点的分裂次数,如节点2和节点3的高度为1级,节点4和节点5的高度为2级,也可以把根节点1的高度作为1级,节点2和节点3的高度为2级,其他节点以此类推。
在本技术方案中,可以把一个特征中特征可选值的价值分布函数与其他特征可选值的价值分布函数的散度值最大的挑选出来,作为决策树根节点或者中间节点的分裂依据。当存在多个特征时,可以针对多个特征进行计算,并取最大的散度值作为当前节点的分裂依据,其他特征在分裂后的子节点来进行进一步确定。如,在根节点中,特征a的特征可选值为a1和a2,特征b的特征可选值为b1、b2和b3,特征c的特征可选值为c1和c2,如果b1与b2+b3的价值分布函数散度最大,则根节点按照b1与b2+b3的方式进行分裂,则分裂后的两个子节点中,第一个子节点含有a1和a2,b1,c1和c2,第二个子节点中含有a1和a2,b2和b3,c1和c2,则可以在这两个子节点继续分裂时,依然按照上述方式去分裂。
在本技术方案中,可选的,根据所述至少一个特征的价值分布函数散度,构建决策树,包括:针对当前节点,将最大价值分布函数散度的特征作为分裂依据,将当前节点分裂为两个子节点;遍历所有的节点,构建二叉决策树。其中,针对当前需要进行分裂的节点,可以根据最大值分布函数散度的特征作为分裂依据,如上述示例中,如果特征a、b和c中,特征b的分布函数散度最大,则以特征b作为分裂依据,具体的,以得到最大散度值的特征可选值划分方式进行分裂,如上述示例中的b1与b2+b3。在本技术方案中,所构建的决策树可以是二叉决策树,二叉决策树的特点在于如果节点分裂,则肯定分裂出两个子节点,本实施例中这样设置的好处是可以得到使分裂得到的每个子节点的价值分布函数最为相似,而且可以保证只要特征存在两个特征可选值,就可以作为分裂依据。
在本技术方案中,可选的,在针对当前节点,将最大价值分布函数散度的特征作为分裂依据,将当前节点分裂为两个子节点之前,所述方法还包括:若当前节点内样本数据数量小于预设数量阈值,或者,若当前节点的高度达到预设高度阈值,则停止对当前节点的分裂。其中,预设数量阈值可以是100个、50个等,预设高度阈值可以是4级、6级等,本技术方案这样设置的好处是可以提高一个节点内的样本数据的代表性,如果盲目分裂,导致节点内样本数过少或者当前节点的高度过高,则会影响当前节点内的样本数据的代表性,无法代表具有共同特性的样本数据的价值分布函数,从而影响通过决策树来确定目标数据的价值分布函数的准确性。
s130、根据所述决策树确定目标数据的价值分布函数。
其中,由于在决策树的构建过程中,是以每次分裂所依据的价值分布函数之间的散度最大来构建的,所以得到的决策树的每个中间节点或者叶节点内的样本数据的价值分布函数已经尽量接近。因此,可以根据各个节点的价值分布函数情况,确定目标数据的价值分布情况。
在本技术方案中,可选的,根据所述决策树确定目标数据的价值分布函数,包括:根据决策树中节点内样本数据每一特征的特征可选值,确定目标数据的价值分布函数。其中,节点内的样本数据可以依然按照特征和特征可选值进行标记,在拿到目标数据之后,可以根据目标数据的特征以及特征可选值,确定目标数据与决策树中的哪个或者哪几个节点的特征以及特征可选值最为接近,确定后,根据一个或者多个节点的价值分布函数确定目标数据的价值分布函数。
本公开实施例所提供的技术方案,通过根据样本数据至少一个特征的特征可选值,确定至少一个特征的价值分布函数散度;根据所述至少一个特征的价值分布函数散度,构建决策树;根据所述决策树确定目标数据的价值分布函数。通过采用本公开所提供的技术方案,可以实现能够通过已有数据确定信息展示的价值分布函数的效果。
在上述各技术方案的基础上,可选的,在根据所述决策树确定目标数据的价值分布函数之后,所述方法还包括:根据所述目标数据的价值分布函数,确定目标数据的期望价值。其中,确定价值分布函数之后,可以确定当前目标数据的期望价值,这有利于平台对于目标数据的价值进行预先评估,而且信息展示者可以根据目标数据的价值分布函数,确定当前所提供的目标数据的价值能够得到信息展示机会的概率是多少,这样在有利于平台对信息展示进行管控的同时,还有利于信息展示者根据实际情况控制针对目标数据所提供的价值。
图2是本公开实施例一提供的价值分布函数的确定方法的流程图。本实施例是在上述实施例的中各个可选方案为基础进行具体化。具体优化为:根据样本数据至少一个特征的特征可选值,确定至少一个特征的价值分布函数散度,包括:针对样本数据中每一特征,确定该特征的各特征可选值的价值分布函数;对该特征的各特征可选值进行候选分组形成多个候选集合对,并确定各候选集合对之间的价值分布函数的散度值;根据各候选集合对之间的价值分布函数的散度值,确定该特征的价值分布函数散度。
如图2所示,所述价值分布函数的确定方法包括:
s210、针对样本数据中每一特征,确定该特征的各特征可选值的价值分布函数。
其中,样本数据中可以包括至少一个特征,当所包括的特征为多个时,可以针对每一个特征,确定各特征可选值的价值分布函数。其中,由于价值数据是大于0的,所以价值分布函数的横坐标可以是从0开始,而纵坐标可以是落在当前价值的样本数据数量,如有100份样本数据,对于5元这一价值来说,可能包括10份样本数据,则在5元处的价值分布函数的纵坐标可以是0.1。一般的,整体来看价值分布函数一般呈现为一个不完全的正态分布曲线。当取横坐标的一个价格值,如5元,可以根据价值分布函数确定如果信息展示者以5元进行竞争,能够得到信息展示的概率有多大,也就是价值分布函数中所有小于5元的价值的概率之和。
s220、对该特征的各特征可选值进行候选分组形成多个候选集合对,并确定各候选集合对之间的价值分布函数的散度值。
其中,如果存在三个特征,即特征a的特征可选值a1、a2和a3,候选集合对可以是特征可选值a1集合与特征可选值a2+a3集合的一对候选集合,还可以是特征可选值a2集合与特征可选值a1+a3集合,还可以是特征可选值a3集合与特征a1+a2集合,这样三个特征的情况下,可以构建三个候选集合对。当然可以理解的,如果只存在两个特征的话,则只能构成一个候选集合对,那么“候选”其实就没有实际意义,实际计算时只要计算这一个集合对的散度值即可。
在得到多个候选集合对之后,确定各候选集合对之间的价值分布函数的散度值,具体的,可以将每个候选集合对的两个集合之间的价值分布函数的散度值进行计算,在本实施例中,可以直接统计计算,也可以按照特征可选值自身的价值分布函数与该特征可选值在集合中的数量占比来确定。这样设置的好处是可以提高候选集合对的两个集合之间的价值分布函数的散度值计算速度。
s230、根据各候选集合对之间的价值分布函数的散度值,确定该特征的价值分布函数散度。
在本实施例中,可以以各候选集合对之间的价值分布函数的散度值的最大值,作为该特征的价值分布函数散度。
s240、根据所述至少一个特征的价值分布函数散度,构建决策树。
在本技术方案中,可以在计算了一个特征的价值分布函数散度之后,遍历所有特征,这样就可以得到所有特征的价值分布函数散度的排序,可以按照其中最大的散度所对应的特征,作为当前节点的分裂依据,以此够成决策树。
s250、根据所述决策树确定目标数据的价值分布函数。
本技术方案在上述各技术方案的基础上,提供了一种对样本数据中的每一个特征进行候选集合对划分以及确定该特征的价值分布函数散度的方法。这样设置的好处是在构建决策树的过程中,可以在每一个节点按照差异最大的条件来分裂,使得得到的节点中的样本数据的价值分布函数尽量相近,有利于通过所构建的决策树来确定目标数据的价值分布函数。
图3是本公开实施例一提供的价值分布函数的确定方法的流程图。本实施例是在上述实施例的中各个可选方案为基础进行具体化。具体优化为:根据决策树中节点内样本数据每一特征的特征可选值,确定目标数据的价值分布函数,包括:获取目标数据的目标特征的目标可选值;根据所述决策树中节点内样本数据每一特征的特征可选值与所述目标可选值的相似度,确定与目标数据匹配的匹配节点;根据所述匹配节点内的样本数据的价值分布函数,确定目标数据的价值分布函数。
如图3所示,所述价值分布函数的确定方法包括:
s310、根据样本数据至少一个特征的特征可选值,确定至少一个特征的价值分布函数散度。
s320、根据所述至少一个特征的价值分布函数散度,构建决策树。
s330、获取目标数据的目标特征的目标可选值。
其中,目标特征可以是与当前决策树构建过程中涉及到的特征相一致的特征,可以理解的,对于目标数据中的特征d,如果构建决策树的过程中没有涉及到,则通过决策树对特征d进行预估是不能够准确的体现的。目标特征的目标可选值对于目标数据来说,可以是每个特征中的一个特定值,如性别特征中,或为男、或为女。
s340、根据所述决策树中节点内样本数据每一特征的特征可选值与所述目标可选值的相似度,确定与目标数据匹配的匹配节点。
在本技术方案中,决策树中的节点内样本数据的特征可能是不唯一的,但是如果存在相同或者相近的特征,是可以用来对目标数据进行匹配的。目标可选值与节点内的数据相似度,可以是根据各节点进行对比,以相似度最高的节点作为匹配节点。在本技术方案中,匹配节点不仅限于一个,也可以存在多个,当存在多个匹配节点时,可以对所有的节点进行加权平均,得到匹配节点的价值分布函数。其加权平均的依据可以是各个匹配节点中的样本数据的数目,还可以是与目标数据之间的相似度,相似度越高,则权重越高。
s350、根据所述匹配节点内的样本数据的价值分布函数,确定目标数据的价值分布函数。
在确定匹配节点之后,可以根据该节点的价值分布函数,预估目标数据的价值分布函数。
本技术方案在上述各技术方案的基础上,提供了一种对目标数据的价值分布函数的具体方法。通过确定匹配节点与根据匹配节点确定目标数据的价值分布函数,可以通过历史数据确定目标数据的价值分布函数,解决了现有技术中无法确定价值分布函数的这一技术问题,达到平台对目标数据的价值的管理和控制的效果,同时有助于信息展示者能够根据自己的需求确定目标数据的信息展示价值。
实施例二
图4是本公开实施例二提供的价值分布函数的确定装置的结构示意图。如图4所示,所述价值分布函数的确定装置,包括:
价值分布函数散度确定模块410,用于根据样本数据至少一个特征的特征可选值,确定至少一个特征的价值分布函数散度;
决策树构建模块420,用于根据所述至少一个特征的价值分布函数散度,构建决策树;
价值分布函数确定模块430,根据所述决策树确定目标数据的价值分布函数。
本公开实施例所提供的技术方案,通过根据样本数据至少一个特征的特征可选值,确定至少一个特征的价值分布函数散度;根据所述至少一个特征的价值分布函数散度,构建决策树;根据所述决策树确定目标数据的价值分布函数。通过采用本公开所提供的技术方案,可以实现能够通过已有数据确定信息展示的价值分布函数的效果。
在上述各技术方案的基础上,可选的,所述价值分布函数散度确定模块410包括:
特征可选值分布确定单元,用于针对样本数据中每一特征,确定该特征的各特征可选值的价值分布函数;
候选集合对散度值确定单元,用于对该特征的各特征可选值进行候选分组形成多个候选集合对,并确定各候选集合对之间的价值分布函数的散度值;
价值分布函数散度确定单元,用于根据各候选集合对之间的价值分布函数的散度值,确定该特征的价值分布函数散度。
在上述各技术方案的基础上,可选的,所述决策树构建模块420包括:
节点分裂单元,用于针对当前节点,将最大价值分布函数散度的特征作为分裂依据,将当前节点分裂为两个子节点;
二叉决策树构建单元,用于遍历所有的节点,构建二叉决策树。
在上述各技术方案的基础上,可选的,所述决策树构建模块420还包括:
终止分裂确定单元,用于若当前节点内样本数据数量小于预设数量阈值,或者,若当前节点的高度达到预设高度阈值,则停止对当前节点的分裂。
在上述各技术方案的基础上,可选的,所述价值分布函数确定模块430包括:
价值分布函数确定单元,用于根据决策树中节点内样本数据每一特征的特征可选值,确定目标数据的价值分布函数。
在上述各技术方案的基础上,可选的,所述价值分布函数确定单元包括:
目标可选值确定子单元,用于获取目标数据的目标特征的目标可选值;
目标可选值匹配子单元,用于根据所述决策树中节点内样本数据每一特征的特征可选值与所述目标可选值的相似度,确定与目标数据匹配的匹配节点;
价值分布函数确定子单元,用于根据所述匹配节点内的样本数据的价值分布函数,确定目标数据的价值分布函数。
在上述各技术方案的基础上,可选的,所述装置还包括:
期望价值确定模块,用于根据所述目标数据的价值分布函数,确定目标数据的期望价值。
上述产品可执行本公开任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
实施例三
图5是本公开实施例三提供的一种电子设备的结构示意图。下面参考图5,其示出了适于用来实现本公开实施例的电子设备500的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、车载电子设备(例如车载导航电子设备)等等的电子设备以及诸如数字tv、台式计算机等等的固定电子设备。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(rom)502中的程序或者从存储装置508加载到随机访问存储器(ram)503中的程序而执行各种适当的动作和处理。在ram503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、rom502以及ram503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。
通常,以下装置可以连接至i/o接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从rom502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:根据样本数据至少一个特征的特征可选值,确定至少一个特征的价值分布函数散度;根据所述至少一个特征的价值分布函数散度,构建决策树;根据所述决策树确定目标数据的价值分布函数。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:根据样本数据至少一个特征的特征可选值,确定至少一个特征的价值分布函数散度;根据所述至少一个特征的价值分布函数散度,构建决策树;根据所述决策树确定目标数据的价值分布函数。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块、单元的名称在某种情况下并不构成对该模块、单元本身的限定。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。