商户的商圈信息的标定的制作方法_3

文档序号:9826533阅读:来源:国知局
其所 属商圈的种子节点。需要说明的是,每个商圈的种子节点的数目不是限制性的,但是,每个 商圈的种子节点的数目越大,对本发明的标定结果的准确性提升越好,同时,种子节点应当 选取该商圈的最具有代表的商户,这样也有利于提升发明的标定结果的准确性。并且,优选 地,不同商圈之间的种子节点的数目不应差异过大,例如,不同商圈之间的种子节点的数目 差异不超过20个,不同商圈之间的种子节点的数目差异的范围值可以通过在标定商户的 商圈信息的模型训练过程中根据实际数据情况来调整。
[0041] 在该实施例中,由这些种子节点出发,可以在商户之间的关联关系网中计算其他 商户的相对若干商圈的从属率。
[0042] 为方便说明,假设所有的商户隶属于两个商圈(其他数目的商圈可以本发明实施 例的揭示以此类推),那么,在初始条件下认定所有的种子节点相对其所隶属的商圈的从属 率为1,以下说明计算其他商户相对不同商圈的从属率。在本发明实施例中,借助"独立瀑 布模型(Independent Cascade Model)"来实现从属率的计算的,具体的操作过程如下。 [0043] 首先需要说明的是,对于某一商圈,商户分为"已标定从属率"和"未标定从属率" 这两类,初始情况下,只有种子节点是已标定从属率的,而所有的商户一旦被标定对于某一 商圈的从属率,那么其对于该商圈的从属率不可以再被改变。
[0044] 然后,对于每一个已标定相应商圈的从属率的商户,计算与该商户有关联的、且未 被标定从属率的商户的从属率。示例地,假设商户A已被标定对于商圈1的从属率&,或者 A同时被标定了对于商圈1和商圈2的从属率分别为AJR A JAAA;;),而商户B与A存在关 联关系,也即商户B与商户A是对应至关联关系网中的一条边的两端点,并且商户B未被 标定对于商圈1的从属率,通过以下关系式(2)计算商户B对于商圈1的从属率:
其中,为商圈从属传播概率,该概率可以是一个预定义的一个确定数值,如〇. 1,也可 以是一个按照某种规则变化的数值,例如,每有一个商户被标定相对该商圈的从属率,P的 数值就变小;為是已被标定的商户A对于商圈1的从属率,其是已知的;r#是商户A和商户 B之间的关联强度,其通过以上关系式(1)计算并且是已经存储的。
[0045] 以上关系式(2)中,商户B对于商圈1的从属率队取(炎*4 )与数值1二者 中的最小值,其中数值1反映最大概率1、也即从属率的最大可能值。
[0046] 进一步重复以上步骤直至该商户相对其他更多的商户被计算并标定出来。例如, 计算商户B相对商圈2的&从属率B 2。
[0047] 需要说明的是,在以上实施例中,尽管只是示例性地给出了基于独立瀑布模型来 计算未标定商户相对若干商圈的从属率,本领域技术人员将理解到,基于以上的揭示和教 导,可以应用其他类型的传播模型(例如线性阈值模型等等)来计算未标定商户相对已标定 商户所对应的商圈的从属率。
[0048] 进一步,步骤S150,对每个商圈信息未标定的商户的若干从属率,取其中最大的从 属率。以商户B为例,取从属率&和B 2中的最大值,该最大值即对应的商圈即为商户B的 候选从属商圈。
[0049] 进一步,步骤S160,判断该最大的从属率是否大于或等于预定阈值。
[0050] 如果商户对候选从属商圈的从属率达到了预定阈值〇,那么则判断该候选从属商 圈为商户的从属商圈,该最大的从属率对应的商圈被标定为该商户的商圈信息,即对应步 骤S180 ;如果该最大的从属率小于预定阈值〇,则认为该商户无明显的商圈从属性,放弃 该商户的商圈信息的标定,即对应步骤S170。
[0051] 需要说明的是,如果步骤S150中出现多个值相同的最大的从属率,并且如果在步 骤S160中比较后,该多个最大的从属率均大于或等于预定阈值〇,表明该商户可能从属多 个商圈;如果在步骤S160中比较后,该多个最大的从属率均小于预定阈值〇,表明该商户 无明显的商圈从属性。
[0052] 至此,依次执行以上步骤S140至S180,可以完成对每个商户的商圈信息的标定。 需要说明的是,在以上步骤中实现商圈信息的标定的商户,可以作为已标定商圈信息的商 户,从而可以为与该商户相关联的商户的商圈信息的标定提供基础。通过这样的不断传播, 所有商户的商圈信息都可以实现标定。
[0053] 需要理解的是,以上实施例揭示的商户的商圈信息的标定方法,不但可以对商圈 信息未标定的商户进行商圈信息的标定,如果认为商圈信息已知的某商户的商圈信息存在 错误时,也可以对应用以上方法过程对其进行重新标定,此时,存在错误的商圈信息的用户 被看作为"商圈信息未标定的商户"。
[0054] 将理解,以上流程图和/或框图以及相应的流程图和/或框图说明可以由计算机 程序指令来实现。可以将这些计算机程序指令提供给通用计算机、专用计算机或其他可编 程数据处理设备的处理器以构成机器,以便由计算机或其他可编程数据处理设备的处理器 执行的这些指令创建用于实施这些流程图和/或框图的一个或多个框中指定的功能/操作 的部件。
[0055] 并且,可以将这些计算机程序指令存储在计算机可读存储器中,这些指令可以指 示计算机或其他可编程处理器以特定方式实现功能,以便存储在计算机可读存储器中的这 些指令构成包含实施流程图和/或框图的一个或多个框中指定的功能/操作的指令部件的 制作产品。
[0056] 并且,可以将这些计算机程序指令加载到计算机或其他可编程数据处理器上以使 一系列的操作步骤在计算机或其他可编程处理器上执行,以便构成计算机实现的进程,以 使计算机或其他可编程数据处理器上执行的这些指令提供用于实施此流程图和/或框图 的一个或多个框中指定的功能或操作的步骤。还应该注意在一些备选实现中,框中所示的 功能/操作可以不按流程图所示的次序来发生。例如,依次示出的两个框实际可以基本同 时地执行或这些框有时可以按逆序执行,具体取决于所涉及的功能/操作。
[0057] 以上实施例的标定方法中,集合利用了数据挖掘方法,从而可以以自动化的手段 实现商圈信息的标定,例如将商户信息数据集合中所缺失的商圈信息进行标定,并且弥补 了手工录入的商户信息的不足,具有高效、准确的优点,为基于商户的数据分析和服务开展 提供了便利。
[0058] 并且,通过借鉴复杂网络理论中的信息传播模型--独立瀑布模型,来标定商户 的商圈信息,这个步骤以商圈的从属为基本信息,试图将这一信息量在商户的关联关系网 络中进行传播,使得没有商圈从属的商户也获得相应的商圈从属,独立瀑布模型作为传播 模型的一种,具备可靠的数学基础,有利于保证了最终获得的商圈信息的准确性。
[0059] 以上例子主要说明了本发明的标定商户的商圈信息的方法。尽管只对其中一些本 发明的实施方式进行了描述,但是本领域普通技术人员应当了解,本发明可以在不偏离其 主旨与范围内以许多其他的形式实施。因此,所展示的例子与
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1