专利名称::一种监测网站访客价值的方法及装置的制作方法一种监测网站访客价值的方法及装置
技术领域:
本申请涉及互联网技术,特别是涉及一种监测网站访客价值的方法及装置。
背景技术:
:目前,很多企业都通过网站来进行信息展示和产品营销,随着网络技术的发展,网站和访客之间也可以实现更多的互动。例如,网站主可以通过网络管理系统监测访客的一些信息,根据这些信息来评估访客的价值,然后进一步对具有一定价值的访客做一些业务行为,例如与其联系,向其提供更详细的信息等等。可以想象,对于具有大量访客的网站而言,如果以人工方式来评估每个访客的价值,工作量大且效率难以保证。为了实现对网站访客价值的自动评估,现有技术中,是通过把各类"访客信息"中的单个或组合设置为条件,一旦满足条件,就认为该访客具有一定价值并通知网站主。这些条件可以包括来访次数超过几次、访问页面超过几个、是否访问过某些特定页面、访客是否来自某些特定的省市,等等。通过对现有技术的研究,发明人发现上述方法只适用于处理简单的条件组合,然而在实际需求中,访客信息和访客价值之间往往存在着更为复杂的对应关系,例如如果访客来自北京,则其访问页面A的价值大、如果访客来自上海,则其访问页面B的价值大;男性访客访问页面C的价值大、女性访客访问页面D的价值大。类似或更为复杂的情况还有很多,这些对应关系往往是非线性的,甚至是不确知的(即网站主并没有意识到自己的主动行为中存在着某种对应关系),如果使用条件组合的方法,难以把这些复杂的对应关系全部纳入考虑,并且以某种确定的形式表现出来。因此,现有的自动评估访客价值的方法,其评估结果与人工评估的结果相比,往往会存在很大的偏差,无法达到预期效果。
发明内容为解决上述技术问题,本申请提供一种监测网站访客的方法及装置,以解决现有自动评估访客价值的方法,其评估结果与人工评估结果存在较大偏差的问题。技术方案如下本申请提供一种监测网站访客价值的方法,包括监测网站的访客信息;根据预先划分的网站访客价值等级,获得每种等级Cj在数据样本中的出现概率P(Cj),其中j二l,2,…N,N为所划分的等级数量;获得访客信息X之后,进一步获得所述访客信息在所述数据样本中的相关概率P(X)和P(X|Cj);P(XICj)P(Cj)计算P(CjlX)-^A)J,(j=l,2,…N),所述计算的结果用于评估所述访客的价值;实时监控并输出所述访客价值的评估结果。本申请还提供一种监测网站访客价值的装置,包括访客信息监控单元,用于监测网站的访客信息;价值等级概率获得单元,用于根据预先划分的网站访客价值等级,获得每种等级Cj在数据样本中的出现概率P(Cj),其中j-l,2,…N,N为所划分的等级数量;访客信息概率获得单元,用于在所述访客信息监控单元获得访客信息X之后,进一步获得所述访客信息在所述数据样本中的相关概率P(X)和P(X|Cj);P(XICi)P(Cj)计算单元,用于计算P(CjlX^^^r^,(j=i,2,…n),所述计算的结果用于评估所述访客的价值;提醒单元,用于实时监控并输出所述计算单元的访客价值的评估结果。在本申请的技术方案中,预先划分了若干个价值等级,当获得访客信息之后,根据该访客信息在历史数据样本中的相关概率,计算该访客的价值等级概率。其中,计算结果中包含了该访客处于每个价值等级的概率,根据计算结果,就可以对访客的价值进行评估。由于上述方案的处理是以历史数据样本为依据的,而历史数据样本可以有效地反映出人工评估的准则,因此,应用上述方案对访客进行价值评估,能够获得与人工评估趋于一致的评估结果。为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他形式的附图。图1为本申请实施例监测网站访客价值的方法的流程图;图2为本申请实施例监测网站访客价值的装置的结构示意图;图3为本申请实施例监测网站访客价值的装置的另一种结构示意图;图4为本申请实施例监测网站访客价值的装置的第三种结构示意图。具体实施方式为了使本
技术领域:
的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例^5U又是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。本申请技术方案,通过对网站访客信息的监测,并基于对历史数据样本的统计,实现对新访客价值的评估,实时监控并输出所述访客价值的评估结果。因此,对于某个网站,需要首先选取一批历史数据,作为用于评估的样本。其中,样本的输入为访客信息,可分为"访客属性信息"和"访客行为信息"两大类。其中,"访客属性信息"一般为相对静态的信息,包括访客的性别、年龄、地域等;而"访客行为信息"则是短期内可能发生动态变化的信息,例如访问网站的次数、所访问的页面、访问停留时间、访客是否进行了某些主动行为(如聊天、发邮件)、进行主动行为的次数等等。样本的输出为访客价值等级。对应每一位访客的一组信息,网站主会根据这些信息,对这位访客的价值给出一个价值评级。需要说明的是,这个判断过程应该是客观的,即对于相同的信息,其判断结果不会以人的主观意识而改变。对于网站访客价值等级的划分,实质上就是对输出样本空间按照业务需求进行划分。例如,最简单方式是分为两级分别代表"有价值,,的潜在客户和"无价值,,一般浏览访客。当然,根据具体的业务需求,也可以划分成更多的等级,本申请对此并不进行限定。实施例一图1所示为本申请实施例一种监测网站访客价值的计算方法的流程图,具体包括以下步骤S101,根据预先划分的网站访客价值等级,获得每种等级Cj在数据样本中的出现扭无率P(Cj),其中』=1,2,…N,N为所划分的等级数量;在本实施例中,以Cj表示访客价值等级。在数据样本集中,分别统计每种等级在数据样本中的出现概率,统计结果可以如表1所示<table>tableseeoriginaldocumentpage8</column></row><table>表1由于上述统计都是在同一数据样本集中完成的,即d,C2,...CN构成一组完备事件,因此有P(c0+P(C2)+...+P(CN)=1。S102,获得访客信息X之后,进一步获得所述访客信息在所述数据样本中的相关扭无率P(X)和P(X|cj);当访客到达后,首先获得该访客的相关信息,本领域技术人员可以根据具体需求,选择获得访客信息的具体方法,例如,对于性别、年龄、地域等"访客属性信息,,,可以由该访客在网站的注册信息中获得,其中,访客的地域信息还可以通过该访客的IP地址获得。而对于"访客行为信息,,则可以由网站后台的管理系统获得,具体可以通过读取网站的管理日志、网站Cookie、CRM(CustomerRelationshipManagement,客户关系管理)系统等获得。为了便于做概率统计,访客信息的取值应该是离散形式的,因此,对于具有连续取值范围的访客信息,需要将连续的取值范围离散化,例如将"用户访问时刻"以小时为单位离散化为24种取值。此外,访客信息还应该只有有限的几种取值可能,因此对于具有开区间取值范围的访客信息(例如累计访问次数、累计访问时间等),也应当根据业务需求,将取值范围映射到封闭的区间内。例如,将"累计访问次数"的取值范围映射为{"小于5次","5次至10次","大于10次"}这种形式。本实施例以X表示访客信息,X—般会包括多个分量XpX2,...XM,分别代表各项具体的访客信息,如前所述,每个分量又分别具有不同的取值范围,例^口X有三种取值,则其取值范围为{x,x12,x13};X2有四种取值,则其取值范围为{x21,x22,x23,x24};等等。可以理解的是,通过对多个分量XpX2,…XM不同取值进行组合,可以得到X的所有取值可能,X的取值种类可通过乘法原理得到。访客到达后,该访客的相关信息X的具体取值也就确定了,此时,进一步获得这种具体取值在数据样本中的相关概率,相关概率包括两方面P(X)和P(X|Cj)。假设某访客信息的具体取值为xG,则P(X=Xq)表示在所有的数据样本中,出现取值xo的次数所占的比例;而P(X二xolcj)为条件概率,表示在评级结果为Cj的数据样本中,出现取值x0的次数所占的比例。对于P(X=xo|Cj),需要分别获得』=1,2,…N时的对应概率值。P(X|Cj)P(Cj)S103,计算P(cJX戶^~p:x),(j=l,2,…N)。本申请技术方案的目的,就是根据访客的信息来评估访客的价值等级,由前述步骤的描述不难得出,这一需求实际就是在确定X具体取值的条件下,确定Cj中j的具体取值。才艮据概率论中的贝叶斯(Bayes)公式,可以得到P(X|Ci)P(Ci)P(c,|X)=、1J7、^其中P(X|Cj)、P(Cj)、和P(X)的值已经在前面的步骤中获得,于是,根据上述公式,可以分别得到〗=1,2,…N时,P(CjPQ的取值,表示在确定X具体取值的条件下,将该访客评级为Ci,c2,...Cn的概率。该结果也可以用表格的形式表示,如表2:<table>tableseeoriginaldocumentpage10</column></row><table>表2由于d,C2,…CN构成构成一组完备事件,因此有P(Cl|X)+P(c2|X)+...+P(cN|X)=l网站管理系统根据表2的结果,就可以进一步对访客的价值进行评估,例如,最直接的方法,就是将P(c」X)最大值所对应的Cj确定为访客的价值评估等级。当然,网站管理系统也可以不直接给出最终的评估结果,而是将表2的结果反馈给网站主,例如,当有多个P(CjlX)的值相同、或者相差比较小时,可以将访客的相关信息以及概率计算结果反馈给网站主,再由网站主人工对访客价值进行评估。可见,应用本申请技术方案,并不需要关心访客信息与访客价值之间到底存在什么样的复杂对应关系,因此也无需涉及复杂的运算,仅根据一些统计处理以及简单的数字乘除运算即可实现对访客价值的评估,实现起来也比较简单。需要说明的是,由于本申请技术方案最终是应用贝叶斯公式进行计算,而S101以及S102的作用都是获取用于计算的数据,因此,S101的S102的执行顺序是不分先后的。实施例二:实施例一中,是在获得访客信息X之后,实时根据数据样本统计P(X)和P(X|Cj)。由于数据样本的数量是很大的,因此,如果每获得一个新的访客信息,就实时统计一次相关的概率,将在一定程度上影响处理速度。并且,有些访客的信息的具体取值还可能是完全相同的,这种情况下,每次都实时统计概率实际上也成为了一种重复处理。为解决上述问题,可以采取的一种方法是预先针对X的所有取值可能,计算相应的P(X)和P(XICj)并保存计算结果。当获得访客信息的具体取值后,通过查找所保存的结果,直接获得相应的概率值。根据S102的描述可知,访客信息的取值可能是有限的,通过对X的多个分量XpX2,…XM不同取值进行组合,可以得到X的所有取值可能。这里,可能会出现比较大的组合数,例如,X共有6个分量,每个分量有10种取值可能,那么所有的组合数就是106,如果要分别对106种概率进行统计,显然是不现实的。实际应用中,X的各个分量之间存在两种情况相互独立或相互具有条件关系。例如,访客年龄、访客性别、访客地域这些信息之间都是相互独立的,而像"访问页面数"和"访问停留时间"之间,则是具有某种条件关系的。由概率论可知,如果X!与X2相互独立,则有P(XiX2一P(Xi)P(X2),如果XpX2不独立,则有P(X!X2"P(X!IX2)(X2)或P(X!X2"P(X2lX!)(X0,根据上述公式,对独立的访客信息和不独立的访客信息分别进行处理,即可直接计算出P(XiX2…XM)。举例说明,,i设X具有6个分量,其中&X2X3之间相互独立,而X4和X5分别与X6存在条件关系,则可以得到P(X)=P(XiX2X3X4X5X6)=P(X!X2X3)P(X4X5X6):P(X0P(X2)P(X3)P(X4lX6)P(XslX6)P(X6)假设XrX6分别有10种可能取值,则需要统计的概率值为P(XO、P(X2)、P(X3)、P(X6)各10个,P(X4|X6)、P(XslX6)各IOO个,总计240个,与106相比,大大减少了数据处理量。可以看出,对于数据处理量造成较大影响的是那些不具有独立关系的分量。事实上,在实际应用中,分量之间不独立的情况是比较少的,而对于不具有独立关系的分量,可以假设这些分量也是相互独立的,并根据这种假设关系计算P(X),这样可以进一步减少数据处理量。如上例所述,如果作li殳各分量之间都是相互独立的,则仅需统计60个概率值,即可计算得到P(X)的各种取值概率。虽然这种方式在理论上存在一定误差,但是由于本申请技术方案本身应用的就是统计概率这种代表整体趋势的特性,因而,上述误差并不会对最终的结果造成很大影响。通过具体的应用实践,也很好地验证了这一点。上面仅对概率P(X)的获得方法进行了说明,P(XICj)的获得方法与之类似,这里不再重复说明。本申请技术方案,是基于对历史数据样本的统计,实现对新访客价值的评估。由于历史数据样本可以有效地反映出人工评估的准则,因此,应用上述方案对访客进行价值评估,能够获得与人工评估趋于一致的评估结果。网站主根据自动评估的结果,就可以决定是否对该访客做进一步的业务行为。根据实际的业务需求,如果访客信息中仅包括"访客属性信息"这类相对静态的信息,那么评估结果可以是一次性计算出来的,并且在业务需求不变的前提下,可以认为这个值不会发生变化;如果访客信息中包括"访客行为信息"这类短期内可能发生动态变化的信息,则相应的评估结果也应该是动态变化的。针对这种情况,可以由网站管理系统周期性地更新用户信息(或者由网站主来人工执行更新用户信息的操作),以实现对访客价值的动态评估。在实际应用中,还可以预先设置一个(或多个)访客等级阈值,当评估结果高于该阈值时,通过声音、屏幕视觉变化等方式提醒网站主,从而减少网站主对大量"无价值"访客的关注,提高工作效率。实施例三下面将通过一个具体的实施例,对本申请监测网站访客价值的方法进行说明。假设某企业分别针对不同性别、不同年龄段的用户提供产品,网站主在监测访客的价值时,所考虑的因素包括访客性别、访客年龄以及访问网站的次数。监测的结果分为两级"潜在客户"和"一般访客"。本申请技术方案无需关注网站主在进行监测时具体遵循的是何种规则,只需统计相关的概率数值即可进行监测计算假设d代表"潜在客户",Co代表"一般访客"。首先在数据样本集中,分别统计"潜在客户,,和"一般访客"在数据样本中的出现概率P(cO和P(Co)。假设Xi代表"访客性别",由常识可知其取值范围为{男、女}X2代表"访客年龄",根据业务需求,将其取值范围划分为三部分{20岁以下,20-40岁,40岁以上}乂3代表"访问网站的次数,,,根据业务需求,将其取值范围划分为两部分{5次以下,5次及以上}本实施例采用预先统计访客信息的方法,由乘法原理可知,访客信息共有2><3><2=12种组合,由于XiX2X3之间是相互独立的,因此可以分别统计2个P(X!)值、3个P(X2)值、2个P(X3)值,再通过组合相乘,就可以得到12个P(X,X2X3)的值。采用类似方法,还可以进一步得到12个P(X!X2X3ld)的值、以及12个P(X!X2X3lCo)的值。完成上述统计后,当访客访问网站时,首先获得该访客的性别、年龄以及访问网站的次数,即确定该访客的访客信息具体取值Xo,然后根据该具体取值的相关概率统计值,计算P(CjlX^Xo)和P(c。IX^。)。具体而言,可以设置一个访客信息监控单元,当访客到访时,获得该访客的信息。本实施例中,访客信息监控单元可以通过读取访客的注册信息,获得该访客的性别和年龄;通过读取网站的管理日志,获得该访客曾经访问网站的次H然后,将所获得的上述信息数值化,即根据对X。X2、X3取值范围的规定,确定访客信息具体属于12种访客信息组合中的哪一个。对访客信息进行数值化之后,通过查询之前的概率统计数据,就可以确定相应的P(X!X2X3),以及相应的P(X,X2X3lc0和P(XiX2X3|co)。,ii殳新访客访问网站,其访客信息X的具体取值xQ为(X产"男,,,X2="40岁以上",X3="5次以下,,},P(XICj)P(c,)通过公式P(CjlX戶~~柳,可以分别得到P(dlX^XQ)和P(Co|X=Xo),如果P(c,IX二X())大于P(C()P^x。),则该访客价值的评估结果为"潜在客户";如果P(C!IX^o)小于P(C()IX二X。),则该访客价值的评估结果为"一般访客"。对于本实施例而言,访客的性别是不会发生变化的,而访客的年龄也可以认为是一个在短期内不会发生变化的值。但是"访问网站的次数"是一个会短期内可能发生较大动态变化的值,因此,访客信息监控单元可以实时或周期性地读取该信息的取值,并且向用于概率计算的功能单元实时或周期性地提供/更新该信息(或者由网站主来人工触发更新用户信息的操作),以实现对访客价值的动态评估。相应地,还可以进一步设置一个提醒单元,用于实时监控访客价值的评估结果,当出现"潜在客户"的评估结果(或者当P(dlX二Xo)大于某一阈值)时,触发网站主计算机的输出设备,例如通过声音、屏幕视觉变化等方式提醒网站主,^v而减少网站主对大量"无i^^f直"访客的关注,,提高工作效率。本领域技术人员可以理解,访客信息监控单元每次可以向计算模型提供多名访客的信息;用于概率计算的功能单元可以根据其具体实现方式,并行或串行评估多名访客的价值。而提醒单元也可以同时将多名访客的标识以价值及评估结果同时反馈给网站主。由于本实施例仅用于做示意性说明,因此所举的例子比较简单。本领域技术人员可以将本申请的技术方案应用于更为复杂的应用场景,这些也应该在本申请的保护范围之内。相应于上面的方法实施例,本申请还提供一种监测网站访客价值的装置,其特征在于,参见图2所示,包括访客信息监控单元200,用于监测网站的访客信息;价值等级概率获得单元210,用于根据预先划分的网站访客价值等级,获得每种等级Cj在数据样本中的出现概率P(Cj),其中j-l,2,…N,N为所划分的等级数量;访客信息概率获得单元220,用于在获得访客信息X之后,进一步获得所述访客信息在所述数据样本中的相关概率P(X)和P(X|Cj);P(XICj)P(Cj)计算单元230,用于计算P(CjlX戶~~A)」,(j=l,2,…N),所述计算的结果用于评估所述访客的价值。提醒单元240,用于实时监控并输出所述计算单元230的访客价值的评估结果。其中,访客信息监控单元200,可以通过读取访客的注册信息和/或网站的管理日志、网站Cookie、CRM系统等,获得访客信息,并且,访客信息监控单元200可以实时或周期性地读取访客的注册信息和/或网站的管理日志。所述访客信息概率获得单元220,可以根据访客信息X,实时计算P(X)和P(XIcj)。参见图3所示,本申请所提供的监测网站访客价值的装置,还可以包括访客信息概率预处理单元250,用于预先针对X的所有取值可能,计算相应的P(X)和P(XICj)并保存计算结果;相应地,访客信息概率获得单元220,就可以在访客信息概率预处理单元250所保存的计算结果中,查询与所述访客信息X对应的P(X)和P(X|Cj)。其中,当所述访客信息X包括至少两个不相互独立的分量时,所述访客信息概率预处理单元250可以假设所述不相互独立的分量是相互独立的,并根据该假设计算相应的P(X)和P(XICj)。参见图4所示,本申请所提供的监测网站访客价值的装置,还可以进一步包括评估等级确定单元260,用于将P(c」X)最大值所对应的Cj确定为所述访客的价值评估等级。则提醒单元240也可以用于实时监控并输出所述评估等级确定单元250的访客价值的评估结果。以上所提供的装置,是基于对历史数据样本的统计,实现对新访客价值的评估。由于历史数据样本可以有效地反映出人工评估的准则,因此,应用上述装置对访客进行价值评估,能够获得与人工评估趋于一致的评估结果。为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以才艮据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。本申请可用于众多通用或专用的计算系统环境或配置中。例如个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。以上所述仅是本申请的具体实施方式,应当指出,对于本
技术领域:
的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。权利要求1、一种监测网站访客价值的方法,其特征在于,包括监测网站的访客信息;根据预先划分的网站访客价值等级,获得每种等级cj在数据样本中的出现概率P(cj),其中j=1,2,...N,N为所划分的等级数量;获得访客信息X之后,进一步获得所述访客信息在所述数据样本中的相关概率P(X)和P(X|cj);计算<mathsid="math0001"num="0001"><math><![CDATA[<mrow><mi>P</mi><mrow><mo>(</mo><msub><mi>c</mi><mi>j</mi></msub><mo>|</mo><mi>X</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>P</mi><mrow><mo>(</mo><mi>X</mi><mo>|</mo><msub><mi>c</mi><mi>j</mi></msub><mo>)</mo></mrow><mi>P</mi><mrow><mo>(</mo><msub><mi>c</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow><mrow><mi>P</mi><mrow><mo>(</mo><mi>X</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo></mrow>]]></math>id="icf0001"file="A2009101594990002C1.tif"wi="44"he="11"top="79"left="41"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/></maths>(j=1,2,...N),所述计算的结果用于评估所述访客的价值;实时监控并输出所述访客价值的评估结果。2、根据权利要求1所述的方法,其特征在于,所述获得访客信息在数据样本中的相关概率P(X)和P(X!Cj),具体实现为根据访客信息X,实时计算P(X)和P(X|Cj)。3、根据权利要求1所述的方法,其特征在于,还包括预先针对X的所有取值可能,计算相应的P(X)和P(Xlcj)并保存计算结果;所述获得访客信息在数据样本中的相关概率P(X)和P(X|cj),具体实现为在所保存的计算结果中,查询与所述访客信息X对应的P(X)和P(X|cj)。4、根据权利要求3所述的方法,其特征在于,当所述访客信息X包括至少两个不相互独立的分量时,所述计算相应的P(X)和P(XICj),具体实现为假设所述不相互独立的分量是相互独立的,并根据该假设计算相应的P(X)和P(X|cj)。5、根据权利要求l至4任一项所述的方法,其特征在于,还包括将P(c」X)最大值所对应的Cj确定为所述访客的价值评估等级。6、根据权利要求1至4任一项所述的方法,其特征在于,所述获得访客信息,具体实现为通过读取访客的注册信息和/或网站的管理日志、网站Cookie、网站的客户关系管理CRM系统,获得访客信息。7、根据权利要求6所述的方法,其特征在于,所述读取访客的注册信息和/或网站的管理日志、网站Cookie、网站的CRM系统,具体实现为实时或周期性地读取访客的注册信息和/或网站的管理日志、网站Cookie、网站的CRM系统。8、根据权利要求1所述的方法,其特征在于,所述实时监控并输出所述访客价值的评估结果,包括当出现预设的评估结果时,触发网站主计算机的输出设备提醒网站主。9、根据权利要求8所述的方法,其特征在于,所述预设的评估结果为P(CjIX)大于设定阈值。10、一种监测网站访客价值的装置,其特征在于,包括访客信息监控单元,用于监测网站的访客信息;价值等级概率获得单元,用于根据预先划分的网站访客价值等级,获得每种等级Cj在数据样本中的出现概率P(Cj),其中j二l,2,…N,N为所划分的等级数量;访客信息概率获得单元,用于在所述访客信息监控单元获得访客信息X之后,进一步获得所述访客信息在所述数据样本中的相关概率P(X)和P(X|cj);P(Xlc,)P(c,)计算单元,用于计算<formula>formulaseeoriginaldocumentpage3</formula>所述计算的结果用于评估所述访客的价值;提醒单元,用于实时监控并输出所述计算单元的访客价值的评估结果。11、根据权利要求IO所述的装置,其特征在于,所述访客信息概率获得单元,用于根据访客信息X,实时计算P(X)和P(X|Cj)。12、根据权利要求IO所述的装置,其特征在于,还包括访客信息概率预处理单元,用于预先针对X的所有取值可能,计算相应的P(X)和P(Xlcj)并保存计算结果;所述访客信息概率获得单元,用于在所述访客信息概率预处理单元所保存的计算结果中,查询与所述访客信息X对应的P(X)和P(X|Cj)。13、根据权利要求12所述的装置,其特征在于,所述访客信息概率预处理单元,用于当所述访客信息X包括至少两个不相互独立的分量时,假设所述不相互独立的分量是相互独立的,并根据该假设计算相应的P(X)和P(X|Cj)。14、根据权利要求10至13任一项所述的装置,其特征在于,还包括评估等级确定单元,用于将P(CjlX)最大值所对应的Cj确定为所述访客的价值评估等级;则所述提醒单元,还用于实时监控并输出所述评估等级确定单元的访客价值的评估结果。全文摘要本申请公开了一种监测网站访客价值的方法及装置。一种监测网站访客价值的方法包括监测网站的访客信息,根据预先划分的网站访客价值等级,获得每种等级c<sub>j</sub>在数据样本中的出现概率P(c<sub>j</sub>),其中j=1,2,...N,N为所划分的等级数量;获得访客信息X之后,进一步获得所述访客信息在所述数据样本中的相关概率P(X)和P(X|c<sub>j</sub>);计算P(c<sub>j</sub>|X)=(P(X|c<sub>j</sub>)P(c<sub>j</sub>)/P(X)),(j=1,2,...N),利用计算结果评估所述访客的价值,实时监控并输出所述访客价值的评估结果。由于上述方案的处理是以历史数据样本为依据的,而历史数据样本可以有效地反映出人工评估的准则,因此,应用上述方案对访客进行价值评估,能够获得与人工评估趋于一致的评估结果。文档编号G06Q30/00GK101604435SQ200910159499公开日2009年12月16日申请日期2009年7月14日优先权日2009年7月14日发明者刘增光,华炳阳,吕开利,孟超峰,征张,杰苏,袁怀宾,陈伟聪申请人:阿里巴巴集团控股有限公司