网站价值评估方法及装置的制作方法

文档序号:6441407阅读:246来源:国知局
专利名称:网站价值评估方法及装置的制作方法
技术领域
本发明涉及信息网络技术,尤其涉及网站价值评估方法及装置。
背景技术
自从互联网技术发展起来,免费和分享一直被视为与生俱来的“互联网精神”,如何在提供免费产品和服务的同时,维持网站的运营甚至盈利,是摆在所有网站主面前的难题。截至到目前为止,互联网广告仍是网站最直接也是最有效的盈利模式之一。对互联网广告主而言,如何从成千上万家网站中选出适合自己特定产品的网站进行广告展示,从而获得最高的关注度并转化为商业价值是一个需要解决的问题。传统模式下对网站的评价一直以来都采用网页级别(Page Rank,简称PR)方式, 该方式以流量大小评价网站的价值。但实际情况,有很多网站的流量可能并不非常大,但其内容非常专业、高端,其面对的用户群体也非常的专业高端,如果单纯从流量角度来评价这些网站,无法真正体现其应有的商业价值。PR方式利用网络爬虫技术,抓取网页,分析网页内容和网页之间的链接关系;通过分析网页之间的链接关系,衡量一个网页的重要程度。PR方式是Google用来表示网页重要性的综合性指标,而且不会受到各种检索的影响。I3R方式就是基于对“使用复杂的算法而得到的链接构造”的分析,从而得出的各网页本身的特性。I3R方式的基本原理是网站被许多页面链接会使得其推荐度提高。简单说即 “受欢迎的(被许多页面链接的)页面,必定是优质的页面”。PR方式主要由三个反向链接相关指标决定,即反向链接数(单纯的意义上的受欢迎度指标);反向链接是否来自推荐度高的页面(有根据的受欢迎指标);反向链接源页面的链接数(被选中的几率指标)。现有ra方式只反映了页面内容的受欢迎程度,而广告主所关注的是在这个网站上投放广告投放效果,如点击率和转化率,这些指标同用户体验、用户心理、用户喜好有很大关系,PR方式不能反映这种广告的投放效果。

发明内容
本发明所要解决的技术问题之一是需要提供一种网站价值评估方法及装置。为了解决上述技术问题,本发明提供了一种网站价值评估方法,该网站价值评估方法包括获取步骤,获取多个网站的用户网络行为数据和经营信息数据;建模步骤,确定影响网站价值的特征因素,根据所述特征因素来制定网站价值评估数据模型;以及参数确定步骤,利用所获取的用户网络行为数据和经营信息数据来对所述网站价值评估数据模型进行数据训练,以确定所述网站价值评估数据模型的模型参数,得到用于评价网站商业价值的网站价值评估数据确定模型。根据本发明另一方面的网站价值评估方法,所述参数确定步骤具体包括将第一网站集中网站的所述经营信息数据和所述第一网站集的与所述特征因素相关的所述用户网络行为数据作为训练数据集,以及将第二网站集中网站的所述经营信息数据和所述第二网站集的与所述特征因素相关的所述用户网络行为数据作为验证数据集,以及基于验证数据集来校验所述网站价值评估数据确定模型是否导致了过拟合,若校验结果为是,则重新确定所述第一网站集和所述第二网站集所包含的网站,返回所述参数确定步骤,其中,所述第一网站集与所述第二网站集不是同一集合。根据本发明另一方面的网站价值评估方法,在所述建模步骤中,所制定的网站价值评估数据模型表示为BR= f(xUi,yFi,zMi),其中,所述BR为商业级别,Ui为网站的用户特征、Fi为流量特征、Mi为营销特征,f表示多次曲线拟合算法或神经网络算法,χ、y和ζ为模型参数;所述网站的经营信息数据包括网站的年收入,将所述网站的年收入作为所制定的网站价值评估数据模型中与该网站对应的BR值。根据本发明另一方面的网站价值评估方法,还包括评价步骤,将要进行商业价值评价的网站的用户网络行为数据输入所得到的网站价值评估数据确定模型中以求得的BR值,作为用于评价所述要进行商业价值评价的网站的网站商业价值的评价值。根据本发明另一方面的网站价值评估方法,所述评价步骤还包括将所述评价值划分为多个区间,根据网站的评价值所处的区间来确定该网站的商业价值级别。根据本发明另一方面的网站价值评估方法,所述特征因素包括用户特征、流量特征以及营销特征,以及构成所述用户特征的特征因子包括用户群体、人均浏览量和人均停留时间,构成所述流量特征的特征因子包括页面访问量、IP量和独立访客量,构成所述营销特征的特征因子包括点击率、转换率和投资回报率。根据本发明另一方面的网站价值评估方法,所述用户网络行为数据为设定时间段、设定地域和/或设定人群的用户网络行为数据。根据本发明的另一方面,还提供了一种网站商业价值评估装置包括获取模块 (61),其获取多个网站的用户网络行为数据和经营信息数据;建模模块(62),其确定影响网站价值的特征因素,根据所述特征因素来制定网站价值评估数据模型;以及参数确定模块(63),其利用所获取的用户网络行为数据和经营信息数据来对所述网站价值评估数据模型进行数据训练,以确定所述网站价值评估数据模型的模型参数,得到用于评价网站商业价值的网站价值评估数据确定模型。根据本发明另一方面的网站商业价值评估装置,所述参数确定模块(6 包括训练子模块,用于将第一网站集中网站的所述经营信息数据和所述第一网站集的与所述特征因素相关的所述用户网络行为数据作为训练数据集,以及将第二网站集中网站的所述经营信息数据和所述第二网站集的与所述特征因素相关的所述用户网络行为数据作为验证数据集,以及验证子模块,用于基于验证数据集来校验所述网站价值评估数据确定模型是否导致了过拟合,若校验结果为是,则重新确定所述第一网站集和所述第二网站集所包含的网站,返回所述参数确定模块(63),其中,所述第一网站集与所述第二网站集不是同一集合。
根据本发明另一方面的网站商业价值评估装置,所制定的网站价值评估数据模型表示为冊=^劝1,7付,2肌),其中,所述仍为网站的用户特征、Fi为流量特征、Mi为营销特征,f表示多次曲线拟合算法或神经网络算法,χ、y和ζ为模型参数;所获取的经营信息数据包括网站的年收入,将所述网站的年收入作为所制定的网站价值评估数据模型中与该网站对应的BR值。根据本发明另一方面的网站商业价值评估装置还包括评价模块(64),其将要进行商业价值评价的网站的用户网络行为数据输入所得到的网站价值评估数据确定模型中以求得BR值,作为用于评价所述要进行商业价值评价的网站的网站商业价值的评价值。根据本发明的另一方面,还提供了一种网站商业价值评估方法包括通过如下步骤对网站商业价值进行评估(1)对用户浏览行为数据进行收集和存储;从公开途径收集网站的经营和财务信息;(2)确定影响网站价值的特征因素,对评估模型进行制定;(3)确定模型参数,建立网站价值评估数据模型;(4)将网站价值评估数据模型用于评估网站价值;(5)通过验证数据集合,对模型进行优化,以提高系统在现实复杂情况下的鲁棒性和模型精度,确认最终模型;(6)将用户行为参数套用入最终模型中,评价其网站商业价值。根据本发明另一方面的网站价值评估方法,所述模型参数通过如下公式计算获得,BR = f(xUi, yFi,zMi),所述Ui为网站的用户特征、Fi为流量特征、Mi为营销特征。根据本发明的另一方面,还提供了一种网站商业价值评估系统,包括用于对用户浏览行为数据进行收集和存储的商业智能信息收集系统和网络数据采集系统,所述两系统将数据传输给用于建立网站价值评估数据模型的数据训练系统,所述数据训练系统同时还接收用于验证数据的模型评估系统。根据本发明另一方面的网站商业价值评估系统,所述数据训练系统包括模型库, 所述模型库设有用于模型选择模块,所述模型选择模块输出所选模型,所述所选模型接收商业智能信息收集系统和网络数据采集系统的数据,所述所选模型通过参数计算模块,形成确认模块输出,所述确认模块进入校验模块进行优化,所述校验模块接收模型评估系统数据。根据本发明另一方面的网站商业价值评估系统,所述模型评估系统包括商业智能信息收集系统和网络数据采集系统。与现有技术相比,本发明至少具有以下优点在本发明中,根据所构建的网站价值评估数据模型得到的各个网站的评价值处于时间、地域以及人群三维空间中,各个网站可以根据其自身网站的评价值找到跟其所要投放的智能广告的内容相匹配的用户群,并且广告主也可以通过评价值来正确决策其所要投放的广告应该在哪些网站上进行投放,提高广告主的广告投放效果。本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。


附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中图1是根据本发明第一实施例的网站价值评估方法的流程示意图;图2是根据本发明第二实施例的网站价值评估系统的结构示意图;图3是根据本发明第三实施例的网站价值评估方法的流程示意图;图4是根据本发明第三实施例的构建网站价值评估数据模型的流程示意图;图5是根据本发明第三实施例的影响评价值的特征组成结构示例图;图6是根据本发明第四实施例的网站价值评估装置的结构示意图。
具体实施例方式以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合, 所形成的技术方案均在本发明的保护范围之内。另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。第一实施例图1是根据本发明第一实施例的网站价值评估方法的流程示意图,下面参照图1 详细说明该方法的各步骤。如图1所述的网站商业价值评估方法,通过如下步骤对网站商业价值进行评估步骤(1),获取多个网站的用户网络行为数据以及通过公开途径获取设定数量网站的经营信息数据;步骤O),确定影响网站价值的特征因素,根据确定的特征因素对网站价值评估数据模型进行制定;步骤(3),通过数据训练,确定模型参数,建立网站价值评估数据模型;步骤,将网站价值评估数据模型用于评估网站价值;步骤(5),通过验证数据集合,对模型进行优化,以提高系统在现实复杂情况下的鲁棒性和模型精度,确认最终模型;步骤(6),将用户行为参数套用入最终模型中,评价其他网站的商业价值。所述制定的网站价值评估数据模型表示为BR= f(xUi,yFi,zMi),其中,BR为商业级别,Ui为网站的用户特征、Fi为流量特征、Mi为营销特征,f表示多次曲线拟合算法或神经网络算法,χ、y和ζ为模型参数。用户特征包括但不限于以下特征因子用户群体,人均浏览量和人均停留时间。流量特征包括但不限于以下特征因子页面访问量PV,IP和独立访客量UV0营销特征包括但不限于以下特征因子点击率,转化率和R0I。
通常,网站的商业价值可以用下列公式表示网站的商业价值=f (用户数量(频次),单个用户(频次)的价值(广告收入或购买收入),此公式是计算网站商业价值最直接的方法,但单个用户的价值很难量化,则此公式在实际情况中很难实现,因此采用BR公式来替代此公式。上述网站的商业价值公式中,用户数量反映商业规模,对于任何商业模式而言,规模效益是很重要的。诸如软件业的微软、搜索引擎的谷歌和IM的腾讯,都是凭借规模效益, 获得了传统商业模式难以企及的收入规模。规模效益在信息服务领域尤为重要。对于广告主而言,用户数量包含了多种参数,如IP,PV,UV等。针对不同广告主的不同需求,其重要性也不同。单个用户价值是每个用户所能带来的消费量和广告收入,而用户消费量和广告接受程度同用户的多维属性有密切关系,如性别、年龄、职业、收入、受教育程度、家庭角色、兴趣爱好、地域分布等,因此在考虑单个用户价值时要考虑上述因素。本实施例是基于时间、地域、人群三维空间对网站的商业价值进行动态的评价。网站的商业价值由多个维度的因素决定,它往往是一个随时间、地域、行业的不同而不断变化的值。为了维护价值评估算法的效率,需要在维度划分粒度和算法的复杂性之间保持平衡。但如果过分的细分这三个维度,又会导致算法过于复杂,反而失去了意义。如时间粒度可以按年、月、日来进行划分,地域可以以国家、行政区、城市划分,而人群则可以用人口统计维度、兴趣爱好等来划分。BR值可以指导网站找到跟其内容,用户群等相匹配的广告,广告主也可以通过BR 值来正确决策其广告应该在哪些网站进行展现。在本实施例中的影响BR值的三大影响特征因素Ui、Fi、Mi中,网站可以通过不断优化Fi来带动Ui和Mi的提升,而Ui和Mi的直接提升则是通过该网站在实际商用中的表现来决定。广告主可以通过其自身产品处在的推广期,综合权衡Ui,Fi,Mi进行广告投放的决策。网站商业价值评估体系可采用分级体系,如1-10级,将在某一BR值区间的所有网站分在同一级内。为了使不同网站有统一评估标准并计算影响因子系数,本实施例采用网站的年收入作为网站商业价值的参照物。首先通过网络监控或网站对用户访问进行监测, 得到Ui,Fi, Mi特征中的参数,然后获取该网站的年收入,得到以下方程BR1 = f (A1U1. . . AnUn, B1F1. . . BnFn, C1M1. . . CnMn)BR2 = f (A1U1. · · AnUn‘ B1F1. · · BnFn, C1M1. · · CnMn)BRn = f (A1U1. · · AnUn,B1F1. · · BnFn, C1M1. · · CnMn)通过多次曲线拟合算法或神经网络算法即可导出参数A1... An,B1. . . Bn, C1. . . Cn, 由此得到BR计算公式,当需要某一网站的BR值时,只需将BR的影响因素Ui,Fi,Mi代入公式,即可得到该网站的BR值。第二实施例图2示出根据本发明第二实施例的网站商业价值评估系统的结构示意图。下面参考图2来说明本实施例的各部分组成。如图2所示一种网站商业价值评估系统,包括用于对用户浏览行为数据进行收集和存储的商业智能信息收集系统和网络数据采集系统,商业智能信息收集系统和网络数据采集系统将数据传输给用于建立网站价值评估数据模型的数据训练系统,数据训练系统同时还接收来自模型评估系统中用于验证的数据。其中,数据训练系统包括模型库,模型库包括模型选择模块,模型选择模块输出所选模型,所选模型接收存储在商业智能信息收集系统和网络数据采集系统的数据,所选模型通过参数计算模块,形成确认模型输出,校验模块通过接收模型评估系统的验证数据对确认的模型进行优化,其中模型评估系统也包括商业智能信息收集系统和网络数据采集系统。第三实施例图3是根据本发明第三实施例的网站商业价值评估方法的流程示意图,下面参照图3详细说明该方法的各步骤。步骤310,获取多个网站的用户网络行为数据和经营信息数据,该步骤为获取步
马聚ο具体地,通过网络数据获取技术获取多个网站中的用户进行网络行为的所有数据、并对所获得的数据进行预处理以得到可体现用户网络行为的用户网络行为数据,以及通过公开途径获取多个网站的经营信息数据。其中,用户的网络行为可以为用户的浏览行为,网站的经营信息主要包括网站的年收入。更具体地,由于用于表征用户网络行为的主要数据来自网站的网络服务器中的日志文件集。这些日志文件包含了访问该网络站点的关于每个访问者超文本传输协议(简称 HTTP)事务的执行记录,因此可以通过利用网络数据包嗅探技术或网络爬虫技术等网络数据捕获技术、从日志文件集中获取用于表征用户网络行为的数据。但是,由于实际获得的数据具有不完全的相关性、冗余性和概念上的模糊性、以及用于审计的海量数据中可能存在大量的无意义信息等问题,致使所获取的数据需要进行预处理以构建和辨认具有可体现用户网络行为的信息,例如,可以通过引入数据包过滤机制对这些数据进行预处理。需要说明的是,本步骤310所获取的用户网络行为数据为设定时间段、设定地域、 和/或设定人群的用户网络行为数据,并将时间段、地域和人群这三个因素作为三维空间对网站的价值进行动态的评价。具体地,将这三个因素作为一个三维空间坐标来评价一个网站处于不同设定的时间段、不同设定的地域和/或不同设定的人群时的商业价值。在划分维度粒度时,需要同时维护网站价值评估方法的效率,以保持维度划分粒度和网站价值评估方法的复杂性之间的平衡。例如,将时间维度的粒度划分为年、月、日,将地域维度的划分为国家、行政区、城市, 将人群的维度划分为人口数量以及兴趣爱好,基于以上维度粒度的划分方式来获取用户网络行为数据。步骤320,确定影响网站价值的特征因素,根据所述特征因素来制定网站价值评估数据模型,该步骤为建模步骤。在本实施例中将用于计算商业级别(Business Rank,简称BR)值的公式作为所制定网站价值评估数据模型,将BR值作为用于评价所述要进行商业价值评价的网站的网站商业价值的评价值。因此,将影响评价值的特征因素作为影响网站价值的特征因素。图5是根据本发明第三实施例的影响评价值的特征因素组成结构示例图,请参考图5,优选地,本实施例将影响BR值的特征因素设定为客观反映网站的用户特征(简称Ui)、流量特征(简称Fi)和营销特征(简称Mi)。所制定的网站价值评估数据模型表示为BR = f (xUi, yFi, zMi)(1)在公式(1)中,BR为商业级别,Ui为网站的用户特征、Fi为流量特征、Mi为营销特征,f表示多次曲线拟合算法或神经网络算法,χ、y和ζ为模型参数。需要说明的是,影响BR值的每一个特征由设定量的特征因子构成,如图5所示,优选地,本实施例中的构成用户特征的特征因子为用户群体、人均浏览量和人均停留时间,构成流量特征的特征因子为页面访问量(简称PV)、IP量和独立访客量(简称UV量),构成营销特征的特征因子为点击率、转换率和投资回报率(简称R0I),则BR值的计算公式可如下所示BR = f (A1U1, A2U2,· · ·,AnUn, B1F1,B2F2,· · ·,BkFk, C1M1,C#2,· · ·,CjMj) (2)在公式O)中,A1... An表示特征因素为用户特征Ui的η个特征参数,相当于公式 (1)中的模型参数χ;B1... 表示特征因素为流量特征Fi的k个特征参数,相当于公式(1)中的模型参数y ;C1... Cj表示特征因素为营销特征Mi的j个特征参数,相当于公式(1)中的模型参数ζ ;U1... Un表示特征因素为用户特征Ui的η个特征因子,相当于公式(1)中的用户特征Ui ;F1... Fk表示特征因素为流量特征Fi的k个特征因子,相当于公式(1)中的用户特征Fi ;M1...M^表示特征因素为营销特征Mi的j个特征因子,相当于公式⑴中的用户特征Mi。在本实施例中,将影响BR值的特征因素设定为网站价值评估数据模型的特征因素,BR值计算公式中的特征参数对应于网站价值评估数据模型的模型参数,其中,特征参数的数量值与特征因素的数量值相等。步骤330,利用所获取的用户网络行为数据和经营信息数据来对所制定的网站价值评估数据模型进行数据训练以确定网站价值评估数据模型的模型参数,从而得到用于评价网站商业价值的网站价值评估数据确定模型,该步骤为参数确定步骤。具体地,基于所获取的经营信息数据和与模型特征因素相关的用户网络行为数据构建训练数据集和验证数据集,然后利用训练数据集来训练出网站价值评估数据确定模型,亦即训练出该模型的模型参数以及训练数据集中数据之间的映射关系,由于A1...々 相当于公式(1)中的模型参数LB1...^相当于公式(1)中的模型参数γ,、..。相当于公式 ⑴中的模型参数z,得到上述网站价值评估数据模型公式⑵中A1. . . An, B1. . . Bk, C1. . . Cj 的具体数值,即可以得到模型参数χ、模型参数y和模型参数z,从而得到最终模型即网站价值评估数据确定模型。然后,基于验证数据集来校验由训练数据集训练出的网站价值评估数据确定模型是否导致了过拟合,若校验结果为是,则重新构建与前一次使用的训练数据集和验证数据集数据不同的训练数据集和验证数据集数据、来对网站价值评估数据模型进行数据训练,重新确定网站价值评估数据确定模型的模型参数。举例而言,图4是根据本发明第三实施例的构建网站价值评估数据模型的流程示意图,下面参照图4详细说明该模型的各步骤。步骤3301,基于经营信息数据和与特征因素相关的用户网络行为数据构建训练数据集和验证数据集。具体地,在多个网站中设定第一网站集和第二网站集,将第一网站集中网站的经营信息数据和第一网站集的与特征因素相关的用户网络行为数据作为训练数据集,以及将第二网站集中网站的经营信息数据和第二网站集的与特征因素相关的用户网络行为数据作为验证数据集,其中,第一网站集与第二网站集不是同一集合。需要说明的是,训练数据集和验证训练集的数据可以仅为经营信息数据和与特征因素相关的用户网络行为数据中的一部分,训练数据集中的数据和验证训练集的数据可以部分相同或完全不同。举例而言,在获取的多个网站的用户网络行为数据中选取N个网站的用户的网络行为数据以及相应的经营信息数据,基于已设定的模型特征因素得到训练数据集,训练数据集可以表示如下,W1 = (U11,U12. . . Uln,F11,F12. . . Flk, M11,M12. . . Mlj ;BR1)W2 = (U21,U22. · · U2n,F21,F22. · · F2k, M21,M22. · · M2j ;BR2)......wN = (UN1, UN2. . . UNn, Fni, Fn2. . . FNk, Mni , Mn2. . . Mnj ;BRn)其中,表示第N个网站的第η个影响用户特征的特征因子,FNk表示第N个网站第k个影响流量特征的特征因子,Mnj表示第N个网站第j个影响营销特征的特征因子,BRn 表示第N个网站的经营信息数据中的年收入。然后,将获取的多个网站中的M个网站的用户的网络行为数据以及相应的经营信息数据,基于已设定的模型特征因素得到验证数据集,验证数据集可以表示如下,W1 = (U11,U12. · · Uln,F11,F12. · · Flk, M11,M12. · · Mlj ;BR1)W2 = (U21,U22. · · U2n,F21,F22. · · F2k, M21,M22. · · M2j ;BR2)......wM — (Um,Um2. . . Ulln,Fmi , Fm2. . . FMk, Mmi , Mm2. . . Mmj- ;BRm)其中,Um表示第M个网站的第η个影响用户特征的特征因子,Ftt表示第M个网站第k个影响流量特征的特征因子,Mmj表示第M个网站第j个影响营销特征的特征因子,BRM 表示第M个网站的经营信息数据中的年收入,其中选取的N个网站与M个网站的可以部分相同。需要说明的是,以上所述,仅为本发明的简单的例子,网站价值评估数据模型的特征因素还可包括其他因素,不限于以上所涉及的内容,为了使不同的网站有统一评估标准, 本实施例将公开获得的设定数量网站的经营信息数据中的年收入作为评估网站商业价值的评估参照。步骤3302,基于训练数据集来对网站价值评估数据模型进行数据训练以确定所述网站价值评估数据模型的模型参数。具体地,例如,将基于N个网站的用户网络行为数据以及经营信息数据所得的训练数据集代入公式⑵,即BR = f(A1U1. . . AnUn,B1F1. . . BkFpC1M1. . . CjMj)中,可得如下所示,BR1 = f (A1U11. · · AnUln, B1F11. · · BkFlk, C1M1. · · CjMlj)BR2 = f (A1U21. · · AnU2n, B1F21. · · BkF2k, C1M21. · · CjM2j)......BRn = f (A1Uni. · · AnUto' B1F21. · · BkFNk,C1Mni. · · CjMnj)然后,基于用户网络行为数据以及所述经营信息数据中的年收入得到特征参数, 亦即网站价值评估数据模型的模型参数。更具体地,例如,将训练数据集中的N个网站的用户网络行为数据作为上式中的输入变量,即上式中的UN1. . . UNn,F21. . . Ffflt以及Mni. . . MNj,将训练数据集中的N个网站经营信息数据中的年收入作为上式中的输出变量,即上式中的BR1, BR2. . . ,然后通过多次曲线拟合算法或神经网络算法即可得到特征参数A1. . . An5B1. . . Bk5C1. . . Cj以及输入变量与输出变量的映射关系,基于所得的特征参数以及映射关系可以得到用于计算BR值的计算公式。需要说明的是,网站的经营信息数据包括网站的年收入,将所述网站的年收入作为所制定的网站价值评估数据模型中与该网站对应的BR值,本步骤中网站的经营信息数据是通过公开途径获取的,网站可以为一些知名的规模较大的网站,这些网站的经营信息数据相较于某些流量不大、内容专业或用户群体高端的网站来说较易获得。需要说明的是,在步骤3302中基于模型的参数所确定网站价值评估数据确定模型,可用来评价要进行商业价值评价的网站的商业价值,但是所确定网站价值评估数据确定模型并非最优的网站价值评估数据模型,在现实复杂情况下其鲁棒性和模型的精度都不是很高,因此可以进一步执行步骤3303来获得最优的网站价值评估数据确定模型。步骤3303,基于验证数据集来校验网站价值评估数据确定模型是否导致过拟合, 若校验结果为是,则返回步骤3301。通常,通过训练数据集来构建的特征数据关系,即所得到的BR值计算公式,存在某种程度的过适(亦称过拟合)问题,也就是说,训练数据集训练出来的网站价值评估数据模型只能体现训练数据集中特征数据之间显然的关系,却未必能代表所有的用户网络行为数据。验证数据集是独立于训练数据集的一组数据,但验证数据集服从与训练数据集同样的概率分布。通过验证数据集来对所得的初始网站价值评估数据模型进行校验,若该评估模型既能很好的拟合训练数据集也能很好的拟合验证数据集,则过拟合现象就不明显, 所得的网站价值评估数据确定模型可作为用于评估网站商业价值的网站价值评估数据确定模型,网站价值评估数据确定模型具有在现实复杂情况下的强鲁棒性和高模型精度。若该网站价值评估数据确定模型只能拟合训练数据集而不能很好的拟合验证数据集,则过拟合现象产生,所得的网站价值评估数据确定模型的鲁棒性和模型精度较低, 则需要重新构建训练数据集和验证数据集,则返回步骤3301进行操作,通过反复进行步骤 3301、步骤3302以及步骤3303的操作,以获得最佳的用于评估网站商业价值的网站价值评估数据确定模型,若不存在过拟合,则将步骤3302中所确定网站价值评估数据确定模型作为用于评价网站的价值的网站价值评估数据确定模型,进入步骤340中。需要说明的是,上述网络商业价值评估模型的示例仅为一个简单的例子,所述的内容仅是为了便于理解本发明而采用的实施方式,并非用以限定本发明,影响评价值的特征不限于用户特征、流量特征和营销特征,还可以包括其它特征,而影响各个特征的各个特征因素不限于上述所提到的特征因素,还可以包括搜索引擎的出现率、站点速度、浏览速度或被链接率等特征因素。进一步地,该网站价值评估方法还可以包括步骤340,将要进行商业价值评价的网站的用户网络行为数据输入所得到的网站价值评估数据确定模型中,将所得到的BR值作为评价网站商业价值的评价值。具体地,将要进行商业价值评价的网站的用户网络行为数据输入至步骤330所得的网站价值评估数据确定模型中,以得到该网站的BR值,其中,要进行商业价值评价的网站的用户的网络行为数据与网站价值评估数据模型的特征因素相关,并且用户的网络行为数据是基于网络行为发生的时间、地域以及人群等因素来获取的。在本实施例中,网站的商业价值是一个随着时间、地域以及人群等因素的变化而变化的值,例如,同一个网站在一个星期中的不同时间段的商业价值是不同的,周一的商业价值可能是最低,而在周末的时候,尤其是在周六晚上该网站的商业价值可能达到最大,明显高于其它时间段的商业价值,因此,广告主可以选择周六晚上在所要投放的网站上进行广告的投放。综上所述,由于所得到的各个网站的评价值处于时间、地域以及人群三维空间中, 各个网站可以根据其自身网站的评价值找到跟其所要投放的智能广告的内容相匹配的用户群,并且广告主也可以通过评价值来正确决策其所要投放的广告应该在哪些网站上进行投放,提高广告主的广告投放效果。另外,本实施例的步骤340中,还可以进一步进行以下内容。将所述评价值划分为多个区间,根据网站的评价值所处的区间来确定该网站的商业价值级别。具体地,基于各个网站的评价值对各个网站进行分级以确定各网站的商业价值级别,例如,可以通过划定评价值区间将网站进行1-10级的分级,将处在某一评价值区间的所有网站分在同一级别内,本实施例可以将1级设为最低的商业价值级别,10级设为最高的商业价值级别。基于所得到的网站的商业价值级别,广告主可以根据时间、地域以及人群的不同选择网站的商业价值级别中级别较高的网站进行广告投放。在本实施例的网站商业价值评估方法中,通过对基于网站的评价值对各个网站进行分级,使得广告主可以更直观的选择适用于投放广告的级别较高的网站,提高广告主的广告投放效果。第四实施例图6示出根据本发明第四实施例的网站商业价值评估装置的结构示意图。下面参考图6来说明本实施例的各部分组成。如图6所示,本装置包括获取模块61、建模模块62、参数确定模块63和评价模块 64。其中,获取模块61与建模模块62连接,建模模块62与参数确定模块63连接,参数确定模块63与评价模块64连接,下面说明各个模块的功能。获取模块61,其获取多个网站的用户网络行为数据和经营信息数据。建模模块62,其确定影响网站价值的特征因素,根据特征因素来制定网站价值评估数据模型。进一步地,在建模模块62中,所制定的网站价值评估数据模型表示为BR = f (xUi, yFi,zMi),其中,所述Ui为网站的用户特征、Fi为流量特征、Mi为营销特征,f表示多次曲线拟合算法或神经网络算法,χ、y和ζ为模型参数;所获取的经营信息数据包括网站的年收入,将所述网站的年收入作为所制定的网站价值评估数据模型中与该网站对应的BR值。此外,参数确定模块63,其利用所获取的用户网络行为数据和经营信息数据来对网站价值评估数据模型进行数据训练,以确定网站价值评估数据模型的模型参数,得到用于评价网站商业价值的网站价值评估数据确定模型。其中,参数确定模块63可以包括训练子模块631和验证子模块632。训练子模块631,用于将第一网站集中网站的经营信息数据和第一网站集的与特征因素相关的用户网络行为数据作为训练数据集,以及将第二网站集中网站的经营信息数据和第二网站集的与特征因素相关的用户网络行为数据作为验证数据集,以及验证子模块632,用于基于验证数据集来校验网站价值评估数据确定模型是否导致了过拟合,若校验结果为是,则重新确定第一网站集和第二网站集所包含的网站,返回参数确定模块63,其中,第一网站集与第二网站集不是同一集合。再进一步地,该系统还可以包括评价模块64,其将要进行商业价值评价的网站的用户网络行为数据输入所得到的网站价值评估数据确定模型中以求得BR值,作为用于评价要进行商业价值评价的网站的网站商业价值的评价值。在本发明实施例装置,根据所构建的网站价值评估数据模型得到的各个网站的处于不同时间、不同地域以及不同人群的评价值,各个网站可以根据其自身网站的评价值找到跟其所要投放的智能广告的内容相匹配的用户群,并且广告主也可以通过评价值来正确决策其所要投放的广告应该在哪些网站上进行投放,提高广告主的广告投放效果。本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化, 但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
权利要求
1.一种网站价值评估方法,其特征在于,包括获取步骤,获取多个网站的用户网络行为数据和经营信息数据;建模步骤,确定影响网站价值的特征因素,根据所述特征因素来制定网站价值评估数据模型;以及参数确定步骤,利用所获取的用户网络行为数据和经营信息数据来对所述网站价值评估数据模型进行数据训练,以确定所述网站价值评估数据模型的模型参数,得到用于评价网站商业价值的网站价值评估数据确定模型。
2.根据权利要求1所述的方法,其特征在于,所述参数确定步骤具体包括将第一网站集中网站的所述经营信息数据和所述第一网站集的与所述特征因素相关的所述用户网络行为数据作为训练数据集,以及将第二网站集中网站的所述经营信息数据和所述第二网站集的与所述特征因素相关的所述用户网络行为数据作为验证数据集,以及基于验证数据集来校验所述网站价值评估数据确定模型是否导致了过拟合,若校验结果为是,则重新确定所述第一网站集和所述第二网站集所包含的网站,返回所述参数确定步骤,其中,所述第一网站集与所述第二网站集不是同一集合。
3.根据权利要求1或2所述的方法,其特征在于,在所述建模步骤中,所制定的网站价值评估数据模型表示为BR = f(xUi,yFi,zMi),其中,所述BR为商业级别,Ui为网站的用户特征、Fi为流量特征、Mi为营销特征,f表示多次曲线拟合算法或神经网络算法,χ、y和ζ为模型参数;所述网站的经营信息数据包括网站的年收入,将所述网站的年收入作为所制定的网站价值评估数据模型中与该网站对应的BR值。
4.根据权利要求3所述的方法,其特征在于,还包括评价步骤,将要进行商业价值评价的网站的用户网络行为数据输入所得到的网站价值评估数据确定模型中以求得的BR值,作为用于评价所述要进行商业价值评价的网站的网站商业价值的评价值。
5.根据权利要求4所述的方法,其中特征在于,所述评价步骤还包括将所述评价值划分为多个区间,根据网站的评价值所处的区间来确定该网站的商业价值级别。
6.根据权利要求1或2所述的方法,其特征在于,所述特征因素包括用户特征、流量特征以及营销特征,以及构成所述用户特征的特征因子包括用户群体、人均浏览量和人均停留时间,构成所述流量特征的特征因子包括页面访问量、IP量和独立访客量,构成所述营销特征的特征因子包括点击率、转换率和投资回报率。
7.根据权利要求1或2所述的方法,其特征在于, 所述用户网络行为数据为设定时间段、设定地域和/或设定人群的用户网络行为数据。
8.—种网站商业价值评估装置,其特征在于,包括获取模块(61),其获取多个网站的用户网络行为数据和经营信息数据;建模模块(62),其确定影响网站价值的特征因素,根据所述特征因素来制定网站价值评估数据模型;以及参数确定模块(63),其利用所获取的用户网络行为数据和经营信息数据来对所述网站价值评估数据模型进行数据训练,以确定所述网站价值评估数据模型的模型参数,得到用于评价网站商业价值的网站价值评估数据确定模型。
9.根据权利要求8所述的装置,其特征在于,所述参数确定模块(6 包括训练子模块,用于将第一网站集中网站的所述经营信息数据和所述第一网站集的与所述特征因素相关的所述用户网络行为数据作为训练数据集,以及将第二网站集中网站的所述经营信息数据和所述第二网站集的与所述特征因素相关的所述用户网络行为数据作为验证数据集,以及验证子模块,用于基于验证数据集来校验所述网站价值评估数据确定模型是否导致了过拟合,若校验结果为是,则重新确定所述第一网站集和所述第二网站集所包含的网站,返回所述参数确定模块(63),其中,所述第一网站集与所述第二网站集不是同一集合。
10.根据权利要求8或9所述的装置,其特征在于,所制定的网站价值评估数据模型表示为BR = f(xUi, yFi,zMi),其中,所述Ui为网站的用户特征、Fi为流量特征、Mi为营销特征,f表示多次曲线拟合算法或神经网络算法,χ、 y和ζ为模型参数;所获取的经营信息数据包括网站的年收入,将所述网站的年收入作为所制定的网站价值评估数据模型中与该网站对应的BR值。
11.根据权利要求10所述的装置,其特征在于,还包括评价模块(64),其将要进行商业价值评价的网站的用户网络行为数据输入所得到的网站价值评估数据确定模型中以求得BR值,作为用于评价所述要进行商业价值评价的网站的网站商业价值的评价值。
12.—种网站商业价值评估方法,其特征在于通过如下步骤对网站商业价值进行评估(1)对用户浏览行为数据进行收集和存储;从公开途径收集网站的经营和财务信息;(2)确定影响网站价值的特征因素,对评估模型进行制定;(3)确定模型参数,建立网站价值评估数据模型;(4)将网站价值评估数据模型用于评估网站价值;(5)通过验证数据集合,对模型进行优化,以提高系统在现实复杂情况下的鲁棒性和模型精度,确认最终模型;(6)将用户行为参数套用入最终模型中,评价其网站商业价值。
13.根据权利要求12所述的网站商业价值评估方法,其特征在于所述模型参数通过如下公式计算获得,BR = f(xUi, yFi, zMi),所述Ui为网站的用户特征、Fi为流量特征、Mi 为营销特征。
14.一种网站商业价值评估系统,其特征在于包括用于对用户浏览行为数据进行收集和存储的商业智能信息收集系统和网络数据采集系统,所述两系统将数据传输给用于建立网站价值评估数据模型的数据训练系统,所述数据训练系统同时还接收用于验证数据的模型评估系统。
15.根据权利要求14所述的网站商业价值评估系统,其特征在于所述数据训练系统包括模型库,所述模型库设有用于模型选择模块,所述模型选择模块输出所选模型,所述所选模型接收商业智能信息收集系统和网络数据采集系统的数据,所述所选模型通过参数计算模块,形成确认模块输出,所述确认模块进入校验模块进行优化,所述校验模块接收模型评估系统数据。
16.根据权利要求14所述的网站商业价值评估系统,其特征在于所述模型评估系统包括商业智能信息收集系统和网络数据采集系统。
全文摘要
本发明公开了一种网站价值评估方法及装置,该方法包括获取步骤,获取多个网站的用户网络行为数据和经营信息数据;建模步骤,确定影响网站价值的特征因素,根据特征因素来制定网站价值评估数据模型;以及参数确定步骤,利用所获取的用户网络行为数据和经营信息数据来对所述网站价值评估数据模型进行数据训练,以确定网站价值评估数据模型的模型参数,得到用于评价网站商业价值的网站价值评估数据确定模型。本发明根据所构建的模型得到的各个网站的评价值,网站可以根据其自身网站的评价值找到跟其所要投放的智能广告的内容相匹配的用户群,广告主也可以通过评价值来决策其要投放的广告所投放的网站,提高广告主的广告投放效果。
文档编号G06Q30/00GK102567477SQ20111042134
公开日2012年7月11日 申请日期2011年12月15日 优先权日2011年6月16日
发明者李娜, 罗峰, 黄苏支 申请人:北京亿赞普网络技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1