专利名称:基于互联网的信息精确投放系统和方法
技术领域:
本发明涉及一种互联网信息技术,特别是涉及一种向网络用户精确投放信息的技术。
背景技术:
互联网上的具有海量的数据吸引了大量的网络用户,目前网络已经成为人们及时获取资讯的一个重要途径。由于网络信息具有及时性强、制作成本低等优点,但是如何将有效的网络信息发给有需要的客户是网络信息投放的难点。
传统互联网信息的发布,是通过在特定网站的服务器放置网络发布的信息,用户需要通过搜索引擎去查找这些内容,存在如下的局限性1.传统方式的用户分类方法只有一个简单的分类,未采用建模方法与规则元素Tag方式对数据进行发掘。
2.传统的用户分类方法不能学习新的规则。
3.信息发布方通过网站服务器不能主动进行信息发布。
4.其他的主动投放技术未能对数据进行智能过滤,不能精确定位到虚拟社区的某个会员的计算机中。
发明内容
本发明解决的技术问题是提出了一种基于互联网的信息精确投放系统和方法,可以根据网络用户日常浏览网站的情况,动态地将用户感兴趣的信息通过互联网精确投放到网络用户。
本发明提出的基于互联网的信息精确投放系统,包括信息采集单元、信息分析单元、信息投放单元;所述信息采集单元用于采集用户的互联网访问数据,访问数据中包括规则元素;所述信息分析单元对信息采集单元采集的互联网访问数据进行统计分析,建立访问规则集和用户集,一条规则对应多条规则元素,一个用户对应多条规则元素;所述信息投放单元对待投放信息按照其所属的规则通过对应的规则元素确定出对应的用户,并进行定向信息自动投放。
优选的,所述信息分析单元通过对规则元素进行离散和聚合建立访问规则集。
优选的,所述信息采集单元通过对每个用户的网站访问纪录进行统计,形成原始数据库记录完成用户互联网访问数据的采集;所述信息分析单元通过分析原始数据库记录,建立用户访问规则集和用户集。
优选的,所述信息投放单元动态监控是否有相关信息需要投放,如有,则把信息所处的规则与规则元素进行匹配,如果匹配成功,则把信息包向对应的用户投放。
优选的,所述信息投放单元以窗口弹出方式、页面中转的方式或网页内嵌的方式中的一种向用户自动投放信息。
本发明提出的基于互联网的信息自动投放方法,包括以下处理步骤1)信息采集单元采集用户的互联网访问数据,访问数据中包括规则元素;2)信息分析单元对采集的互联网访问数据进行统计分析,建立访问规则集和用户集,一条规则对应多条规则元素,一个用户对应多条规则元素;3)信息投放单元对待投放信息按照其所属的规则通过其对应的规则元素确定出对应的用户,并进行定向信息自动投放。
优选的,所述步骤2)中访问规则集的建立采用以下方式信息分析单元通过对规则元素进行离散和聚合建立访问规则集。
优选的,所述步骤1)中信息采集单元通过对每个用户的网站访问纪录进行统计,形成原始数据库记录完成用户互联网访问数据的采集;步骤2)中信息分析单元通过分析原始数据库记录,建立用户访问规则集和用户集。
优选的,所述步骤3)中信息投放单元动态监控是否有相关信息需要投放,如有,则把信息所处的规则与规则元素进行匹配,如果匹配成功,则把信息包向对应的用户投放。
优选的,所述步骤3)中信息投放单元以窗口弹出方式、页面中转的方式或网页内嵌的方式中的一种向用户自动投放信息。
由于本发明采用信息采集单元通过监听的方式采集用户的网络访问纪录,并据此建立访问规则集和用户集,在投放时把信息所处的规则与规则元素Tag进行匹配确定出目的用户。这种方式不需要在用户终端上安装任何软件。而且在没有投放信息时,不影响用户的正常上网体验,在投放信息时可以根据不同的信息和用户特点采用不同的投放方式。
图1是本发明优选实施例中规则、规则元素、用户关系示意图;图2是本发明信息采集工作原理图。
具体实施例方式
以下通过具体实施例并结合附图对本发明进行详细说明。
本发明提出的基于互联网的信息自动投放系统,包括信息采集单元、信息分析单元、信息投放单元;所述信息采集单元用于采集用户的互联网访问数据,访问数据中包括规则元素;所述信息分析单元对信息采集单元采集的互联网访问数据进行统计分析,建立访问规则集和用户集,一条规则对应多条规则元素,一个用户对应多条规则元素;所述信息投放单元对待投放信息按照其所属的规则通过对应的规则元素确定出对应的用户,并进行定向信息自动投放。如图1所示信息分析单元建立的访问规则集和用户集,一个用户可以有m(m>=0)个规则关联,一个规则也有n(n>=0)个用户关联,用户和规则通过规则元素进行关联。图中,R为规则(Rule),U为用户(User),虚线为关联关系。从图中可以看出规则1(R1)中对应的规则元素为tag1、tag2、tag3,用户1(User1)对应的规则元素为tag1、tag3,因此规则1与用户1相关联。规则2中对应的规则元素为tag1、tag3、tag6,因此规则2也与用户1相关联,规则3中对应规则元素为tag2、tag8,规则3不与用户1关联。也就是说满足规则1或者规则2的信息将被投放到用户1,满足规则3的信息将不会被投放到用户1。
如图2所示本发明的信息采集单元使用千兆网卡对网络设备进行监听,监听的内容是所有的以太网数据包,如果所监听的设备是ATM Pos包格式,则使用协议转换的方式把Pos信号转成以太网数据包后进行相同的处理;。通过对采集单元计算机的操作系统的定制与修改,把网卡接收过来的以太网帧使用用户空间协议栈进行处理;用户空间协议栈对以太网包进行效验码检测,丢弃不符合要求的以太网包。如图2所示,FPC(fast packetschannel,快速包传输通道)的作用是把以太网包快速送到用户空间协议栈;用户空间协议栈使用FPC的用户态接口实现,处理完毕后,生成原始数据,供给信息分析单元使用;一个原始的记录有如下的元素用户信息(UserInfo),规则元素(Tag),权重(Cost);这些元素提供给信息分析单元使用。本发明的信息分析单元处理过程为对用户上网访问记录进行Cache,对规则元素进行抖动过滤,使用方差算法实现;s2=1n[(x1-x‾)2+(x2-x‾)2+···+(xn-x‾)2]]]>上公式中,x为样本数据,n为样本数,s为结果;对规则元素(Tag)进行离散以及聚合;已经发生聚合的元素学习目前的规则;如果满足规则,则归属到该规则,提高该规则的权重;否则创建一条新的规则,把元素归属到该规则中,设置该规则权重为初始值;离散的元素每隔一定的时间根据波菲纳西算法进行清除;把原始记录的用户信息与规则元素抽出来,如果规则元素属于某个规则,该用户被标志临时Tag,同时归属该规则的临时权重增加;定时对临时权重进行粗颗粒过滤,进行非线性回归;使用正态分布算法找出用户所属的临时规则,把用户正式归属到该规则;本发明的信息投放单元通过HASH-MAP内存组织与Ether包头重构技术完成信息的投放;经过信息分析单元的运算得到的结果判断是否给用户投放信息;信息投放单元根据信息采集单元的采集结果使用hash_map查找用户相关规则;hash_map采用开链(separate chaining)方式进行数据高速查找;根据规则找到对应的有用信息,重构Ether包头,把信息投放到用户的计算机浏览器。
给用户投放信息可以采用以下几种表现形式1.窗口弹出方式信息发布者可以使用参数来定制弹出窗口的大小,位置;
2.页面中转方式使用此种方式的时候,访问者访问相关的网站,会自动转到FWSP平台的服务器,取得对应的信息;3.网页内嵌方式需要发布的信息作为网页的一部分内嵌到原本访问的网站;推送方式还包括浮动窗口、旗帜、横幅等。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
权利要求
1.一种基于互联网的信息精确投放系统,其特征在于,所述系统包括信息采集单元、信息分析单元、信息投放单元;所述信息采集单元用于采集用户的互联网访问数据,访问数据中包括规则元素;所述信息分析单元用于对信息采集单元采集的互联网访问数据进行统计分析,建立访问规则集和用户集,一条规则对应多条规则元素,一个用户对应多条规则元素;所述信息投放单元对待投放信息按照其所属的规则通过对应的规则元素确定出对应的用户,并进行定向信息自动投放。
2.根据权利要求1所述的基于互联网的信息精确投放系统,其特征在于,所述信息分析单元通过对规则元素进行离散和聚合建立访问规则集。
3.根据权利要求1所述的基于互联网的信息精确投放系统,其特征在于,所述信息采集单元通过对每个用户的网站访问纪录进行统计,形成原始数据库记录完成用户互联网访问数据的采集;所述信息分析单元通过分析原始数据库记录,建立用户访问规则集和用户集。
4.根据权利要求1所述的基于互联网的信息精确投放系统,其特征在于,所述信息投放单元动态监控是否有相关信息需要投放,如有,则把信息所处的规则与规则元素进行匹配,如果匹配成功,则把信息包向对应的用户投放。
5.根据权利要求1-4任一项所述的基于互联网的信息精确投放系统,其特征在于,所述信息投放单元以窗口弹出方式、页面中转的方式或网页内嵌的方式中的一种向用户投放信息。
6.一种基于互联网的信息精确投放方法,其特征在于,所述方法包括以下处理步骤1)信息采集单元采集用户的互联网访问数据,访问数据中包括规则元素;2)信息分析单元对采集的互联网访问数据进行统计分析,建立访问规则集和用户集,一条规则对应多条规则元素,一个用户对应多条规则元素;3)信息投放单元对待投放信息按照其所属的规则通过其对应的规则元素确定出对应的用户,并进行定向信息自动投放。
7.根据权利要求6所述的基于互联网的信息精确投放方法,其特征在于,所述步骤2)中访问规则集的建立采用以下方式信息分析单元通过对规则元素进行离散和聚合建立访问规则集。
8.根据权利要求6所述的基于互联网的信息精确投放方法,其特征在于,所述步骤1)中信息采集单元通过对每个用户的网站访问纪录进行统计,形成原始数据库记录完成用户互联网访问数据的采集;步骤2)中信息分析单元通过分析原始数据库记录,建立用户访问规则集和用户集。
9.根据权利要求6所述的基于互联网的信息精确投放方法,其特征在于,所述步骤3)中信息投放单元动态监控是否有相关信息需要投放,如有,则把信息所处的规则与规则元素进行匹配,如果匹配成功,则把信息包向对应的用户投放。
10.根据权利要求6-9任一项所述的基于互联网的信息精确投放方法,其特征在于,所述步骤3)中信息投放单元以窗口弹出方式、页面中转的方式或者网页内嵌的方式中的一种向用户投放信息。
全文摘要
本发明公开了一种基于互联网的信息精确投放系统和方法,系统包括信息采集单元、信息分析单元、信息投放单元;信息采集单元用于采集用户的互联网访问数据;信息分析单元对信息采集单元采集的互联网访问数据进行统计分析,建立访问规则集和用户集;信息投放单元对待投放信息按照其所属的规则通过对应的规则元素确定出对应的用户,并进行定向信息自动投放。采用本发明可以不需要在用户终端上安装任何软件实现信息自动投放。而且在没有投放信息时,不影响用户的正常上网体验,在投放信息时可以根据不同的信息和用户特点采用不同的投放方式。
文档编号G06F17/30GK101079870SQ20071007500
公开日2007年11月28日 申请日期2007年6月11日 优先权日2007年6月11日
发明者沙健松 申请人:深圳市任驰科技有限公司