热点专题发布方法及装置与流程

文档序号:13072687阅读:202来源:国知局
热点专题发布方法及装置与流程

本发明涉及互联网信息技术,尤其涉及一种热点专题发布方法及装置。



背景技术:

随着互联网的快速兴起与发展,行业应用系统的规模迅速扩大,行业应用所产生的数据呈爆炸性增长,动辄达到数百tb甚至数十至数百pb规模的行业/企业大数据已远远超出了现有传统的计算技术和信息系统的处理能力,人们获取信息的手段也变得异常丰富。

现有技术中,为了能够使用户可以在海量的数据信息中快速的找到自己感兴趣的信息,很多网站都推出了热点专题界面,用户可以通过浏览网站发布的热点专题来迅速获取互联网中的热点信息。

现有技术的不足之处在于,在发布热点专题时,网站管理员需要收集网络中热度较高的数据信息,并根据收集到的热度较高的数据信息,手动生成热点专题界面,费时费力,效率较低,难以满足用户对于信息的需求。



技术实现要素:

本发明提供一种热点专题发布方法及装置,用以解决现有技术中手工发布热点专题费时费力、效率低下的技术问题。

本发明提供一种热点专题发布方法,包括:

确定用于生成热点专题界面的关键词;

抓取网络中与所述关键词相关的多个数据信息;

根据各数据信息的热度,对抓取到的所述多个数据信息进行排序,获取热点数据信息;

根据预设的界面模板以及所述热点数据信息,生成热点专题界面。

进一步地,在根据预设的界面模板以及所述热点数据信息,生成热点专题界面之前,还包括:

获取界面模板参数,所述界面模板参数包括在界面上划分出的各区域的位置信息以及各区域对应的属性;

根据所述界面模板参数,将界面分割成相应的区域,生成所述界面模板;

其中,所述属性为下述任意一种:文字、图片、视频、音频。

进一步地,根据各数据信息的热度,对抓取到的所述多个数据信息进行排序,获取热点数据信息,包括:

确定抓取到的各数据信息的属性,并按照属性对抓取到的数据信息进行分类;

确定界面模板中各属性对应的区域的个数;

对每个属性对应的数据信息进行排序,并取前若干个作为该属性对应的热点数据信息;

其中,每个属性对应的热点数据信息的个数与界面模板中该属性对应的区域的个数相等。

进一步地,根据各数据信息的热度,对抓取到的所述多个数据信息进行排序,获取热点数据信息,包括:

确定抓取到的各数据信息的属性;

针对每一属性对应的数据信息,确定所述属性对应的热点数据信息:

其中,确定所述属性对应的热点数据信息包括:

按照关键词,对所述属性对应的数据信息进行分类,确定各关键词对应的数据信息;

确定界面模板中所述属性对应的区域的个数,并为各关键词分配对应的区域个数;

对每个关键词对应的数据信息进行排序,并取前若干个作为该关键词对应的热点数据信息,其中,每个关键词对应的热点数据信息的个数与该关键词对应的区域的个数相等;

根据各个关键词对应的热点数据信息确定所述属性对应的热点数据信息。

进一步地,根据预设的界面模板以及所述热点数据信息,生成热点专题界面,包括:

将每个属性对应的热点数据信息分别填充到界面模板中该属性对应的区域中,从而生成所述热点专题界面。

本发明还提供一种热点专题发布装置,包括:

确定模块,用于确定用于生成热点专题界面的关键词;

抓取模块,用于抓取网络中与所述关键词相关的多个数据信息;

排序模块,用于根据各数据信息的热度,对抓取到的所述多个数据信息进行排序,获取热点数据信息;

生成模块,根据预设的界面模板以及所述热点数据信息,生成热点专题界面。

进一步地,所述确定模块,还用于:

在根据预设的界面模板以及所述热点数据信息,生成热点专题界面之前,获取界面模板参数,所述界面模板参数包括在界面上划分出的各区域的位置信息以及各区域对应的属性;

根据所述界面模板参数,将界面分割成相应的区域,生成所述界面模板;

其中,所述属性为下述任意一种:文字、图片、视频、音频。

进一步地,所述排序模块,具体用于:

确定抓取到的各数据信息的属性,并按照属性对抓取到的数据信息进行分类;

确定界面模板中各属性对应的区域的个数;

对每个属性对应的数据信息进行排序,并取前若干个作为该属性对应的热点数据信息;

其中,每个属性对应的热点数据信息的个数与界面模板中该属性对应的区域的个数相等。

进一步地,所述排序模块,具体用于:

确定抓取到的各数据信息的属性;

针对每一属性对应的数据信息,确定所述属性对应的热点数据信息:

其中,确定所述属性对应的热点数据信息包括:

按照关键词,对所述属性对应的数据信息进行分类,确定各关键词对应的数据信息;

确定界面模板中所述属性对应的区域的个数,并为各关键词分配对应的区域个数;

对每个关键词对应的数据信息进行排序,并取前若干个作为该关键词对应的热点数据信息,其中,每个关键词对应的热点数据信息的个数与该关键词对应的区域的个数相等;

根据各个关键词对应的热点数据信息确定所述属性对应的热点数据信息。

进一步地,所述生成模块,具体用于:

将每个属性对应的热点数据信息分别填充到界面模板中该属性对应的区域中,从而生成所述热点专题界面。

本发明提供的热点专题发布方法及装置,通过确定用于生成热点专题界面的关键词,抓取网络中与所述关键词相关的多个数据信息,并根据各数据信息的热度,对抓取到的所述多个数据信息进行排序,获取热点数据信息,根据预设的界面模板以及所述热点数据信息,可以快速、自动地生成热点专题界面,有效地提高了发布热点专题的效率,满足了用户对于信息的需求。

附图说明

图1为本发明实施例一提供的热点专题发布方法的流程图;

图2为本发明实施例一提供的热点专题发布方法中界面模板的示意图;

图3为本发明实施例二提供的热点专题发布方法的流程图;

图4为本发明实施例三提供的热点专题发布装置的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。

取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。

实施例一

本发明实施例一提供一种热点专题发布方法。图1为本发明实施例一提供的热点专题发布方法的流程图。如图1所示,本实施例中的热点专题发布方法,可以包括:

步骤101、确定用于生成热点专题界面的关键词。

具体地,本步骤中,可以通过多种方式确定用于生成热点专题界面的关键词:由网站的管理员手动输入所述关键词,或者,由浏览网站的用户手动输入所述关键词,或者,可以根据国家发布的政策信息或用户搜索记录自动生成所述关键词;等等。

例如,国家开放二孩政策,则所述关键词可以为“二孩”等;近段时间用户多关注污染治理等方面的消息,则所述关键词可以为“污染”等。所述关键词的个数可以为一个或多个,所述关键词用于在后续步骤中从网络中抓取与之相关的数据信息,从而生成热点专题界面。

步骤102、抓取网络中与所述关键词相关的多个数据信息。

在确定关键词之后,可以抓取网络中与所述关键词相关的数据信息。所述数据信息可以为网络中以各种形式存在的信息,例如,可以为帖子、新闻、发言、视频等。

与所述关键词相关的数据信息,可以是在正文或标题或标签中包含所述关键词的数据信息。与所述关键词相关的数据信息可以采用多种方式获取,例如,可以采用爬虫技术获取与所述关键词相关的数据信息,其具体实现方式属于现有技术,此处不再详述。

步骤103、根据各数据信息的热度,对抓取到的所述多个数据信息进行排序,获取热点数据信息。

其中,所述热度用于表征数据信息在互联网中的热门程度,具体地,所述热度可以包括下述至少一种:点击量、转发量、下载量、收藏量等。

相应的,所述热点数据信息为抓取到的多个数据信息中比较热门的数据信息。

步骤104、根据预设的界面模板以及所述热点数据信息,生成热点专题界面。

具体地,在步骤104所述的根据预设的界面模板以及所述热点数据信息,生成热点专题界面之前,还可以首先生成所述界面模板。所述界面模板可以采用以下方法生成:

获取界面模板参数,所述界面模板参数包括在界面上划分出的各区域的位置信息以及各区域对应的属性,并根据所述界面模板参数,将界面分割成相应的区域,生成所述界面模板。

所述界面模板参数可以由网站的管理员输入,也可以根据用户的喜好自动生成,所述界面模板参数中给出了在界面上划分出的各区域的位置信息以及各区域对应的属性,其中所述位置信息可以为区域中各顶点或边界线的坐标信息等,例如,区域可以呈四边形,则所述四边形的四个顶点的坐标信息可以作为所述区域的位置信息。

在获取界面模板参数之后,可以根据所述界面模板参数中的各区域的位置信息,将界面分割成相应的一个或多个区域,并根据所述界面模板参数中的各区域对应的属性,为界面中的各个区域赋予相应的属性。

图2为本发明实施例一提供的热点专题发布方法中界面模板的示意图。如图2所示,所述界面被分成了多个区域,每个区域都有对应的属性。

所述属性可以为下述任意一种:文字、图片、视频、音频。每个区域都可以对应一种属性,例如,图2中的区域1、2、3对应的属性为文字,则可以称之为文字区域,区域4和5对应的属性为图片,则可以称之为图片区域,区域6对应的属性为视频,则可以称之为视频属性。

相应的,在步骤104中,根据预设的界面模板以及所述热点数据信息,生成热点专题界面,可以包括:

将每个属性对应的热点数据信息分别填充到界面模板中该属性对应的区域中,从而生成所述热点专题界面。

具体地,每个数据信息可以有其对应的属性,例如,视频类的数据信息对应的属性可以为视频,新闻发言稿对应的属性多为文字。

在确定各数据信息对应的属性之后,步骤103中的根据各数据信息的热度,对抓取到的所述多个数据信息进行排序,获取热点数据信息,可以包括:确定抓取到的各数据信息的属性,并按照属性对抓取到的数据信息进行分类;确定界面模板中各属性对应的区域的个数;对每个属性对应的数据信息进行排序,并取前若干个作为该属性对应的热点数据信息;其中,每个属性对应的热点数据信息的个数与界面模板中该属性对应的区域的个数相等。下面举例说明。

假设根据关键词抓取到1000条数据信息,其中500条数据信息的属性为文字,300条数据信息的属性为图片,剩余200条数据信息的属性为视频。则按照属性对抓取到的数据信息进行分类后,可以获取文字、图片和视频各自对应的数据信息,其中文字、图片和视频各自对应的数据信息分别有500条、300条和200条。

然后,可以确定界面模板中各属性对应的区域的个数,以图2为例,区域1、2、3对应的属性为文字,区域4和5对应的属性为图片,区域6对应的属性为视频,则文字、图片和视频各自对应的区域的个数分别为:3、2、1。

最后,对每个属性对应的数据信息,均执行下述操作:根据各数据信息的热度,对该属性对应的数据信息进行排序,并取前若干个作为该属性对应的热点数据信息;其中,每个属性对应的热点数据信息的个数与界面模板中该属性对应的区域的个数相等。

具体地,对于文字来说,该属性对应的数据信息有500条,界面模板中该属性对应的区域的个数为3,则可以按照热度对500条文字属性的数据信息进行排序,热度最高的数据信息排序为1,次高的数据信息排序为2,以此类推,热度最低的数据信息排序为500,并取前3个数据信息作为该属性对应的热点数据信息。

对于图片来说,该属性对应的数据信息有300条,界面模板中该属性对应的区域的个数为2,则可以按照热度对300条文字属性的数据信息进行排序,热度最高的数据信息排序为1,次高的数据信息排序为2,以此类推,热度最低的数据信息排序为300,并取前2个数据信息作为该属性对应的热点数据信息。

对于视频来说,该属性对应的数据信息有200条,界面模板中该属性对应的区域的个数为2,则可以按照热度对200条文字属性的数据信息进行排序,热度最高的数据信息排序为1,次高的数据信息排序为2,以此类推,热度最低的数据信息排序为200,并取前1个数据信息作为该属性对应的热点数据信息。

这样,就获取了文字、图片和视频各属性对应的热点数据信息,然后,可以按照步骤104给出的方法,根据预设的界面模板以及所述热点数据信息生成热点专题界面,即,将每个属性对应的热点数据信息分别填充到界面模板中该属性对应的区域中,从而生成热点专题界面。

本实施例提供的热点专题发布方法,通过确定用于生成热点专题界面的关键词,抓取网络中与所述关键词相关的多个数据信息,并根据各数据信息的热度,对抓取到的所述多个数据信息进行排序,获取热点数据信息,根据预设的界面模板以及所述热点数据信息,可以快速、自动地生成热点专题界面,有效地提高了发布热点专题的效率,满足了用户对于信息的需求。

实施例二

本发明实施例二提供一种热点专题发布方法。本实施例是在实施例一提供的技术方案的基础上,用更加细致的方法获取各属性对应的热点数据信息。

图3为本发明实施例二提供的热点专题发布方法的流程图。如图3所示,本实施例中的热点专题发布方法,可以包括:

步骤201、确定用于生成热点专题界面的关键词。

步骤202、抓取网络中与所述关键词相关的多个数据信息。

本实施例中的步骤201至步骤202与实施例一中的步骤101至步骤102的具体实现原理类似,此处不再赘述。

步骤203、确定抓取到的各数据信息的属性。

其中,数据信息的属性可以为下述任意一种:文字、图片、视频、音频等。

步骤204、针对每一属性对应的数据信息,确定所述属性对应的热点数据信息。

本实施例中,可以通过步骤203和步骤204来实现根据各数据信息的热度,对抓取到的所述多个数据信息进行排序,获取热点数据信息。

步骤204中的确定所述属性对应的热点数据信息,可以包括:

按照关键词,对所述属性对应的数据信息进行分类,确定各关键词对应的数据信息;确定界面模板中所述属性对应的区域的个数,并为各关键词分配对应的区域个数;对每个关键词对应的数据信息进行排序,并取前若干个作为该关键词对应的热点数据信息,其中,每个关键词对应的热点数据信息的个数与该关键词对应的区域的个数相等;根据各个关键词对应的热点数据信息确定所述属性对应的热点数据信息,其中,所述属性对应的热点数据信息包括各关键词对应的热点数据信息。

具体地,在为各关键词分配对应的区域个数时,假设界面模板中所述属性对应的区域的个数为m,关键词的个数为n,则m/n并向下取整得到r,为每个关键词分配r个区域,并将界面模板中剩余的m-(n*r)个区域随机分配给各关键词。

下面通过举例详细描述步骤204的实现方法。

假设关键词有3个:a、b、c。根据关键词a抓取到的数据信息共有100条,其中文字、图片和视频属性的数据信息分别有30条、30条和40条;根据关键词b抓取到的数据信息有280条,其中文字、图片和视频属性的数据信息分别有100条、100条和80条;根据关键词c抓取到的数据信息有300条,其中文字、图片和视频属性的数据信息分别有,100条、100条和100条。界面模板文字区域有6个,图片区域有4个,视频区域有3个。

针对文字属性对应的数据信息,首先,可以按照关键词,对所述属性对应的数据信息进行分类,确定各关键词对应的数据信息,按照前述假设,在文字属性对应的数据信息中,关键词a、b、c对应的数据信息分别为30条、100条和100条。确定界面模板中所述属性对应的区域的个数,并为各关键词分配对应的区域个数,本实施例中,文字区域有6个,关键词有3个,则为每个关键词分配2个文字区域。

然后,对每个关键词对应的数据信息进行排序,并取前若干个作为该关键词对应的热点数据信息,其中,每个关键词对应的热点数据信息的个数与该关键词对应的区域的个数相等。本实施例中,在文字属性对应的数据信息中,关键词a对应的数据信息为30条,关键词a对应的区域的个数为2个,则对关键词a对应的30条数据信息按照热度进行排序,并取前2个作为关键词a对应的热点数据信息;关键词b对应的数据信息为100条,关键词b对应的区域的个数为2个,则对关键词b对应的100条数据信息按照热度进行排序,并取前2个作为关键词b对应的热点数据信息;关键词c对应的数据信息为100条,关键词c对应的区域的个数为2个,则对关键词c对应的100条数据信息按照热度进行排序,并取前2个作为关键词c对应的热点数据信息。

最后,根据各个关键词对应的热点数据信息确定所述属性对应的热点数据信息,即,将各个关键词对应的热点数据信息集合起来,作为所述属性对应的热点数据信息。本实施例中,文字属性对应的热点数据信息有6条,其中关键词a、b、c对应的热点数据信息分别有2条。

针对图片属性对应的数据信息,首先,可以按照关键词,对所述属性对应的数据信息进行分类,确定各关键词对应的数据信息,按照前述假设,在图片属性对应的数据信息中,关键词a、b、c对应的数据信息分别为30条、100条和100条。确定界面模板中所述属性对应的区域的个数,并为各关键词分配对应的区域个数,本实施例中,图片区域有4个,关键词有3个,则先为每个关键词分配1个图片区域,并将剩余的1个图片区域随机分给三个关键词,假设本实施例中,剩余的1个图片区域分给了关键词a,则关键词a、b、c对应的图片区域的个数分别为2个、1个和1个。

然后,对每个关键词对应的数据信息进行排序,并取前若干个作为该关键词对应的热点数据信息,其中,每个关键词对应的热点数据信息的个数与该关键词对应的区域的个数相等。本实施例中,在图片属性对应的数据信息中,关键词a对应的数据信息为30条,关键词a对应的区域的个数为2个,则对关键词a对应的30条数据信息按照热度进行排序,并取前2个作为关键词a对应的热点数据信息;关键词b对应的数据信息为100条,关键词b对应的区域的个数为1个,则对关键词b对应的100条数据信息按照热度进行排序,并取前1个作为关键词b的热点数据信息;关键词c对应的数据信息为100条,关键词c对应的区域的个数为1个,则对关键词c对应的100条数据信息按照热度进行排序,并取前1个作为关键词c的热点数据信息。

最后,根据各个关键词对应的热点数据信息确定所述属性对应的热点数据信息,即,将各个关键词对应的热点数据信息集合起来,作为所述属性对应的热点数据信息。本实施例中,图片属性对应的热点数据信息有4条,其中关键词a、b、c对应的热点数据信息分别有2条、1条和1条。

针对视频属性对应的数据信息,首先,可以按照关键词,对所述属性对应的数据信息进行分类,确定各关键词对应的数据信息,按照前述假设,在视频属性对应的数据信息中,关键词a、b、c对应的数据信息分别为40条、80条和100条。确定界面模板中所述属性对应的区域的个数,并为各关键词分配对应的区域个数,本实施例中,视频区域有3个,关键词有3个,则为每个关键词分配1个视频区域。

然后,对每个关键词对应的数据信息进行排序,并取前若干个作为该关键词对应的热点数据信息,其中,每个关键词对应的热点数据信息的个数与该关键词对应的区域的个数相等。本实施例中,在视频属性对应的数据信息中,关键词a对应的数据信息为40条,关键词a对应的区域的个数为1个,则对关键词a对应的40条数据信息按照热度进行排序,并取前1个作为关键词a的热点数据信息;关键词b对应的数据信息为80条,关键词b对应的区域的个数为1个,则对关键词b对应的80条数据信息按照热度进行排序,并取前1个作为关键词b的热点数据信息;关键词c对应的数据信息为100条,关键词c对应的区域的个数为1个,则对关键词c对应的100条数据信息按照热度进行排序,并取前1个作为关键词c的热点数据信息。

最后,根据各个关键词对应的热点数据信息确定所述属性对应的热点数据信息,即,将各个关键词对应的热点数据信息集合起来,作为所述属性对应的热点数据信息。本实施例中,视频属性对应的热点数据信息有3条,其中关键词a、b、c对应的热点数据信息分别有1条。

步骤205、根据预设的界面模板以及所述热点数据信息,生成热点专题界面。

具体地,可以将每个属性对应的热点数据信息分别填充到界面模板中该属性对应的区域中,从而生成所述热点专题界面。

本实施例提供的热点专题发布方法,在根据每个属性对应的热点数据信息和界面模板生成热点专题界面时,考虑到的每个关键词对应的热点数据信息,使得生成的热点专题界面更全面、均匀地包含各关键词对应的数据信息,方便用户及时了解各关键词对应的热点,提高了用户体验度。

实施例三

本发明实施例三提供一种热点专题发布装置。图4为本发明实施例三提供的热点专题发布装置的结构框图。如图4所示,所述热点专题发布装置,可以包括:

确定模块301,用于确定用于生成热点专题界面的关键词;

抓取模块302,用于抓取网络中与所述关键词相关的多个数据信息;

排序模块303,用于根据各数据信息的热度,对抓取到的所述多个数据信息进行排序,获取热点数据信息;

生成模块304,根据预设的界面模板以及所述热点数据信息,生成热点专题界面。

本实施例提供的热点专题发布装置,可以用于执行实施例一所述的热点专题发布方法,其具体实现原理与实施例一类似,此处不再赘述。

本实施例提供的热点专题发布装置,通过确定用于生成热点专题界面的关键词,抓取网络中与所述关键词相关的多个数据信息,并根据各数据信息的热度,对抓取到的所述多个数据信息进行排序,获取热点数据信息,根据预设的界面模板以及所述热点数据信息,可以快速、自动地生成热点专题界面,有效地提高了发布热点专题的效率,满足了用户对于信息的需求。

在上述实施例提供的技术方案的基础上,优选的是,所述确定模块301,还可以用于:

在根据预设的界面模板以及所述热点数据信息,生成热点专题界面之前,获取界面模板参数,所述界面模板参数包括在界面上划分出的各区域的位置信息以及各区域对应的属性;

根据所述界面模板参数,将界面分割成相应的区域,生成所述界面模板;

其中,所述属性为下述任意一种:文字、图片、视频、音频。

在上述实施例提供的技术方案的基础上,优选的是,所述排序模块303,具体可以用于:

确定抓取到的各数据信息的属性,并按照属性对抓取到的数据信息进行分类;

确定界面模板中各属性对应的区域的个数;

对每个属性对应的数据信息进行排序,并取前若干个作为该属性对应的热点数据信息;

其中,每个属性对应的热点数据信息的个数与界面模板中该属性对应的区域的个数相等。

或者,所述排序模块303,具体可以用于:

确定抓取到的各数据信息的属性;

针对每一属性对应的数据信息,确定所述属性对应的热点数据信息:

其中,确定所述属性对应的热点数据信息包括:

按照关键词,对所述属性对应的数据信息进行分类,确定各关键词对应的数据信息;

确定界面模板中所述属性对应的区域的个数,并为各关键词分配对应的区域个数;

对每个关键词对应的数据信息进行排序,并取前若干个作为该关键词对应的热点数据信息,其中,每个关键词对应的热点数据信息的个数与该关键词对应的区域的个数相等;

根据各个关键词对应的热点数据信息确定所述属性对应的热点数据信息。

在上述实施例提供的技术方案的基础上,优选的是,所述生成模块304,具体可以用于:

将每个属性对应的热点数据信息分别填充到界面模板中该属性对应的区域中,从而生成所述热点专题界面。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1