一种搜索网页页面中内容的方法及装置制造方法
【专利摘要】本发明公开了一种搜索网页页面中内容的方法及装置,该方法包括:当用户在一网页页面中搜索一内容时,接收用户在当前网页页面上输入的待搜索关键词;获取所述当前网页页面对应的网络链接,根据所述网络链接判断是否有与所述当前网页页面相关的至少一个相关分页,生成一判断结果;在所述判断结果表明有与所述当前网页页面相关的至少一个相关分页时,获取所述至少一个相关分页中所包含的第一数据;在所述第一数据中搜索与所述待搜索关键词匹配的目标内容。本发明提供的搜索网页页面中内容的方法和装置用户不用重复翻页获取搜索结果,简化了页面搜索的操作步骤,节约了页面搜索的时间。
【专利说明】一种搜索网页页面中内容的方法及装置
【技术领域】
[0001]本发明涉及网络【技术领域】,尤其涉及一种搜索网页页面中内容的方法及装置。
【背景技术】
[0002]当前,人们越来越认识到互联网信息的重要价值,人们日常生活中经常使用电脑或手机,利用其中的浏览器在互联网上浏览网页内容,获取资讯信息。互联网网页内容的呈现方式有的是一个主题内容仅占据一个页面,有的是一个主题内容分割为多个页面来显示,常见的例如论坛、新闻网站、网络小说网页等,经常采用多个页面来呈现一个主题内容,而在每个页面上采用标记页码序号的方式或下一页等标识来提示读者存在后续相关页面。
[0003]本申请发明人在实现本申请实施例中技术方案的过程中,发现现有技术存在如下技术问题:
[0004]当前浏览器的页面查找功能,只能在当前打开的网页中查找用户需要的内容。如果用户需要查找的内容在包括多页内容的一主题的某一页中,例如:在某个论坛类的网页中如果用户想在多页回帖中进行查找一个内容,则需要每次在当前显示的网页中点击查找,如果当前页没有用户需要查找的内容,则需要点击下一页,再点击查找,在所述下一页连接所对应显示的网页内容中查找用户需要的内容,如此往复直到找到用户需要的内容。使用该种方式在包括多页内容的网页中查找内容时,操作步骤繁杂,不便于实现。
【发明内容】
[0005]本发明提供一种搜索网页页面中内容的方法及装置,本发明所提供的方法和装置解决现有技术中在包括多页内容的网页页面中查找内容,操作步骤繁杂,不便于实现的问题。
[0006]本发明提供一种搜索网页页面中内容的方法,当用户在一网页页面中搜索一内容时,所述方法包括:
[0007]接收用户在当前网页页面上输入的待搜索关键词;
[0008]获取所述当前网页页面对应的网络链接,根据所述网络链接判断是否有与所述当前网页页面相关的至少一个相关分页,生成一判断结果;
[0009]在所述判断结果表明有与所述当前网页页面相关的至少一个相关分页时,获取所述至少一个相关分页中所包含的第一数据;
[0010]在所述第一数据中搜索与所述待搜索关键词匹配的目标内容。
[0011]可选的方案,根据所述网络链接判断是否有与所述当前网页页面相关的至少一个相关分页,生成一判断结果包括:
[0012]在浏览器引擎内确定与所述网络链接对应的文档对象模型DOM树的数据结构,根据所述数据结构创建包含所述当前网页页面所有链接标签的第一集合;
[0013]将预设的分页标签与集合中每一个链接标签进行匹配,如果匹配成功,则确定有与所述当前网页页面相关的至少一个相关分页,生成一判断结果。
[0014]可选的方案,所述预设的分页标签包括:表示与所述当前网页页面相关的所有相关分页的第一分页标签;表示与所述当前网页页面相关的一个相关分页的第二分页标签;第一分页标签与第二分页标签不相同。
[0015]可选的方案,所述将预设的分页标签与集合中每一个链接标签进行匹配包括:
[0016]将所述第一分页标签与所述集合中每一个链接标签进行匹配,得到第一匹配结果;
[0017]在所述第一匹配结果表明没有与所述第一分页标签匹配的链接标签,则将所述第二分页标签与集合中每一个链接标签进行匹配。
[0018]可选的方案,则确定有与所述当前网页页面相关的至少一个相关分页,生成一判断结果之后,所述获取所述至少一个相关分页中所包含的第一数据包括:
[0019]获取与所述分页标签匹配的链接标签;
[0020]控制浏览器在后台打开所述链接标签对应的网页页面,并进行加载得到所述至少一个相关分页中所包含的第一数据。
[0021]可选的方案,在所述第一数据中搜索与所述待搜索关键词匹配的结果之后,该方法还进一步包括:
[0022]输出所述目标内容所处的第一分页以及所述第一分页对应的链接;
[0023]当接收到选择从所述第一分页对应的链接中选择任一分页进行显示的第一操作后,根据所述任一分页对应的链接跳转到对应的网页页面。
[0024]根据上述方法本发明还提供一种搜索网页页面中内容的装置,该装置包括:
[0025]关键词接收单元,当用户在一网页中搜索一内容时,用于接收用户在当前网页页面上输入的待搜索关键词;
[0026]隐含数据确定单元,用于获取所述当前网页页面对应的网络链接,根据所述网络链接判断是否有与所述当前网页页面相关的至少一个相关分页,生成一判断结果;
[0027]数据获取单元,用于在所述判断结果表明有与所述当前网页页面相关的至少一个相关分页时,获取所述至少一个相关分页中所包含的第一数据;
[0028]目标内容确定单元,用于在所述第一数据中搜索与所述待搜索关键词匹配的目标内容。
[0029]可选的方案,所述隐含数据确定单元包括:
[0030]网络数据获取模块,用于在浏览器引擎内确定与所述网络链接对应的文档对象模型DOM树的数据结构,根据所述数据结构创建包含所述当前网页页面所有链接标签的第一集合;
[0031]匹配模块,用于将预设的分页标签与集合中每一个链接标签进行匹配,如果匹配成功,则确定有与所述当前网页页面相关的至少一个相关分页,生成一判断结果。
[0032]可选的方案,当所述预设的分页标签包括:表示与所述当前网页页面相关的所有相关分页的第一分页标签;表示与所述当前网页页面相关的一个相关分页的第二分页标签;第一分页标签与第二分页标签不相同;则所述匹配模块将预设的分页标签与集合中每一个链接标签进行匹配包括:
[0033]将所述第一分页标签与所述集合中每一个链接标签进行匹配,得到第一匹配结果;
[0034]在所述第一匹配结果表明没有与所述第一分页标签匹配的链接标签,则将所述第二分页标签与集合中每一个链接标签进行匹配。
[0035]可选的方案,数据获取单元获取所述至少一个相关分页中所包含的第一数据包括:
[0036]获取与所述分页标签匹配的链接标签;
[0037]控制浏览器在后台打开所述链接标签对应的网页页面,并进行加载得到所述至少一个相关分页中所包含的第一数据。
[0038]可选的方案,该装置还包括:
[0039]跳转单元,用于输出所述目标内容所处的第一分页以及所述第一分页对应的链接;当接收到选择从所述第一分页对应的链接中选择任一分页进行显示的第一操作后,根据所述任一分页对应的链接跳转到对应的网页页面。
[0040]上述技术方案中的一个或两个,至少具有如下技术效果:
[0041]本发明所提供的方法针对一个主题内容包括多个分页的情况,只要用户在该主题的任一分页上输入搜索关键词,浏览器引擎则可根据该搜索关键词对所述主题的所有内容(包括所有分页内容)进行搜索,使得用户不用重复翻页获取搜索结果,简化了页面搜索的操作步骤,节约了页面搜索的时间。
【专利附图】
【附图说明】
[0042]图1为本发明实施例一种搜索网页页面中内容的方法的流程图;
[0043]图2为本发明实施例一种搜索网页页面中内容的装置的结构示意图。
【具体实施方式】
[0044]现有技术中,当前浏览器的页面查找功能,只能在当前打开的网页页面中查找用户需要的内容。如果用户需要查找的内容在包括多页内容的一主题的某一页中,例如:在某个论坛类的网页页面中如果用户想在多页回帖中进行查找一个内容,则需要每次在当前显示的网页页面中点击查找,如果当前显示的网页页面没有用户需要查找的内容,则需要点击下一页,再点击查找,在所述下一页链接所对应显示的网页页面内容中查找用户需要的内容,如此往复直到找到用户需要的内容。使用该种方式在包括多页内容的网页页面中查找目标内容实现步骤繁多,不便于实现。
[0045]针对上述问题,本发明实施例提供一种搜索网页页面中内容的方法,当用户在一网页页面中搜索一内容时,所述方法包括:
[0046]接收用户在当前网页页面上输入的待搜索关键词;
[0047]获取所述当前网页页面对应的网络链接,根据所述网络链接判断是否有与所述当前网页页面相关的至少一个相关分页,生成一判断结果;
[0048]在所述判断结果表明有与所述当前网页页面相关的至少一个相关分页时,获取所述至少一个相关分页中所包含的第一数据;
[0049]在所述第一数据中搜索与所述待搜索关键词匹配的目标内容。
[0050]本发明所提供的方法针对一个主题内容包括多个分页的情况,只要用户在该主题的任一分页上输入搜索关键词,浏览器引擎则可根据该搜索关键词对所述主题的所有内容(包括所有分页内容)进行搜索,使得用户不用重复翻页获取搜索结果,简化了页面搜索的操作步骤,节约了页面搜索的时间。
[0051]下面将参照下述细节对本发明的各种实施例和各个方面进行说明,附图将图示各种实施例。下面的说明和附图是对本发明的示例性说明,而不应看作对本发明的限制。描述了大量具体细节以提供对本发明各种实施例的详尽理解。但是在某些情况下,将不对公知的或传统的细节进行描述,以对本发明的实施例提供简要的说明。
[0052]下文【具体实施方式】的某些部分是以算法的形式展现的,这些算法包括对于计算机存储器内储存的数据进行的操作。算法大体上是指造成所需结果的操作的自洽序列。这些操作通常需要或涉及到物理操纵或物理量。通常(但不是必然),这些量采取电信号或磁信号的形式,这些信号能够被储存、传输、合并、比较和以其他方式受到操纵。业已证明,有时(主要是为了通常使用的原因),将这些信号称为位、值、元素、符号、字符、项、数等等是方便的。
[0053]但是应当牢记,这些以及类似的所有术语是与适当的物理量相关联的,并且仅仅是应用于这些量的方便的标号。除非下文中明显地以其他形式另有说明外,整个说明书中使用诸如“处理”或“计算”或“判定”或“显示”等术语所进行的说明可以指数据处理系统或类似电子装置进行的动作和处理,所述动作和处理操纵计算机的寄存器和存储器内以物理(电子)量表示的数据并将其转换成该系统的存储器或寄存器(或其他这类信息存储、传输或显示的装置)内类似地以物理量的形式表示的其他数据。
[0054]本发明可以涉及用于执行本申请中所述操作中的一项或多项操作的设备。该设备可以为所需的目的而专门构造,或者也可以包括通用计算机,所述通用计算机由储存在该计算机中的计算机程序选择性地激活(activate)或重构(reconfigure)。这样的计算机程序可以被储存在机器(例如计算机)可读介质中或者存储在适于储存电子指令并分别耦联到总线的任何类型介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、光盘、CD-ROM、和磁光盘)、只读存储器(ROM)、随机存取存储器(RAM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM (EEPROM)、闪存、磁性卡片或光学卡片。
[0055]机器可读介质包括用于以由机器(例如计算机)可读的形式储存或传输信息的任何机构。例如,机器可读介质包括只读存储器(ROM);随机存取存储器(RAM)、磁盘储存介质、光学储存介质、闪存装置、以电的、光的、声的或其他的形式传播的信号(例如载波、红外信号、数字信号等)等。
[0056]如图1所示,本发明实施例提供一种搜索网页页面中内容的方法,如果用户对包括多个分页页面的任一主题,进行页面内容搜索时,下面结合说明书附图对本发明的【具体实施方式】进行详细说明:
[0057]步骤101,接收用户在当前网页页面上输入的待搜索关键词;
[0058]在本发明实施例中,为了尽量使用现有网页页面中所提供的内容,所以本发明实施例可以通过现有网页页面中所提供的搜索关键词输入框获取用户输入的搜索关键词。
[0059]步骤102,获取所述当前网页页面对应的网络链接,根据所述网络链接判断是否有与所述当前网页页面相关的至少一个相关分页,生成一判断结果;
[0060]现有技术中如果一个主题所述对应的内容太长,一般会分成好多个分页,进一步为了能够通过当前显示页面跳转到其他分页,都会在网络连接中标示当前分页与其他分页的关系,所以本发明实施例所提供的方法,在确定用户在任一分页页中输入了搜索关键词,则对应的可根据当前网页页面的网络链接确定是否有与所述任一分页相关联的其他分页。
[0061]所以在本发明实施例中,根据所述网络链接判断是否有与所述当前网页页面相关的至少一个相关分页,生成一判断结果包括:
[0062]在浏览器引擎内确定与所述网络链接对应的文档对象模型DOM树的数据结构,根据所述数据结构创建包含所述当前网页页面所有链接标签的第一集合;
[0063]将预设的分页标签与集合中每一个链接标签进行匹配,如果匹配成功,则确定有与所述当前网页页面相关的至少一个相关分页,生成一判断结果。
[0064]步骤103,在所述判断结果表明有与所述当前网页页面相关的至少一个相关分页时,获取所述至少一个相关分页中所包含的第一数据;
[0065]在确定当前显示页面有相关的其他分页之后,浏览器引擎则可获取各分页的数据,从而使得用户不用重复翻页实现每个分页内容的搜索。
[0066]步骤104,在所述第一数据中搜索与所述待搜索关键词匹配的目标内容。
[0067]在具体的应用环境中,因为不同的浏览引擎提供不同的服务实现,所以对已包括多个分页的一个主题,会存储不同的呈现方式,所以在本发明实施例中,所述预设的分页标签包括:表示与所述当前网页页面相关的所有相关分页的第一分页标签;表示与所述当前网页页面相关的一个相关分页的第二分页标签;第一分页标签与第二分页标签不相同。
[0068]在具体的应用实现中,一般情况下多个分页在呈现具体内容时,可以通过一次性提供所有页面内容或者是逐页提供两种方式向用户提供一个主题的各分页内容,针对上述两种内容提供方式,现有的每个分页的显示内容中会包含实现上述两种方式的关键词,如果第一方式对应第一分页标签,第二方式对应第二分页标签,则所述将预设的分页标签与集合中每一个链接标签进行匹配的具体实现可以是:
[0069]将所述第一分页标签与所述集合中每一个链接标签进行匹配,得到第一匹配结果;
[0070]在所述第一匹配结果表明没有与所述第一分页标签匹配的链接标签,则将所述第二分页标签与集合中每一个链接标签进行匹配。
[0071]根据上述两种提供网页页面内容的方式,一下利用具体的实例进一步详细的说明,具体时下可以是:
[0072]方式一、如果当前分页中显示以“下一页”(当然在具体的应用环境中也可以是“下一张” “下一节” “下一章”等等标示,只要是能够体现当前页面与相关分页关系的关键词都可)的方式标示的相关分页,则该方法的具体实现可以是:
[0073]A,根据当前已经打开的网页页面,获取浏览器引擎内部构建好的DOM树的数据结构,根据所述数据结构可以创建一个所有的链接<a>标签的一个集合。
[0074]B,然后在这个集合中对每一个元素进行一个智能的匹配,匹配关键字比如“下一页” “下一张” “下一节”等等,如果在智能匹配成功情况下,则认为这个链接是对应着下一页的链接。
[0075]C,然后浏览器在后台打开所述“下一页”链接对应的新页面,并进行加载,加载后进行字符串的查找过程。
[0076]D,查找完成后,浏览器引擎在所述“下一页”连接对应的新页面中执行A和B的操作,找到所述新页面的下一页(即所述原始页面的第三页),找到后,再执行步骤C的操作,以此类推。
[0077]E,经过以上N次迭代操作后(N为网页页面所有分页对应的数值),把所有查找得到的结果反馈给用户。
[0078]方式二、如果当前分页中显示有“显示所有内容”(除了可以是“显示所有内容”外,当然在具体的应用环境中也可以是其他能够使得用户获取所有分页内容的标识),则确定可以一次性获取所有分页内容,则该方法的具体实现可以是:
[0079]1,根据当前已经打开的网页页面,获取浏览器引擎内部构建好的DOM树的数据结构,根据所述数据结构可以创建一个所有的链接<a>标签的一个集合。
[0080]2,然后在所述集合中对每一个元素进行一个智能的匹配,匹配的关键字可以是“全部内容” “全文”等等,如果智能匹配成功,则确定通过当前分页中提供的内容可以获取对应全部内容的链接。
[0081]3,浏览器在后台打开“全部内容”所对应的链接,并进行加载,通过该加载过程即可获取到所有分页的内容,在所述加载内容中进行字符串的查找过程。查找出结果后,反馈给用户。
[0082]在该实例中,为了用户对其他分页执行的搜索过程不影响用户当前正在查看的网页页面内容,本发明所提供的方案通过后台加载其他分页内容的方式获取其他分页的具体数据,则在本发明实施例中确定有与所述当前网页页面相关的至少一个相关分页,生成一判断结果之后,所述获取所述至少一个相关分页中所包含的第一数据包括:
[0083]获取与所述分页标签匹配的链接标签;
[0084]控制浏览器在后台打开所述链接标签对应的网页页面,并进行加载得到所述至少一个相关分页中所包含的第一数据。
[0085]进一步,因为用户在网页页面中搜索数据的过程中出了确定与搜索关键词对应的目标内容外,如果能够结合每个显示也的内容会使得搜索结果更符合用户的需求,所以在所述第一数据中搜索与所述待搜索关键词匹配的结果之后,该方法还进一步包括:
[0086]输出所述目标内容所处的第一分页以及所述第一分页对应的链接;
[0087]当接收到选择从所述第一分页对应的链接中选择任一分页进行显示的第一操作后,根据所述任一分页对应的链接跳转到对应的网页页面。
[0088]本发明所提供的方法针对一个主题内容包括多个分页的情况,只要用户在该主题的任一分页上输入搜索关键词,浏览器引擎则可根据该搜索关键词对所述主题的所有内容(包括所有分页内容)进行搜索,使得用户不用重复翻页获取搜索结果,简化了页面搜索的操作步骤,节约了页面搜索的时间。
[0089]如图2所示,根据上述方法本发明还提供一种搜索网页页面中内容的装置,该装置包括:
[0090]关键词接收单元201,当用户在一网页页面中搜索一内容时,用于接收用户在当前网页页面上输入的待搜索关键词;
[0091]隐含数据确定单元202,用于获取所述当前网页页面对应的网络链接,根据所述网络链接判断是否有与所述当前网页页面相关的至少一个相关分页,生成一判断结果;
[0092]数据获取单元203,用于在所述判断结果表明有与所述当前网页页面相关的至少一个相关分页时,获取所述至少一个相关分页中所包含的第一数据;
[0093]在本发明实施例中,数据获取单元203可以通过以下方式获取所述至少一个相关分页中所包含的第一数据:
[0094]获取与所述分页标签匹配的链接标签;
[0095]控制浏览器在后台打开所述链接标签对应的网页页面,并进行加载得到所述至少一个相关分页中所包含的第一数据。
[0096]目标内容确定单元204,用于在所述第一数据中搜索与所述待搜索关键词匹配的目标内容。
[0097]现有技术中如果一个主题所述对应的内容太长,一般会分成好多个分页,进一步为了能够通过当前显示页面跳转到其他分页,都会在网络连接中标示当前分页与其他分页的关系,所以本发明实施例所提供的方法,在确定用户在任一分页页中输入了搜索关键词,则对应的可根据当前网页页面的网络链接确定是否有与所述任一分页相关联的其他分页。
[0098]所以在本发明实施例中,所述隐含数据确定单元202包括:
[0099]网络数据获取模块,用于在浏览器引擎内确定与所述网络链接对应的文档对象模型DOM树的数据结构,根据所述数据结构创建包含所述当前网页页面所有链接标签的第一集合;
[0100]匹配模块,用于将预设的分页标签与集合中每一个链接标签进行匹配,如果匹配成功,则确定有与所述当前网页页面相关的至少一个相关分页,生成一判断结果。
[0101]当所述预设的分页标签包括:表示与所述当前网页页面相关的所有相关分页的第一分页标签;表示与所述当前网页页面相关的一个相关分页的第二分页标签;第一分页标签与第二分页标签不相同;则所述匹配模块将预设的分页标签与集合中每一个链接标签进行匹配包括:
[0102]将所述第一分页标签与所述集合中每一个链接标签进行匹配,得到第一匹配结果;
[0103]在所述第一匹配结果表明没有与所述第一分页标签匹配的链接标签,则将所述第二分页标签与集合中每一个链接标签进行匹配。
[0104]进一步,因为用户在网页页面中搜索数据的过程中出了确定与搜索关键词对应的目标内容外,如果能够结合每个显示也的内容会使得搜索结果更符合用户的需求,所以该本发明实施例提供的装置还包括:
[0105]跳转单元205,用于输出所述目标内容所处的第一分页以及所述第一分页对应的链接;当接收到选择从所述第一分页对应的链接中选择任一分页进行显示的第一操作后,根据所述任一分页对应的链接跳转到对应的网页页面。
[0106]本申请实施例中的上述一个或多个技术方案,至少具有如下的技术效果:
[0107]本发明所提供的方法针对一个主题内容包括多个分页的情况,只要用户在该主题的任一分页上输入搜索关键词,浏览器引擎则可根据该搜索关键词对所述主题的所有内容(包括所有分页内容)进行搜索,使得用户不用重复翻页获取搜索结果,简化了页面搜索的操作步骤,节约了页面搜索的时间。
[0108]本发明所述的方法并不限于【具体实施方式】中所述的实施例,本领域技术人员根据本发明的技术方案得出其它的实施方式,同样属于本发明的技术创新范围。
[0109]显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
【权利要求】
1.一种搜索网页页面中内容的方法,当用户在一网页页面中搜索一内容时,所述方法包括: 接收用户在当前网页页面上输入的待搜索关键词; 获取所述当前网页页面对应的网络链接,根据所述网络链接判断是否有与所述当前网页页面相关的至少一个相关分页,生成一判断结果; 在所述判断结果表明有与所述当前网页页面相关的至少一个相关分页时,获取所述至少一个相关分页中所包含的第一数据; 在所述第一数据中搜索与所述待搜索关键词匹配的目标内容。
2.如权利要求1所述的方法,其特征在于,根据所述网络链接判断是否有与所述当前网页页面相关的至少一个相关分页,生成一判断结果包括: 在浏览器引擎内确定与所述网络链接对应的文档对象模型DOM树的数据结构,根据所述数据结构创建包含所述当前网页页面所有链接标签的第一集合; 将预设的分页标签与集合中每一个链接标签进行匹配,如果匹配成功,则确定有与所述当前网页页面相关的至少一个相关分页,生成一判断结果。
3.如权利要求2所述的方法,其特征在于,所述预设的分页标签包括:表示与所述当前网页页面相关的所有相关分页的第一分页标签;表示与所述当前网页页面相关的一个相关分页的第二分页标签;第一分页标签与第二分页标签不相同。
4.如权利要求3所述的方法,其特征在于,所述将预设的分页标签与集合中每一个链接标签进行匹配包括: 将所述第一分页标签与所述集合中每一个链接标签进行匹配,得到第一匹配结果;在所述第一匹配结果表明没有与所述第一分页标签匹配的链接标签,则将所述第二分页标签与集合中每一个链接标签进行匹配。
5.如权利要求2?4任一所述的方法,其特征在于,则确定有与所述当前网页页面相关的至少一个相关分页,生成一判断结果之后,所述获取所述至少一个相关分页中所包含的第一数据包括: 获取与所述分页标签匹配的链接标签; 控制浏览器在后台打开所述链接标签对应的网页页面,并进行加载得到所述至少一个相关分页中所包含的第一数据。
6.如权利要求5所述的方法,其特征在于,在所述第一数据中搜索与所述待搜索关键词匹配的结果之后,该方法还进一步包括: 输出所述目标内容所处的第一分页以及所述第一分页对应的链接; 当接收到选择从所述第一分页对应的链接中选择任一分页进行显示的第一操作后,根据所述任一分页对应的链接跳转到对应的网页页面。
7.一种搜索网页页面中内容的装置,该装置包括: 关键词接收单元,当用户在一网页页面中搜索一内容时,用于接收用户在当前网页页面上输入的待搜索关键词; 隐含数据确定单元,用于获取所述当前网页页面对应的网络链接,根据所述网络链接判断是否有与所述当前网页页面相关的至少一个相关分页,生成一判断结果; 数据获取单元,用于在所述判断结果表明有与所述当前网页页面相关的至少一个相关分页时,获取所述至少一个相关分页中所包含的第一数据; 目标内容确定单元,用于在所述第一数据中搜索与所述待搜索关键词匹配的目标内容。
8.如权利要求7所述的装置,其特征在于,所述隐含数据确定单元包括: 网络数据获取模块,用于在浏览器引擎内确定与所述网络链接对应的文档对象模型DOM树的数据结构,根据所述数据结构创建包含所述当前网页页面所有链接标签的第一集合; 匹配模块,用于将预设的分页标签与集合中每一个链接标签进行匹配,如果匹配成功,则确定有与所述当前网页页面相关的至少一个相关分页,生成一判断结果。
9.如权利要求8所述的装置,其特征在于,当所述预设的分页标签包括:表示与所述当前网页页面相关的所有相关分页的第一分页标签;表示与所述当前网页页面相关的一个相关分页的第二分页标签;第一分页标签与第二分页标签不相同;则所述匹配模块将预设的分页标签与集合中每一个链接标签进行匹配包括: 将所述第一分页标签与所述集合中每一个链接标签进行匹配,得到第一匹配结果;在所述第一匹配结果表明没有与所述第一分页标签匹配的链接标签,则将所述第二分页标签与集合中每一个链接标签进行匹配。
10.如权利要求8?9任一所述的装置,其特征在于,数据获取单元获取所述至少一个相关分页中所包含的第一数据包括: 获取与所述分页标签匹配的链接标签; 控制浏览器在后台打开所述链接标签对应的网页页面,并进行加载得到所述至少一个相关分页中所包含的第一数据。
11.如权利要求10所述的装置,其特征在于,该装置还包括: 跳转单元,用于输出所述目标内容所处的第一分页以及所述第一分页对应的链接;当接收到选择从所述第一分页对应的链接中选择任一分页进行显示的第一操作后,根据所述任一分页对应的链接跳转到对应的网页页面。
【文档编号】G06F17/30GK104462142SQ201310439350
【公开日】2015年3月25日 申请日期:2013年9月24日 优先权日:2013年9月24日
【发明者】王文峰 申请人:联想(北京)有限公司