专利名称:网页撷取方法及网页撷取系统的制作方法
技术领域:
本发明涉及一种网页撷取方法及网页撷取系统,特别是一种使用者可在网页选取 网页区块后,可持续浏览网页的下一页的该网页区块的网页撷取方法及网页撷取系统。
背景技术:
随着计算机及因特网的蓬勃发展,随时上网页搜索资料、阅读新闻,甚至在网页上 看漫画或小说等等已经是相当普遍的行为,且由于网页技术配合桌上型计算机的屏幕的尺 寸的成长,网页内的内容往往相当丰富及多元,然而使用者在浏览网页时,网页常常充斥非 使用者想要观看的内容,譬如不相干的主题及广告分布在网页的侧边或是网页的上方等 等,除了占用许多网页上的空间外,亦造成使用者在浏览网页时的困扰,无法快速找到及专 心浏览网页。在另一方面,便携式电子装置(譬如个人数字助理(personal digital assistant,PDA))亦具备上网功能,若使用者进行浏览网页的行为,因便携式电子装置的屏 幕过小(通常为4英寸以下)及网页内容杂乱,使得网页内容的字体较小或因网页呈现在 屏幕的空间有限,使用者必须不断下拉或横移滚动条,让使用者在浏览网页时非常吃力及 不便。因此,有必要提供一种网页撷取方法及网页撷取系统,以改善上述浏览网页不便 的问题。
发明内容
本发明的主要目的是在提供使用者可手动选择要观看或下载的网页区块的网页 撷取方法及网页撷取系统。为达到上述的目的,本发明提供一种网页撷取方法,用于电子装置,该方法包括下 列步骤取得一网页;分析该网页,以将该网页区分成多个网页区块;显示该网页及该多个 网页区块;以及接受使用者对该多个网页区块中的至少一网页区块的选取,以将未被选取 的多个网页区块移除。在本发明的一实施例中,本发明的网页撷取方法还包括下列步骤判断具有最大 信息内容的多个网页区块中的一个为起始网页区块,起始网页区块具有标记,该标记用以 表示目前所选取的多个网页区块至少其中一个的范围。在本发明的一实施例中,多个网页区块具有树状架构的连结关系,且各网页区块 包括树状架构的各节点(node)。在本发明的一实施例中,多个网页区块具有树状架构的连结关系,且各网页区块 包括该树状架构的至少一节点。为达到上述的目的,本发明再提供一种网页撷取方法,用于电子装置,该方法包括 下列步骤提供储存模块,储存模块包括至少一预设网页的地址及至少一预设网页的主要 网页区块;取得网页,其中网页包括多个网页区块;判断网页是否为至少一预设网页;以及若网页为至少一预设网页,则将非主要网页区块的多个网页区块移除。在本发明的一实施例中,本发明的网页撷取方法还包括下列步骤设定当接受向 上指令时,进入主要网页区块的上一页内容;以及设定当接受向下指令时,进入主要网页区 块的下一页内容。在本发明的一实施例中,本发明的网页撷取方法还包括下列步骤下载主要网页 区块的所有页面内容。为达到上述的目的,本发明再提供一种网页撷取系统,包括网页浏览器模块、网页 分析模块、标记模块以及控制模块,其中网页浏览器模块用以取得及显示网页;网页分析模 块用以将网页分析为一文档对象模型并将网页区分成多个网页区块,其中文档对象模型包 括一树状架构,且各网页区块包括树状架构的至少一节点;标记模块用以表示目前所选取 的多个网页区块至少其中一个的范围;且控制模块根据使用者对多个网页区块中的至少一 网页区块的选取,而将未被选取的多个网页区块从网页浏览器模块上移除。在本发明的一实施例中,网页分析模块用以将网页分析为文档对象模型 (DocumentObject Model, DOM),文档对象模型包括树状架构,且各网页区块代表在树状架 构的各节点。在本发明的一实施例中,网页分析模块用以将网页分析为文档对象模型,文档对 象模型包括树状架构,且各网页区块代表在树状架构的至少一节点。本发明的网页撷取方法及网页撷取系统便于使用者浏览网页。
图1为关于本发明的网页撷取系统的一实施例的架构示意图。图2为关于本发明的网页撷取方法的第一实施例的步骤流程图。图3为关于本发明的网页及其网页区块的一实施例的示意图。 图4为关于本发明的文档对象模型的树状架构的一实施例的示意图。 图5为关于本发明的网页撷取方法的第一实施例的步骤流程图。图6为关于本发明的网页及其网页区块的一实施例以全屏幕模式显示在电子装
置的屏幕上的示意图<图7为关于本发明的文档对象模型的树状架构的一实施例的示意图 图8为关于本发明的网页及其网页区块的一实施例的示意图。 图9为关于本发明的网页撷取方法的第三实施例的步骤流程图。 主要组件符号说明网页撷取系统1 网页80网页浏览器模块11 上一页按键801网页分析模块12 下一页按键802标记模块13 网页区块803 819 下载模块14 网页区块81 86 储存模块15 树状架构90 控制模块16 节点901 919标记41节点91 9具体实施例方式为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举出较佳实施 例,并配合所附附图,作详细说明如下。以下请先参考图1,关于本发明的网页撷取系统的一实施例的架构示意图。如图1所示,本发明的网页撷取系统1包括网页浏览器模块11、网页分析模块12、 标记模块13、下载模块14、储存模块15以及控制模块16。其中网页浏览器模块11用以取得及显示网页。网页分析模块12用以分析网页 并将网页区分成多个网页区块。标记模块13用以表示目前所选取的多个网页区块至少其 中一个的范围。藉由使用者对上一页网页区块或下一页网页区块的选取,下载模块14用 以下载使用者所选取的至少一网页区块的所有页面内容。储存模块15用以记录使用者对 至少一网页区块的选取及下载的设定及至少一预设网页的地址及至少一预设网页的主要 (maincontent)网页区块。控制模块16电性连接网页浏览器模块11、网页分析模块12、标 记模块13、下载模块14以及储存模块15,控制模块16根据使用者对至少一网页区块的选 取,将未被选取的多个网页区块从网页浏览器模块上移除。在本发明的一实施例中,上述各个模块除可配置为硬件装置、软件程序、固件或其 组合外,亦可藉电路回路或其他适当形式配置;并且,各个模块除可以单独的形式配置外, 亦可以结合的形式配置。在本发明的一实施例中,网页撷取系统1可安装于电子装置中,电子装置包括全 球定位系统(GPQ装置、移动电话(mobile phone)或个人数字助理,但本发明不以此为限, 任何具备上网及浏览网页功能的电子装置皆可安装本发明的网页撷取系统1。以下即以图1所示的本发明的网页撷取系统1为例,详细说明本发明的网页撷取 方法的各实施例的各个步骤。须注意的是,在本发明的第一实施例中,网页撷取系统1安装 于具有上、下、左以及右键的电子装置中,上、下、左以及右键分别可执行上、下、左以及右的 指令。另外,只要能达到本发明的目的,本发明的方法并不以应用在图1所示的网页撷取系 统1为限。请一并参考图1至图6,关于本发明的网页撷取方法的第一实施例。如图2所示,本发明首先进行步骤S71 取得网页。如图3所示,在本发明的一实施例中,网页浏览器模块11用以取得及显示网页80, 其中网页80为任何形式的网页,譬如新闻网页、搜索网页、个人网络日志网页、小说网页、 漫画网页、论坛网页或社群网页等,但本发明不以此为限。接着进行步骤S72 分析网页,以将网页区分成多个网页区块。如图3所示,在本发明的一实施例中,网页分析模块12分析网页80并将网页80 区分成多个网页区块803 819。在本发明的一实施例中,网页分析模块12将网页80分析为文档对象模 型,文档对象模型是给超文本标记语言(HyperText Markup Language, HTML)与可 扩展标记语言(eXtensib 1 e Markup Language,XML)文件使用的一组应用程序接口 (ApplicationProgramming Interface, API),文档对象模型提供了文件的结构表述,使文 件的属性(property)、方法(method)以及事件处理(event handler)都以对象来展现。
如图4所示,文档对象模型包括树状架构90,树状架构90包括多个节点901 919,各节点除具有上、下方向的父、子节点的层次关系外,亦有左、右方向的水平位置的节 点的层次关系,举例来说,节点903相对于节点904,节点903为父节点,节点904为子节点; 节点903、节点906以及节点915为相同层次的节点。由于文档对象模型已经在网页的相关技术领域中被广泛使用,且并非本发明所要 改进的重点所在,故在此不再赘述其详细的工作方式。在本发明的一实施例中,各节点903 919相对应于各网页区块803 819,但本 发明不以此为限。另须注意的是,本实施例的文档对象模型的树状架构90的示意图为简化后的示 意图,仅以示意方式说明本发明的网页80的文档对象模型的树状架构90,其实际实施时的 网页80及文档对象模型的树状架构90可更为复杂。接着进行步骤S73 显示网页及多个网页区块。其中在步骤S73中,还包括步骤S731 判断具有最大信息内容的多个网页区块中 的一个为起始网页区块,起始网页区块具有标记。其中,最大信息内容的网页区块可为具有文字最多或图片最大的网页区块。在本 发明的一实施例中,网页分析模块12判断具有最大信息内容的多个网页区块803 819中 的一个为起始网页区块。在本发明的一实施例中,在各节点903 919中,节点916具有最 多的文字,网页分析模块12即判断节点916对应的网页区块816为起始网页区块。如图3所示,在本发明的一实施例中,起始网页区块具有标记41,标记41用以表示 目前所选取的多个网页区块至少其中一个的范围,其中标记41可在各网页区块之间移动 或根据所选取的多个网页区块至少其中一个的范围放大或缩小;在本发明的一实施例中, 标记41为粗线框,但本发明不以此为限,举例来说,标记41亦可为反白框或具有特定颜色 的方框。在本发明的一实施例中,控制模块16将网页80及多个网页区块803 819及标 记41显示于电子装置的屏幕上(如图3所示)。接着进行步骤S74 接受使用者对至少一网页区块的选取。其中在步骤S74中,还包括步骤S741至步骤S743。如图5所示,步骤S741 设定当接受向上指令时,将标记所对应的至少一节点的最 上位的节点沿着树状架构往上移动至父节点,且将标记所选取的多个网页区块至少其中一 个的范围增加为父节点及父节点以下所对应的多个网页区块的至少其中的一个。举例来说,当标记41选取的范围为网页区块816时,网页区块816对应节点916, 当使用者按上键时,节点916的父节点为节点915,标记41从对应节点916增加为节点915 至节点919,节点915至节点919所对应的网页区块815至网页区块819,标记41选取的范 围从网页区块816增加为网页区块815至网页区块819,但本发明不以此为限。步骤S742 设定当接受向下指令时,将标记所对应的至少一节点中的最上位的节 点沿着树状架构往下移动至子节点,且将标记所选取的多个网页区块至少其中一个的范围 减少为子节点及子节点以下所对应的多个网页区块的至少其中的一个。其中须注意的是,若标记所对应的至少一节点中的最上位的节点具有多个子节 点,则随机移至其中一个子节点,但本发明不以此为限。
举例来说,标记41选取的范围为网页区块815至网页区块819时,网页区块815 至网页区块819对应节点915至节点919,其中节点915为节点915至节点919中最上位 的节点,当使用者按下键时,须注意的是,由于节点915的子节点包括节点916及节点918, 控制模块16将随机选取节点916及节点918中的一个进行移动;当控制模块16选取节点 916,则使标记41从对应节点915至节点919减少为节点916至节点917,节点916至节点 917所对应的网页区块816至网页区块817,标记41选取的范围从网页区块815至网页区 块819减少为网页区块816至网页区块817 ;当控制模块16选取节点918,则使标记41从 对应节点915至节点919减少为节点918至节点919,节点918至节点919所对应的网页区 块818至网页区块819,标记41选取的范围从网页区块815至网页区块819减少为网页区 块818至网页区块819,但本发明不以此为限。步骤S743 设定当接受向右指令或向左指令时,将标记所对应的至少一节点的最 上位的节点向右或向左移至同阶层中的一个节点,且标记所选取的多个网页区块至少其中 一个的范围转变成同阶层中一个节点及同阶层中一个节点以下所对应的多个网页区块的 至少其中的一个。举例来说,标记41选取的范围为网页区块807及网页区块808时,网页区块807及 网页区块808对应节点907及节点908,其中,节点907较节点908为上位,当使用者按右键 时,与节点907的同阶层的且在右方的节点为909,则标记41选取的范围将从网页区块807 及网页区块808改变为网页区块809及网页区块810。在本发明的一实施例中,使用者藉由上、下、左以及右键以精确控制标记41选取 多个网页区块803 819至少其中的一个。在本发明的一实施例中,使用者所选取的网页 区块为网页区块815至网页区块819。接着进行步骤S75 判断是否接受上一页信息或下一页信息的输入信息。如图3所示,在本发明的一实施例中,网页分析模块12用以判断网页80是否具有 上一页按键801或下一页按键802的按键区块,若有则显示询问使用者是否接受上一页信 息或下一页信息的输入信息或忽略信息。若网页80具有上一页按键801或下一页按键802的按键区块且使用者选择接受, 则接着进行步骤S76 下载使用者所选取的至少一网页区块的所有页面内容。在本发明的一实施例中,下载模块14下载使用者所选取的至少一网页区块的所 有页面内容并储存至储存模块15,其中所有页面内容是指使用者所选取的至少一网页区块 的所有上一页或下一页的页面内容。接着进行步骤S77 将未被选取的多个网页区块移除。在本发明的一实施例中,使用者所选取的网页区块为网页区块815至网页区块 819,则控制模块16将网页区块815至网页区块819以外的网页区块移除。接着进行步骤S78 将使用者所选取的至少一网页区块以全屏幕模式显示。如图6所示,在本发明的一实施例中,控制模块16将网页区块815至网页区块819 以全屏幕模式显示在电子装置的屏幕上。在本发明的一实施例中,若下载模块14已下载使 用者所选取的至少一网页区块的所有页面内容并储存至储存模块15,则使用者仅须使用上 或下键,可直接进行网页区块815至网页区块819的上一页或下一页的浏览。藉此,即使电 子装置的屏幕的尺寸不大,使用者仍可通过全屏幕模式显示的方式,观看到较完整的网页区块的内容,亦可调整网页的字体大小,达到阅读更为舒适的功效。在本发明的一实施例中,若网页80不具有上一页按键801或下一页按键802的按 键区块或使用者选择忽略,则进行步骤S77。最后步骤S79 记录使用者对至少一网页区块的选取(或下载)的设定。在本发明的一实施例中,储存模块15用以记录使用者对网页80的至少一网页区 块的选取的设定,藉此,若使用者下次再次浏览相同的网页80时,可避免重复上述的步骤, 而可直接阅读网页区块815至网页区块819的部分。接下来请参考图1、图2、图7以及图8关于本发明的网页撷取方法的第二实施例。本发明的网页撷取方法的第二实施例的执行步骤(如图2所示)与实施方式实质 上与第一实施例相同,其中最大的不同在于在步骤S72中,网页分析模块12将具有相关性 或不重要的多个节点合并成一个较大的节点。如图7所示,在本发明的第二实施例中,网页分析模块12将节点907及节点908 合并成节点91,节点909及节点910合并成节点92,节点911及节点912合并成节点93,节 点913及节点914合并成节点94,节点915至节点919合并成节点95,且节点903及节点 904合并成节点96 ;如图8所示,其中各节点91 96相对应于各网页区块81 86。藉此,在步骤S74中,使用者仅须利用上、下、左以及右键以控制标记41选取多个 网页区块81 86至少其中的一个,可大幅节省使用者选取网页区块的时间。惟须注意的是,当网页撷取系统1安装于具有鼠标功能或虚拟光标等可进行自由 选取网页区块的电子装置中时,在本发明的步骤S74中,则使用者可以利用鼠标功能或虚 拟光标进行对至少一网页区块的选取,而不以上、下、左以及右键做网页区块的选取为限。接下来请参考图1、图2、图6以及图9关于本发明的网页撷取方法的第三实施例。以下即以图1所示的本发明的网页撷取系统1为例,详细说明本发明的网页撷取 方法的第三实施例的各个步骤。如图9所示,本发明首先进行步骤S81 提供储存模块(数据库)。在本发明的一实施例中,储存模块15包括至少一预设网页的地址及至少一主要 网页区块。如图8所示,网页80为本发明的一实施例的预设网页,网页区块85为本发明的 一实施例的主要网页区块。在本发明的一实施例中,预设网页可为知名或人气较高的网页,但本发明不以此 为限。接着进行步骤S82 取得网页。其中,取得网页80的实施方式如前所述,在此不再赘述。接着进行步骤S83 判断网页是否为至少一预设网页。在本发明的一实施例中,控制模块16判断取得的网页80是否为储存模块15中的 至少一预设网页。若取得的网页80是至少一预设网页中的一个,则进行步骤S84 将非主要网页区 块的多个网页区块移除。如图6所示,在本发明的一实施例中,控制模块16用以将网页区块85以外的网页 区块移除,并将网页区块85以全屏幕模式显示在电子装置的屏幕上。接着进行步骤S85 设定当接受向上指令时,进入主要网页区块的上一页内容。
接着进行步骤S86 设定当接受向下指令时,进入主要网页区块的下一页内容。在本发明的一实施例中,当使用者按上键或下键时,网页区块85进入网页区块85 的上一页内容或下一页内容。在本发明的一实施例中,在步骤S84后,亦可进行步骤S87 下载主要网页区块的 所有页面内容。在本发明的一实施例中,下载模块14下载网页区块85的所有页面内容至储存装 置15,所有页面内容指网页区块85的所有上一页或下一页的页面内容。须注意的是,在本发明的上述实施例中,本发明上述各步骤并非皆需执行,因此, 本发明所属技术领域中普通技术人员应当能了解本发明上述步骤可调换次序或同时执行, 如此仍能达到本发明的功效。综上所陈,本发明无论就目的、手段及功效,处处均显示其迥异于公知技术的特 征,恳请审查员明察,早日赐准专利,使嘉惠社会,实感德便。惟应注意的是,上述诸多实施 例仅是为了便于说明而举例而已,本发明所要求保护的权利范围自然应当以权利要求书的 范围所述为准,而非仅限于上述实施例。
权利要求
1.一种网页撷取方法,用于一电子装置,该方法包括下列步骤 取得一网页;分析该网页,以将该网页区分成多个网页区块; 显示该网页及该多个网页区块;以及接受一使用者对该多个网页区块中的至少一网页区块的选取,以将未被选取的多个网 页区块移除。
2.如权利要求1所述的网页撷取方法,还包括下列步骤判断具有最大信息内容的该多个网页区块中的一个为一起始网页区块,该起始网页区 块具有一标记,该标记用以表示目前所选取的该多个网页区块至少其中一个的范围。
3.如权利要求2所述的网页撷取方法,其中该多个网页区块具有一树状架构的连结关 系,且各网页区块包括该树状架构的至少一节点,且在分析该网页的步骤中,还包括下列步 骤将该网页分析为一文档对象模型,该文档对象模型包括该树状架构。
4.如权利要求3所述的网页撷取方法,还包括下列步骤设定当接受一向上指令时,将该标记所对应的该至少一节点的最上位的该节点沿着该 树状架构往上移动至一父节点,且将该标记所选取的该多个网页区块至少其中一个的范围 增加为该父节点及该父节点以下所对应的该多个网页区块的至少其中的一个;设定当接受一向下指令时,将该标记所对应的该至少一节点的最上位的该节点沿着该 树状架构往下移动至一子节点,且将该标记所选取的该多个网页区块至少其中一个的范围 减少为该子节点及该子节点以下所对应的该多个网页区块的至少其中的一个;设定当接受一向右指令或一向左指令时,将该标记所对应的该至少一节点的最上位的 该节点向右或向左移至一同阶层的中的一个节点,且该标记所选取的该多个网页区块至少 其中一个的范围转变成该同阶层中的一个节点及该同阶层中的一个节点以下所对应的该 多个网页区块的至少其中的一个。
5.如权利要求4所述的网页撷取方法,在接受该使用者对该至少一网页区块的选取的 步骤后,还包括下列步骤判断是否接受一上一页信息或一下一页信息的输入信息;以及 若判断接受该上一页信息或该下一页信息的输入信息,接受该使用者对一上一页网页 区块或一下一页网页区块的选取。
6.如权利要求1所述的网页撷取方法,其中在接受该使用者对该至少一网页区块的选 取,以将未被选取的该多个网页区块移除的步骤后,还包括下列步骤将该使用者所选取的该至少一网页区块以一全屏幕模式显示。
7.—种网页撷取方法,用于一电子装置,该方法包括下列步骤提供一储存模块,该储存模块包括至少一预设网页的地址及该至少一预设网页的一主 要网页区块;取得一网页,其中该网页包括多个网页区块; 判断该网页是否为该至少一预设网页;以及若该网页为该至少一预设网页,则将非该主要网页区块的该多个网页区块移除。
8.如权利要求7所述的网页撷取方法,还包括下列步骤设定当接受一向上指令时,进入该主要网页区块的上一页内容;以及 设定当接受一向下指令时,进入该主要网页区块的下一页内容。
9.一种网页撷取系统,包括一网页浏览器模块,用以取得及显示一网页;一网页分析模块,用以将该网页分析为一文档对象模型并将该网页区分成多个网页区 块,其中该文档对象模型包括一树状架构,且各网页区块包括该树状架构的至少一节点; 一标记模块,用以表示目前所选取的该多个网页区块至少其中一个的范围;以及 一控制模块,该控制模块根据该使用者对该多个网页区块中的至少一网页区块的选 取,而将未被选取的多个网页区块从该网页浏览器模块上移除。
10.如权利要求9所述的网页撷取系统,还包括一下载模块,与该控制模块电性连接, 藉由该使用者对一上一页网页区块或一下一页网页区块的选取,该下载模块用以下载该使 用者所选取的该至少一网页区块的所有页面内容。
全文摘要
本发明提供一种网页撷取方法及网页撷取系统。其中该网页撷取方法用于一电子装置,包括下列步骤取得一网页;分析该网页,以将该网页区分成多个网页区块;显示该网页及该多个网页区块;以及接受使用者对该多个网页区块中的至少一网页区块的选取,以将未被选取的多个网页区块移除。本发明的网页撷取方法及网页撷取系统便于使用者浏览网页。
文档编号G06F17/30GK102135958SQ20101000105
公开日2011年7月27日 申请日期2010年1月21日 优先权日2010年1月21日
发明者庄子龙, 蔡眷民, 陈昌民, 陈泽民 申请人:宏碁股份有限公司