浏览器收藏夹整理方法和装置的制造方法
【技术领域】
[0001] 本发明涉及浏览器技术,具体涉及浏览器收藏夹整理方法以及相应的浏览器收藏 夹整理装置。
【背景技术】
[0002] 用户在利用其浏览器进行网络访问的过程中,通常会将自己喜欢的网站/网页以 及常用的网站/网页等的链接地址收录于浏览器收藏夹中,以方便自己的后续使用。
[0003] 在用户的浏览器收藏夹中收录了较多链接地址的情况下,会存在用户在收藏夹中 查找其所需要的链接地址时较费时费力的现象;另外,一些对用户来说较重要的链接地址 在被用户收藏后往往会被淹没在收藏夹的众多链接地址之中,从而没有充分发挥其应有的 价值。
[0004] 为了使浏览器便于使用,应对用户的浏览器收藏夹进行整理。
[0005] 现有的对浏览器收藏夹进行整理的方法主要包括两种:方法一、用户手工整理其 浏览器收藏夹,如用户利用浏览器的整理收藏夹选项手工将相应的链接地址收录到收藏夹 的某个文件夹中;方法二、用户从浏览器的整理收藏夹选项所提供的多种排序方式(如按 名称排序、按访问次数排序或者按收录时间排序)中选择一种排序方式,之后,浏览器根据 用户选择的排序方式对收藏夹中存储的所有链接地址进行自动排序。
[0006] 发明人在实现本发明过程中发现,上述方法一需要用户具有手工整理收藏夹的习 惯,且需要用户具备一些浏览器的相关知识;上述方法二虽然可以使收藏夹中收录的链接 地址在显示给用户时具有一定的规律性,使收藏夹中的链接地址看起来更有条理一些,但 是,在浏览器收藏夹中收录有大量的链接地址的情况下,仍然会在一定程度上存在查找相 应的链接地址较费时费力以及没有使相应的链接地址充分发挥其应用的价值的问题。
【发明内容】
[0007] 本发明的目的在于,克服现有的浏览器收藏夹整理方法所存在的技术问题,提供 一种浏览器收藏夹整理方法和相应的浏览器收藏夹整理装置,所要解决的技术问题是,可 以借助大量网络用户的收藏夹整理经验自动对用户的浏览器收藏夹中的链接地址进行整 理,且可以使收藏夹中收录的链接地址具有层次条理,易于查找。
[0008] 本发明的目的以及解决其技术问题可以采用以下的技术方案来实现。
[0009] 依据本发明提出的一种浏览器收藏夹整理方法,主要包括:获取待整理浏览器收 藏夹的目录结构信息以及各链接地址;在根据所述目录结构信息确定出所述待整理浏览器 收藏夹中包含有非根目录的情况下,根据多个用户的浏览器收藏夹的非根目录下的链接地 址及其目录标识确定待整理浏览器收藏夹的根目录下的各链接地址与待整理浏览器收藏 夹的非根目录下的各链接地址之间的相似度,并将待整理浏览器收藏夹的根目录下的与非 根目录下的链接地址相似的链接地址调整到相应的非根目录下;在待整理浏览器收藏夹的 当前根目录下包含有多个链接地址的情况下,根据多个用户的浏览器收藏夹的非根目录下 的链接地址及其目录标识确定待整理浏览器收藏夹的当前根目录下的各链接地址之间的 相似度,并根据所述各链接地址之间的相似度对当前根目录下的各链接地址进行聚类;根 据多个用户的浏览器收藏夹的非根目录下的链接地址及其目录标识为上述聚类获得的每 一类链接地址设置非根目录标识,并将所述每一类链接地址调整到所述非根目录标识所表 示的非根目录下。
[0010] 依据本发明实施例提供的一种浏览器收藏夹整理装置,主要包括:获取模块,适于 获取待整理浏览器收藏夹的目录结构信息以及各链接地址;第一调整模块,适于在根据所 述目录结构信息确定出所述待整理浏览器收藏夹中包含有非根目录的情况下,根据多个用 户的浏览器收藏夹的非根目录下的链接地址及其目录标识确定待整理浏览器收藏夹的根 目录下的各链接地址与待整理浏览器收藏夹的非根目录下的各链接地址之间的相似度,并 将待整理浏览器收藏夹的根目录下的与非根目录下的链接地址相似的链接地址调整到相 应的非根目录下;聚类模块,适于在待整理浏览器收藏夹的当前根目录下包含有多个链接 地址的情况下,根据多个用户的浏览器收藏夹的非根目录下的链接地址及其目录标识确定 所述待整理浏览器收藏夹的当前根目录下的各链接地址之间的相似度,并根据所述各链接 地址之间的相似度对当前根目录下的各链接地址进行聚类;第二调整模块,适于根据多个 用户的浏览器收藏夹的非根目录下的链接地址及其目录标识为上述聚类获得的每一类链 接地址设置非根目录标识,并将所述每一类链接地址调整到所述非根目录标识所表示的非 根目录下。
[0011] 借由上述技术方案,本发明提供的浏览器收藏夹整理方法和装置至少具有下列优 点及有益效果:本发明实施例通过基于网络中多个用户的浏览器收藏夹的非根目录下的链 接地址将待整理浏览器收藏夹的根目录下的链接地址调整到相应的非根目录下,并对当前 根目录下的各链接地址进行聚类,且基于网络中多个用户的浏览器收藏夹的非根目录下的 链接地址为每一类链接地址设置非根目录标识,这样,实现了对用户的待整理浏览器收藏 夹的自动整理,本发明提供的上述技术方案可有效提高用户的浏览器收藏夹的易用性。
[0012] 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段, 而可依照说明书的内容予以实施,并且为了让本发明的上述以及其他目的、特征和优点能 够更明显易懂,以下特举较佳的实施例,详细说明如下。
【附图说明】
[0013] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施 例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获 得其他的附图。
[0014] 图1是本发明实施例一的浏览器收藏夹整理方法流程图;
[0015] 图2是本发明实施例二的浏览器收藏夹整理方法示意图;
[0016] 图3是本发明实施例二的浏览器收藏夹整理过程中的聚类示意图;
[0017] 图4是本发明实施例四的浏览器收藏夹整理装置示意图。
【具体实施方式】
[0018] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员依次所获得的、而没有经过创造性劳动付出的其 他实施例,都属于本发明保护的范围。
[0019] 实施例一、浏览器收藏夹整理方法。该浏览器收藏夹整理方法的流程如图1所示。
[0020] 图1中,S100、获取待整理浏览器收藏夹的目录结构信息以及各链接地址。
[0021] 具体的,本实施例获取到的待整理浏览器收藏夹的目录结构信息以及各链接地址 不仅可以表示出待整理浏览器收藏夹中所包含的各目录的目录标识以及浏览器收藏夹中 所收录的各链接地址,还可以表示出待整理浏览器收藏夹中所收录的各链接地址所属的目 录(即链接地址所属的目录标识)以及不同目录之间的父子关系(即不同目录标识之间的 父子结构);也就是说,本实施例中的该步骤获取的信息可以表示出一个链接地址是处于 根目录下,还是处于某个非根目录下,如果是处于非根目录下,则还可以进一步表示出该非 根目录的父目录标识以及子目录标识等。
[0022] 本实施例获取到的待整理浏览器收藏夹的目录结构信息可以包含目录标识、父目 录标识以及子目录标识等,且本实施例获取到的待整理浏览器收藏夹的目录结构信息以及 各链接地址通常可以表现为目录结构信息与链接地址之间的对应关系的形式,一个具体的 例子,本实施例获取到的信息中的一条记录包含有本目录标识、本目录标识的父目录标识、 本目录标识的子目录标识以及本目录标识所表示的目录下的所有链接地址。上述目录标识 也可以称为目录名称或者链接地址的标签或者链接地址的目录标签等,上述父目录标识也 可以称为父目录名称或者父目录标签等,上述子目录标识也可以称为子目录名称或者子目 录标签等。
[0023] 由上述描述可知,待整理浏览器收藏夹的目录结构信息可以体现出浏览器收藏夹 中的目录结构,如根目录、根目录下的子目录(可以称为一级目录)以及根目录下的子目录 下的子目录(可以称为二级目录)等。也就是说,利用待整理浏览器收藏夹的目录信息可以 描述出一个能够展现目录之间父子关系的目录树。在本实施例中,相对于一级目录而言,根 目录为所有一级目录的父目录,所有一级目录是根目录的子目录;而相对于二级目录而言, 与二级目录对应的一级目录是该二级目录的父目录,二级目录是其对应的一级目录的子目 录。上述一级目录和二级目录均为非根目录。
[0024] 本实施例可以利用待整理浏览器客户端来获取目录结构信息以及各链接地址,如 待整理浏览器客户端根据其内部配置的网络设备地址将其收藏夹的目录结构信息以及各 链接地址传输给相应的网络设备,使该网络设备获取到待整理浏览器收藏夹的目录结构信 息以及各链接地址。
[0025]S110、在根据上述目录结构信息确定出待整理浏览器收藏夹中包含有非根目录的 情况下,根据多个用户的浏览器收藏夹的非根目录下的链接地址及其目录标识确定待整理 浏览器收藏夹的根目录下的各链接地址与待整理浏览器收藏夹的非根目录下的各链接地 址之间的相似度,并将待整理浏览器收藏夹的根目录下的与非根目录下的链接地址相似的 链接地址调整到相应的非根目录下。
[0026] 具体的,本实施例在根据上述获取到的目录结构信息确定出待整理浏览器收藏夹 并没有包含非根目录的情况下,则可以略过本步骤而直接执行后续的步骤S120 ;而在根据 上述获取到的目录结构信息确定出待整理浏览器收藏夹包含有非根目录的情况下,会执行 本步骤中的是否需要将根目录下的链接地址调整到相应的非根目录下的判断操作以及相 应的调整操作。
[0027] 本实施例可以基于多个用户的浏览器收藏夹的非根目录下的链接地址及其目录 标识来计算待整理浏览器收藏夹的根目录下的各链接地址与非根目录下的各链接地址之 间的相似度;在待整理浏览器收藏夹的非根目录仅包括一级目录的情况下,上述非根目录 下的各链接地址即为一级目录下的各链接地址;在非根目录包括一级目录和二级目录的情 况下,上述非根目录下的各链接地址可以包括一级目录下的所有链接地址以及二级目录下 的所有链接地址。
[0028] 本实施例预先采集了网络中多个用户的浏览器收藏夹的非根目录下的链接地址 及其目录标识,一个具体的例子,本实施例可以通过浏览器客户端等工具来采集网络中多 个用户的浏览器收藏夹的非根目录下的链接地址及其目录标识。
[0029] 本实施例是根据预先采集到的网络中的多个用户(如全网用户)的浏览器收藏夹 中的链接地址所属的非根目录的实际情况来计算链接地址之间的相似度;也就是说,本实 施例通过针对多个用户对浏览器收藏夹中的链接地址的整理经验进行综合分析,可以获得 链接地址整理的经验数据,之后,再利用预先综合分析获得的经验数据来计算待整理浏览 器收藏夹中的链接地址之间的相似度。换句话说,本实施例是根据网络中多个用户的浏览 器收藏夹的历史收藏行为来计算待整理浏览器收藏夹中的链接地址之间的相似度的。
[0030] 为了避免采集到的各用户的浏览器收藏夹的各链接地址中的噪音数据对后续的 统计分析造成不良影响,本实施例可以对采集到的多个用户的浏览器收藏夹的非根目录下 的链接地址进行过滤,以滤除其中的噪音数据。这里的噪音数据可以为在预定长时间内未 被用户使用的链接地址(即使用频率非常低的链接地址),也可以为已经失效的链接地址。 本实施例进行过滤的一个具体的例子为:利用浏览器收藏夹使用日志来确定各链接地址的 使用频率,从而滤除使用频率不符合预定要求的链接地址。
[0031] 在滤除了噪音数据后,可以将过滤后获得的多个用户的浏览器收藏夹的非根目录 下的链接地址作为基础数据,进行后续的统计计算,从而为待整理浏览器收藏夹中的各链 接地址设置向量,并利用各链接地址的向量来计算各链接地址之间的相似度;如针对待整 理浏览器收藏夹中的每一个链接地址而言,可以以多个用户的浏览器收藏夹的非根目录下 的链接地址及其目录标识作为基础数据分别统计上述每一个链接地址所属的非根目录标 识的分布情况,然后,将统计出的分布情况作为相应的链接地址的向量。
[0032] 上述多个用户通常可以被区分为专家用户以及普通用户;当然,本实施例也不排 除上述多个用户只包括普通用户或者只包括专家用户的情况。
[0033] 上述专家用户是指对其浏览器收藏夹中的链接地址的维护使用符合预定要求的 用户。上述预定要求可以根据实际需求设定,一个具体的例子,预定要求可以为用户经常使 用其浏览器收藏夹,且用户对其浏览器收藏夹中的链接地址基本上都进行了整理(即用户 为其浏览器收藏夹中绝大多数的链接地址都设置了相应的非根目录标识);另一个具体的 例子,上述预定要求可以为:用户经常使用其浏览器收藏夹,且用户对其浏览器收藏夹中的 链