基于用户使用情况的精品资源图谱构建方法及装置与流程

文档序号:13934425阅读:196来源:国知局
基于用户使用情况的精品资源图谱构建方法及装置与流程

本发明涉及数据库技术领域,尤其涉及一种基于用户使用情况的精品资源图谱构建方法及装置。



背景技术:

教育资源最常用的是网上教育资源,网上教育资源常用的获取方法是借助于搜索引擎通过信息查询和检索的方式获得。但是,教育环境中搜索引擎无法满足用户意图不明确时的资源访问需求。与此同时,教育大数据中资源质量参差不齐,其中的低劣教育资源严重阻碍了普通大众的学习步伐,打击了普通大众的学习积极性,也不利于教育领域的健康发展。

目前教育资源库的构建没有很好地考虑用户使用情况,缺乏与用户之间的交互,导致当用户的一个搜索请求可能代表多重含义的时候,不能够理解这其中的差别,并可以将搜索结果范围缩小到用户最想要的那种含义。由于目前教育资源库的资源之间的关联关系并不够完善,不能更好的理解用户搜索的资源,及总结出与搜索话题相关的内容,没有很好地帮助用户了解事物之间的关系,进而了解某个新的事实或新的联系,促使其进行一系列的全新搜索查询。从而导致用户在搜寻资源时获得的资源质量不高或者不是自己想要的资源,这严重的降低了用户体验。



技术实现要素:

本发明所要解决的技术问题在于,提供一种基于用户使用情况的精品资源图谱构建方法及装置,基于用户对资源的使用情况,通过构建资源图谱将资源进行可视化,在确保资源的质量同时帮助用户了解事物之间的关系,及了解某个新的事实或新的联系,促使其进行一系列的全新搜索查询。

针对上述问题,本发明的目的在于提供一种基于用户使用情况的精品资源图谱构建方法,至少包括以下步骤:

构建精品资源库;其中,所述精品资源库包括至少一个资源;

根据用户对所述精品资源库中的资源的使用情况,获取用户使用任一个资源后使用相关资源的概率分布;

根据所述概率分布,获取精品资源库中的资源之间的关联关系;

根据精品资源库中的资源之间的关联关系,按照预设的资源关联规则构建精品资源图谱,以使得当用户访问精品资源库中的资源时,根据所述精品资源图谱推送与所述当前访问资源相关联的资源。

优选地,所述根据所述概率分布,获取精品资源库中的资源之间的关联关系,具体为:根据所述概率分布,将每个资源的相关资源进行优先级排序,获取精品资源库中的资源之间的关联关系;其中,所述优先级排序为将每个资源对应的所有相关资源按照用户使用该资源后使用每一个相关资源的概率进行由大到小的排序。

优选地,所述资源之间的关联关系为每个资源对应该资源的按照优先级排序的相关资源,每一个相关资源对应着该相关资源的按照优先级排序的次相关资源;所述资源关联规则为提取每个资源对应该资源的按照优先级排序的前n个相关资源,生成精品资源图谱。

优选地,所述的基于用户使用情况的精品资源图谱构建方法,还包括:

根据所述精品资源图谱,按照预设的推送规则推送与用户当前使用资源相关的资源;所述推送规则为,根据用户使用当前资源后使其他相关资源的优先级排序,从所述精品资源图谱中选取前m个资源进行推送。

优选地,在所述构建精品资源库之前,还包括:

构建预备资源库;其中,所述预备资源库包括至少一个资源;

对所述预备资源库中的所有资源进行主题分类,以使每一个资源都包含于一个分主题中;

根据用户对所述预备资源库中的资源的使用情况,生成每个用户的分主题向量;

根据每个用户的分主题向量及每个用户使用资源的情况,计算每个资源的得分;

在每一个主题下,根据该主题下的每个资源的得分对资源进行排序,并按照预设的提取比例提取每一个主题下的资源。

优选地,所述根据每个用户的分主题向量及每个用户使用资源的情况,计算每个资源的得分,具体为:

根据每个用户的分主题向量,提取每个用户在每个分主题上的分量值;

将与每一个资源对应的所有使用该资源的用户在该资源对应的分主题上的分量值求和,得到该资源的得分。

优选地,所述使用情况包括用户对资源的搜索方式、搜索结果,以及搜索次数、下载或上载次数。

本发明还提供了一种基于用户使用情况的精品资源图谱构建装置,包括:精品资源库构建单元,用于构建精品资源库;其中,所述精品资源库包括至少一个资源;

资源使用概率获取单元,用于根据用户对所述精品资源库中的资源的使用情况,获取用户使用任一个资源后使用相关资源的概率分布;

资源关联关系获取单元,用于根据所述概率分布,获取精品资源库中的资源之间的关联关系;

精品资源图谱构建单元,用于根据精品资源库中的资源之间的关联关系,按照预设的资源关联规则构建精品资源图谱,以使得当用户访问精品资源库中的资源时,根据所述精品资源图谱推送与所述当前访问资源相关联的资源。

优选地,所述的基于用户使用情况的精品资源图谱构建装置,其特征在于,还包括:

预备资源库构建单元,用于构建预备资源库;其中,所述预备资源库包括至少一个资源;

主题分类单元,用于对所述预备资源库中的所有资源进行主题分类,以使每一个资源都包含于一个分主题中;

分主题向量生成单元,用于根据用户对所述预备资源库中的资源的使用情况,生成每个用户的分主题向量;

资源得分计算单元,用于根据每个用户的分主题向量及每个用户使用资源的情况,计算每个资源的得分;

资源提取单元,用于在每一个主题下,根据该主题下的每个资源的得分对资源进行排序,并按照预设的提取比例提取每一个主题下的资源,生成精品资源库。

本发明还提供了一种基于用户使用情况的精品资源图谱构建服务器,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述的基于用户使用情况的精品资源图谱构建方法。

本发明具有以下有益效果:

本发明公开的一种基于用户使用情况的精品资源图谱构建方法及装置,基于用户对资源的使用情况,通过构建精品资源库,并获取用户使用任一个资源后使用相关资源的概率分布,从而获取精品资源库中的资源之间的关联关系,以便当用户的一个搜索请求可能代表多重含义的时候,能够理解这其中的差别,并可以将搜索结果范围缩小到用户最想要的那种含义。通过根据精品资源库中的资源之间的关联关系,按照预设的资源关联规则构建精品资源图谱,将所述精品资源库中的资源进行可视化,能够在确保资源的质量同时帮助用户了解事物之间的关系,及了解某个新的事实或新的联系,促使其进行一系列的全新搜索查询,提高用户体验。

附图说明

为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明第一实施例提供的一种基于用户使用情况的精品资源图谱构建方法的流程图;

图2是本发明第一实施例中的精品资源库中的资源的关联关系示意图;

图3是图1的s101步骤中的构建精品资源库的流程示意图;

图4是图3的s304步骤中以计算“kmp算法视频”资源的得分为例计算每个资源得分的算法示意图;

图5是本发明第二实施例提供的一种基于用户使用情况的精品资源图谱构建装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,图1是本发明第一实施例提供的一种基于用户使用情况的精品资源图谱构建方法的流程图。

本发明的第一实施例提供的一种基于用户使用情况的精品资源图谱构建方法可以由服务器执行,且下文均以服务器作为执行主体为例进行说明,所述基于用户使用情况的精品资源图谱构建方法,至少包括如下步骤:

s101、构建精品资源库;其中,所述精品资源库包括至少一个资源。

在本实施例中,所述精品资源库是基于用户使用情况构建的。可以理解的是,在构建精品资源库之前,需要预先构建了预备资源库,具体的,将搜索引擎、暗网、ugc(usergeneratedcontent,指用户原创内容)等作为构建预备资源库的基石,基于用户使用网络资源的情况,如搜索方式、搜索结果、下载资源、上载资源以及分享资源等,在获得高质量的网络资源的同时,可以获取用户提供的大量高质量资源,从而生成较高质量的资源库,并进一步结合现有资源,如将维基百科、知乎等,形成大数据的预备资源库。

然后通过将预备资源库中的资源进行主题分类,并基于用户的资源使用情况计算每个资源的得分,根据所述资源的得分由高到低或者sr的数值由大到小将每个资源进行排序,并按照预设的提取比例提取每一个主题下的资源,即对每个分主题下的资源进行优先级提取。例如,设置提取比例为a%,则可以通过设置a的值控制每个主题下精品资源的提取比例,从而确保所提取资源的质量,并利用所提取的资源生成精品资源库。

可以理解的是,所述预备资源库包括至少一个资源,则所述精品资源库包括至少一个资源。

s102、根据用户对所述精品资源库中的资源的使用情况,获取用户使用任一个资源后使用相关资源的概率分布。

在本实施例中,基于用户对所述精品资源库中的资源的使用情况,获取用户使用任一个资源后使用相关资源的概率分布。如图2所示,如果用户在使用了“kmp算法视频”资源后又使用了“next数组计算文档”资源,则判断“kmp算法视频”资源与“next数组计算文档”资源具有相关性,所述相关性可以以概率的形式表示,即用户使用了一个资源,使用另一资源的概率。同样的,当用户使用“kmp算法视频”资源时,用户可能使用“next数组计算文档”资源,“暴力算法匹配字符串文档”资源,“字符串匹配文档”资源,“next和newnext文档”资源,“时间复杂度分析视频”资源等,并且用户使用这些相关资源的概率不一定相同,上述情况可以由用户使用任一个资源后使用相关资源的概率分布来表示。

s103、根据所述概率分布,获取精品资源库中的资源之间的关联关系。

在本实施例中,根据所述概率分布,将每个资源的相关资源按照用户使用每个相关资源的概率由大到小进行优先级排序,从而获取精品资源库中的资源之间的关联关系。可以理解的是,所述资源之间的关联关系为每个资源对应该资源的按照优先级排序的相关资源,每一个相关资源对应着该相关资源的按照优先级排序的次相关资源。如图2所示,“next数组计算文档”资源、“暴力算法匹配字符串文档”资源、“字符串匹配文档”资源、“next和newnext文档”资源、“时间复杂度分析视频”资源等为“kmp算法视频”资源的相关资源;“逻辑结构文档”资源、“存储结构文档”资源、“时间复杂度o(mn)分析视频”资源等为“暴力算法匹配字符串文档”资源的次相关资源;“robin-karp算法视频”资源、“boyermoore算法视频”资源、“sunday算法视频”资源、“bitap算法视频”资源等为“时间复杂度分析视频”资源的次相关资源;“mod函数文档”资源为“robin-karp算法视频”资源的三级相关资源;“d函数文档”资源为“boyermoore算法视频”资源的三级相关资源,以此类推。

s104、根据精品资源库中的资源之间的关联关系,按照预设的资源关联规则构建精品资源图谱,以使得当用户访问精品资源库中的资源时,根据所述精品资源图谱推送与所述当前访问资源相关联的资源。

在本实施例中,所述资源之间的关联关系为每个资源对应该资源的按照优先级排序的相关资源,每一个相关资源对应着该相关资源的按照优先级排序的次相关资源;所述资源关联规则为提取每个资源对应该资源的按照优先级排序的前n个相关资源,生成精品资源图谱。

在本实施例中,根据所述精品资源图谱,可以根据用户使用当前资源后使其他相关资源的优先级排序,从所述精品资源图谱中选取前m个资源进行推送给用户。将所述精品资源库中的资源进行可视化,可以将精品资源库中的资源全面展现出来,即使用户的一个搜索请求可能代表多重含义,精品资源图谱也能够解这其中的差别,并可以将搜索结果范围缩小到用户最想要的那种含义。同时,精品资源图谱的可视化也会帮助用户了解事物之间的关系,使得用户往往会获得意想不到的发现。在搜索中,用户可能会了解到某个新的事实或新的联系,促使其进行一系列的全新搜索查询。

优选地,所述根据所述概率分布,获取精品资源库中的资源之间的关联关系,具体为:根据所述概率分布,将每个资源的相关资源进行优先级排序,获取精品资源库中的资源之间的关联关系;其中,所述优先级排序为将每个资源对应的所有相关资源按照用户使用该资源后使用每一个相关资源的概率进行由大到小的排序。

优选地,所述资源之间的关联关系为每个资源对应该资源的按照优先级排序的相关资源,每一个相关资源对应着该相关资源的按照优先级排序的次相关资源;所述资源关联规则为提取每个资源对应该资源的按照优先级排序的前n个相关资源,生成精品资源图谱。

优选地,所述的基于用户使用情况的精品资源图谱构建方法,还包括:

根据所述精品资源图谱,按照预设的推送规则推送与用户当前使用资源相关的资源;所述推送规则为,根据用户使用当前资源后使其他相关资源的优先级排序,从所述精品资源图谱中选取前m个资源进行推送。

优选地,请参阅图3,图3是图1的s101步骤中的构建精品资源库的流程示意图。

在所述构建精品资源库之前,还包括:

s301、构建预备资源库;其中,所述预备资源库包括至少一个资源。

在本实施例中,将搜索引擎、暗网、ugc(usergeneratedcontent,指用户原创内容)等作为构建预备资源库的基石,基于用户使用网络资源的情况,如搜索方式、搜索结果、下载资源、上载资源以及分享资源等,在获得高质量的网络资源的同时,可以获取用户提供的大量高质量资源,从而生成较高质量的资源库,并进一步结合现有资源,如将维基百科、知乎等,形成大数据的预备资源库。可以理解的是,所述预备资源库包括至少一个资源。

s302、对所述预备资源库中的所有资源进行主题分类,以使每一个资源都包含于一个分主题中。

在本实施例中,需要对所述预备资源库中的所有资源进行主题分类。首先,根据服务器默认的主题或者自定义的主题,如计算机、材料、机械等主题,将所述预备资源库中的所有资源都一一归类至相应的主题下。可以理解的是,当对大数据的预备资源库中的所有资源进行主题分类时,在顶级的大分类下有进一步的细致的粒度分类结构,在底层目录下,可以人工收集符合该目录主题的高质量资源,并将资源归入合适的分类主题下。例如,可以通过机器学习对预备资源库中的资源进行聚类后再进行人工归类,从而确保使每一个资源都包含于一个分主题中。

s303、根据用户对所述预备资源库中的资源的使用情况,生成每个用户的分主题向量;

在本实施例中,所述使用情况包括用户对资源的搜索方式、搜索结果,以及搜索次数、下载或上载次数,所述分主题向量由用户使用每个分主题下的资源的次数生成。例如,计算机主题包含若干个资源,材料主题包含若干个资源,机械主题包含若干个资源。用户甲使用计算机主题下的资源总次数为n,使用材料主题下的资源总次数为m,使用机械主题下的资源总次数为l,则可以得出用户甲的分主题向量为[n,m,l]。可以理解的是,n、m和l可以为使用同一个资源的次数,也可以是使用不同资源的次数之和。

需要说明的是,n、m和l包括但不限于对资源的搜索次数、下载次数、上载次数以及分享次数。

将用户的分主题向量记为userrank(ur),如果用户甲的分主题向量为ur=[(计算机:15),(材料:1),(机械:2)],则代表用户甲使用主题为计算机的资源15次,主题为材料的资源1次,主题为机械的资源2次。ur值即代表了用户对每个主题中资源的使用权重。

s304、根据每个用户的分主题向量及每个用户使用资源的情况,计算每个资源的得分;

在本实施例中,基于每个用户使用资源的情况和每个用户的分主题向量,计算每个资源的得分。如图4所示,当计算“kmp算法视频”资源的得分时,首先判断出“kmp算法视频”资源归类于计算机分主题下;查询使用“kmp算法视频”资源的用户有哪些,假设使用“kmp算法视频”资源的用户为用户甲、用户乙、用户丙和用户丁;其中,

所述用户甲的分主题向量为ur甲=[(计算机:a),(材料:a1),(机械:a2)];

所述用户乙的分主题向量为ur乙=[(计算机:b),(材料:b1),(机械:b2)];

所述用户丙的分主题向量为ur丙=[(计算机:c),(材料:c1),(机械:c2)];

所述用户丁的分主题向量为ur丁=[(计算机:d),(材料:d1),(机械:d2)];

基于每个用户使用资源的情况和每个用户的分主题向量,提取每个用户在每个分主题上的分量值;将与每一个资源对应的所有使用该资源的用户在该资源对应的分主题上的分量值求和,得到该资源的得分。

使用“kmp算法视频”资源的用户为用户甲、用户乙、用户丙和用户丁,则根据上述用户的分主题向量,提取“kmp算法视频”资源对应的用户甲在计算机分主题上的分量值记为ur甲(a);

用户乙在计算机分主题上的分量值记为ur乙(b);

用户丙在计算机分主题上的分量值记为ur丙(c);

用户丁在计算机分主题上的分量值记为ur丁(d);

那么,求和得到的“kmp算法视频”资源的得分,记为:

sr(kmp算法视频)=ur甲(a)+ur乙(b)+ur丙(c)+ur丁(d)。

s305、在每一个主题下,根据该主题下的每个资源的得分对资源进行排序,并按照预设的提取比例提取每一个主题下的资源,生成精品资源库。

在本实施例中,所述资源的得分sr为量化的数值,根据所述资源的得分由高到低或者sr的数值由大到小将每个资源进行排序,并按照预设的提取比例提取每一个主题下的资源,即对每个分主题下的资源进行优先级提取。例如,设置提取比例为a%,则可以通过设置a的值控制每个主题下精品资源的提取比例,从而确保所提取资源的质量,并利用所提取的资源生成精品资源库。

优选地,所述根据每个用户的分主题向量及每个用户使用资源的情况,计算每个资源的得分,具体为:

根据每个用户的分主题向量,提取每个用户在每个分主题上的分量值;

将与每一个资源对应的所有使用该资源的用户在该资源对应的分主题上的分量值求和,得到该资源的得分。

优选地,所述使用情况包括用户对资源的搜索方式、搜索结果,以及搜索次数、下载或上载次数。

本实施例提供的一种基于用户使用情况的精品资源图谱构建方法,基于用户对资源的使用情况,通过构建精品资源库,并获取用户使用任一个资源后使用相关资源的概率分布,从而获取精品资源库中的资源之间的关联关系,以便当用户的一个搜索请求可能代表多重含义的时候,能够理解这其中的差别,并可以将搜索结果范围缩小到用户最想要的那种含义。通过根据精品资源库中的资源之间的关联关系,按照预设的资源关联规则构建精品资源图谱,将所述精品资源库中的资源进行可视化,能够在确保资源的质量同时帮助用户了解事物之间的关系,及了解某个新的事实或新的联系,促使其进行一系列的全新搜索查询。同时,所述精品资源库能够为用户提供更加准确的资源,并提供更有深度相关的资源,提高用户体验感以及用户使用该精品资源库的意向。

请参阅图5,图5是本发明第二实施例提供的一种基于用户使用情况的精品资源图谱构建装置的结构示意图。

所述基于用户使用情况的精品资源图谱构建装置,包括:

精品资源库构建单元501,用于构建精品资源库;其中,所述精品资源库包括至少一个资源;

资源使用概率获取单元502,用于根据用户对所述精品资源库中的资源的使用情况,获取用户使用任一个资源后使用相关资源的概率分布;

资源关联关系获取单元503,用于根据所述概率分布,获取精品资源库中的资源之间的关联关系;

精品资源图谱构建单元504,用于根据精品资源库中的资源之间的关联关系,按照预设的资源关联规则构建精品资源图谱,以使得当用户访问精品资源库中的资源时,根据所述精品资源图谱推送与所述当前访问资源相关联的资源。

优选地,所述的基于用户使用情况的精品资源图谱构建装置,其特征在于,还包括:

预备资源库构建单元505,用于构建预备资源库;其中,所述预备资源库包括至少一个资源;

主题分类单元506,用于对所述预备资源库中的所有资源进行主题分类,以使每一个资源都包含于一个分主题中;

分主题向量生成单元507,用于根据用户对所述预备资源库中的资源的使用情况,生成每个用户的分主题向量;

资源得分计算单元508,用于根据每个用户的分主题向量及每个用户使用资源的情况,计算每个资源的得分;

资源提取单元509,用于在每一个主题下,根据该主题下的每个资源的得分对资源进行排序,并按照预设的提取比例提取每一个主题下的资源,生成精品资源库。

本实施例提供的一种基于用户使用情况的精品资源图谱构建装置,基于用户对资源的使用情况,通过精品资源库构建单元501构建精品资源库,并通过资源使用概率获取单元502获取用户使用任一个资源后使用相关资源的概率分布,从而由资源关联关系获取单元503获取精品资源库中的资源之间的关联关系,以便当用户的一个搜索请求可能代表多重含义的时候,能够理解这其中的差别,并可以将搜索结果范围缩小到用户最想要的那种含义。通过精品资源图谱构建单元504根据精品资源库中的资源之间的关联关系,按照预设的资源关联规则构建精品资源图谱,并通过将所述精品资源库中的资源进行可视化,能够在确保资源的质量同时帮助用户了解事物之间的关系,及了解某个新的事实或新的联系,促使其进行一系列的全新搜索查询。同时,所述精品资源库能够为用户提供更加准确的资源,并提供更有深度相关的资源,提高用户体验感以及用户使用该精品资源库的意向。

本发明还提供了一种基于用户使用情况的精品资源图谱构建服务器,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述的基于用户使用情况的精品资源图谱构建方法。

以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1