一种职业能力大数据知识图谱数据访问管理方法及系统与流程

文档序号:30213419发布日期:2022-05-31 12:47阅读:200来源:国知局
一种职业能力大数据知识图谱数据访问管理方法及系统与流程

1.本发明涉及数据访问管理领域,尤其是一种职业能力大数据知识图谱数据访问管理方法及系统。


背景技术:

2.知识图谱(knowledge graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
3.职业能力大数据知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合;将社会则数据,如职业、行业、技能等级、职业能力;学校侧数据,如教学、专业、学历、技能等,进行综合链接,形成形象化的图谱数据。
4.职业能力大数据知识图谱的整理需要花费巨大的工作量,并且学校的职业能力大数据知识图谱涉及学生信息等隐私信息,不宜公开。因此通常职业能力大数据知识图谱对内网用户是开放的,如学校的学生、教学接入到校园网后可以自由地访问学校的职业能力大数据知识图谱数据。
5.为了防止内网资源被滥用,以及隐私、信息安全方面的考虑,外网用户通常不能直接访问内网,因此外网用户一般不能访问到内网的职业能力大数据知识图谱数据。为了满足内网外的用户能够访问内网的资料,机构通常会给成员提供vpn账号等。如果这些账号被盗用,内网珍贵的职业能力大数据知识图谱数据将被非法用户非法访问,给学校和学生造成损失。


技术实现要素:

6.为了防止用户的内网访问账号被盗用,导致内网的职业能力大数据知识图谱数据被外部非法访问,本发明提出一种职业能力大数据知识图谱数据访问管理方法及系统。
7.根据本发明的一个方面,提供一种职业能力大数据知识图谱数据访问管理方法,包括如下步骤:服务器接收用户从内网对职业能力大数据知识图谱数据的访问请求;服务器记录内网访问的用户标识以及叶子节点,形成内网访问数据库;服务器处理所述内网访问数据库,对每个叶子节点获取其父节点中的n级节点,其中n为正整数,记录出现次数排名在前预设值数量的n级节点;服务器接收用户从外网对职业能力大数据知识图谱数据的访问请求,服务器确定该用户本次从外网访问的叶子节点;判断所述外网访问的叶子节点是否落入所述n级节点领域范围内;当所述外网访问的叶子节点没有落入所述n级节点领域范围内时,服务器判定用户账号出现异常,终止该用户对职业能力大数据知识图谱的访问。
8.进一步地,服务器记录内网访问的用户标识以及叶子节点时还记录在叶子节点的停留时间,只保留停留时间大于预设时间的叶子节点。
9.进一步地,每次用户在内网访问职业能力大数据知识图谱时都重新计算出现次数
排名在前预设值数量的n级节点。
10.进一步地,当认定用户账户出现异常时,对用户进行二次认证;所述二次认证为:人脸识别、短信认证、问答认证中的一项或多项。
11.进一步地,服务器确定该用户本次从外网访问的叶子节点时还记录在叶子节点的停留时间,只保留停留时间大于预设时间的叶子节点。
12.根据本发明的另一方面,提供一种职业能力大数据知识图谱数据访问管理系统,包括如下模块:内网访问接收模块,接收用户从内网对职业能力大数据知识图谱数据的访问请求;数据记录模块,记录内网访问的用户标识以及叶子节点,形成内网访问数据库;处理模块,处理所述内网访问数据库,对每个叶子节点获取其父节点中的n级节点,其中n为正整数,记录出现次数排名在前预设值数量的n级节点;外网访问接收模块,接收用户从外网对职业能力大数据知识图谱数据的访问请求,服务器确定该用户本次从外网访问的叶子节点;判断模块,判断所述外网访问的叶子节点是否落入所述n级节点领域范围内;判决模块,当所述外网访问的叶子节点没有落入所述n级节点领域范围内时,服务器判定用户账号出现异常,终止该用户对职业能力大数据知识图谱的访问。
13.进一步地,所述数据记录模块记录内网访问的用户标识以及叶子节点时还记录在叶子节点的停留时间,只保留停留时间大于预设时间的叶子节点。
14.进一步地,还包括更新模块,用于每次用户在内网访问职业能力大数据知识图谱时都重新计算出现次数排名在前预设值数量的n级节点。
15.进一步地,还包括二次谁模块,用于当认定用户账户出现异常时,对用户进行二次认证;所述二次认证为:人脸识别、短信认证、问答认证中的一项或多项。
16.进一步地,还包括更新模块,用于服务器确定该用户本次从外网访问的叶子节点时还记录在叶子节点的停留时间,只保留停留时间大于预设时间的叶子节点。
17.本发明提供的技术方案中,通过收集用户在内网经常访问的领域,确定了用户的习惯,当用户从外网访问时,如果不符合用户在内网经常访问的领域,则不符合用户的习惯,其账号存在泄露风险,进而阻止外部的非法访问,减少机构的损失。
附图说明
18.图1,为本技术的职业能力大数据知识图谱示意图。
具体实施方式
19.现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
20.除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
21.一方面本技术公开了一种职业能力大数据知识图谱数据访问管理方法,包括如下
步骤。
22.首先,服务器接收用户从内网对职业能力大数据知识图谱数据的访问请求;服务器记录内网访问的用户标识以及叶子节点,形成内网访问数据库。
23.职业能力大数据知识图谱体现了知识及各种知识之间的联系,如图1所示,为本技术职业能力大数据知识图谱的简单示意图,其中如学生、教学分别表示了两种大的领域,圆圈的大小代表了相应知识的多少,同时大领域下还可以细分很多小领域,如学生下面的it技术、波等,相应的细分领域中知识较少,圆圈也就较小;另外,各种知识之间是有相互联系的,对于有交叉联系的领域通过直线连接;对于任何一种知识,当用户点击相应的圆圈,图谱会相应地放大,并显示相关的细分领域,对于任何一个圆圈用户还可以想看相关知识的详细情况,如重要论文、领域发展时间轴、领域百科、相关考试资料、相关教学内容等等详细信息。
24.服务器可以是职业能力大数据知识图谱服务器,也可以是单独的服务器,当服务器为非职业能力大数据知识图谱服务器时,服务器可以看成是访问代理,将用户的访问请求转发至职业能力大数据知识图谱服务器并将响应返回至用户。
25.内网通常指没有接入到互联网的局域网,如学校的校园网、企业的内部企业网等,而外网通常是与内网相对的概念,如对于学校a而言,学校a的内部局域网可以称为内网,学校之外的网络可以称之为外网。
26.用户是指对职业能力大数据知识图谱进行访问的用户,并且具有相应的服务标识,如注册账号、用户id、学号等等,只要是可以表示唯一用户的即可。
27.当用户访问职业能力大数据知识图谱时服务器通过日志等方式记录下相应的用户标识,以及访问的具体内容,包括:本次访问的叶子节点,当然还可以记录停留时间等其它相关内容。示例性地,用户a通过内网访问了职业能力大数据知识图谱,并依次点开学生——专业课程——it技术节点,并在it技术节点停留5分钟,虽然it技术下还有html、java节点,但本次访问从学生开始至it技术节点结束,可以看成是一棵树,学生为树根,it技术节点即为本次访问的叶子节点;另外,当用户退出it技术节点,又依次访问学生——会计,由于会计和专业课程是两个分支,那么又记录下会计叶子节点及停留时间。
28.进一步地,服务器记录内网访问的用户标识以及叶子节点时还记录在叶子节点的停留时间,只保留停留时间大于预设时间的叶子节点。
29.由于用户可能只是想找一部分知识信息,当点开节点后发现不是自己需要的信息,就会很快退出,因此停留时间过短的访问是没有太大意义的,为了减少误差,只保留停留时间大于预设时间的叶子节点,从而将停留时间过短的节点去掉。
30.在记录了大量用户的访问记录后,即形成了内网访问的数据库,当然为了后续处理的准确性,内网访问数据库需要一定的预设规模,例如每个用户至少记录100次访问记录。
31.服务器处理所述内网访问数据库,对每个叶子节点获取其父节点中的n级节点,其中n为正整数,记录出现次数排名在前预设值数量的n级节点。
32.由于职业能力大数据知识图谱是树状划分的,因此没有父节点的为根节点,也就是一级节点,如图1中的,学生、教学属于1级节点,而1级节点下的属于2级节点,如图1中的会计、职业技能等属于2级节点,以此类推。
33.确定n级节点是为了确定用户经常访问的领域,很显然n设置越大,领域越小,n设置越小领域越大,如n取1时,当用户经常访问编程内容时,往上查找其父节点,学生就是其经常访问的领域,当n取2时,当用户经常访问编程内容时it技术就是其经常访问的领域。由于用户可能访问多个领域,因此将出现次数排名在前预设个数的n级节点作为用户的经常访问领域,如用n取2,并用用户访问最多的是会计和专业课程,则会计和专业课程是用户最经常访问的领域。
34.当然还可能出现叶子节点已经在n级以上的问题,此时可直接将该叶子节点设置为n级节点,例如当叶子节点为it技术,n取3时,直接将it技术作为此时的n级节点。
35.进一步地,为了更新用户的数据,每次用户在内网访问职业能力大数据知识图谱时都重新计算出现次数排名在前预设值数量的n级节点。
36.服务器接收用户从外网对职业能力大数据知识图谱数据的访问请求,服务器确定该用户本次从外网访问的叶子节点。
37.当服务器为代理服务器时,代理服务器可以很容易分辨用户是从内网访问还是从外网访问,当服务器为职业能力大数据知识图谱服务器时,可以在代理服务器转发请求时设置特殊的标识以识别用户是从外网访问的;具体现实均可以由现有技术实现,本发明不做过多限定。
38.当用户从外网访问时,记录本次访问的叶子节点,叶子节点的确认方法与前述内网访问时的确定方法相似,这里不再赘述。
39.类似地,服务器还可以记录用户在叶子节点的停留时间,只保留停留时间大于预设时间的叶子节点。
40.判断所述外网访问的叶子节点是否落入所述n级节点领域范围内。
41.示例性地,当外网访问的叶子节点为图1中所示的html、java,预设个数的n级节点为会计、it技术时,html、java落入it技术的范围,此时外网访问的叶子节点落入预设个数的n级节点领域范围内。
42.示例性地,当外网访问的叶子节点为图1中所示的动物,预设个数的n级节点为会计、it技术时,动物没有落入会计、it技术的范围,此时外网访问的叶子节点没有落入预设个数的n级节点领域范围内。
43.当所述外网访问的叶子节点没有落入所述n级节点领域范围内时,服务器判定用户账号出现异常,终止该用户对职业能力大数据知识图谱的访问。
44.当用户从内网访问时,访问人在校内可以看成是正常的用户。并且由于用户如学生、教学等都有相关的专业,其访问的领域一般比较集中。当用户在外网访问时,如果用户依然集中在这些领域访问,那么账号出现异常的可能性比较低。如果在外网访问时出了与内网不同领域的访问,那么账号可能正在被他人使用,此时极大可能出现账号泄露问题,为了阻止非法访问此时应该及时终止该用户对职业能力大数据知识图谱的访问。
45.进一步地,当认定用户账户出现异常时,对用户进行二次认证;所述二次认证为:人脸识别、短信认证、问答认证中的一项或多项。
46.另一方面,本技术公开了一种职业能力大数据知识图谱数据访问管理系统,包括如下模块。
47.内网访问接收模块,接收用户从内网对职业能力大数据知识图谱数据的访问请
求;数据记录模块,记录内网访问的用户标识以及叶子节点,形成内网访问数据库。
48.职业能力大数据知识图谱体现了知识及各种知识之间的联系,如图1所示,为本技术职业能力大数据知识图谱的简单示意图,其中如学生、教学分别表示了两种大的领域,圆圈的大小代表了相应知识的多少,同时大领域下还可以细分很多小领域,如学生下面的it技术、会计等,相应的细分领域中知识较少,圆圈也就较小;另外,各种知识之间是有相互联系的,对于有交叉联系的领域通过直线连接;对于任何一种知识,当用户点击相应的圆圈,图谱会相应地放大,并显示相关的细分领域,对于任何一个圆圈用户还可以想看相关知识的详细情况,如重要论文、领域发展时间轴、领域百科、相关考试资料、相关教学内容等等详细信息。
49.服务器可以是职业能力大数据知识图谱服务器,也可以是单独的服务器,当服务器为非职业能力大数据知识图谱服务器时,服务器可以看成是访问代理,将用户的访问请求转发至职业能力大数据知识图谱服务器并将响应返回至用户。
50.内网通常指没有接入到互联网的局域网,如学校的校园网、企业的内部企业网等,而外网通常是与内网相对的概念,如对于学校a而言,学校a的内部局域网可以称为内网,学校之外的网络可以称之为外网。
51.用户是指对职业能力大数据知识图谱进行访问的用户,并且具有相应的服务标识,如注册账号、用户id、学号等等,只要是可以表示唯一用户的即可。
52.当用户访问职业能力大数据知识图谱时服务器通过日志等方式记录下相应的用户标识,以及访问的具体内容,包括:本次访问的叶子节点,当然还可以记录停留时间等其它相关内容。示例性地,用户a通过内网访问了职业能力大数据知识图谱,并依次点开学生——it技术——编程节点,并在编程节点停留5分钟,虽然编程下还有html、java节点,但本次访问从学生开始至编程节点结束,可以看成是一棵树,学生为树根,编程节点即为本次访问的叶子节点;另外,当用户退出编程节点,又依次访问学生——会计,由于会计和it技术是两个分支,那么又记录下会计叶子节点及停留时间。
53.进一步地,所述数据记录模块记录内网访问的用户标识以及叶子节点时还记录在叶子节点的停留时间,只保留停留时间大于预设时间的叶子节点。
54.由于用户可能只是想找一部分知识信息,当点开节点后发现不是自己需要的信息,就会很快退出,因此停留时间过短的访问是没有太大意义的,为了减少误差,只保留停留时间大于预设时间的叶子节点,从而将停留时间过短的节点去掉。
55.在记录了大量用户的访问记录后,即形成了内网访问的数据库,当然为了后续处理的准确性,内网访问数据库需要一定的预设规模,例如每个用户至少记录100次访问记录。
56.处理模块,处理所述内网访问数据库,对每个叶子节点获取其父节点中的n级节点,其中n为正整数,记录出现次数排名在前预设值数量的n级节点。
57.由于职业能力大数据知识图谱是树状划分的,因此没有父节点的为根节点,也就是一级节点,如图1中的,学生、教学属于1级节点,而1级节点下的属于2级节点,如图1中的it技术、会计等属于2级节点,以此类推。
58.确定n级节点是为了确定用户经常访问的领域,很显然n设置越大,领域越小,n设
置越小领域越大,如n取1时,当用户经常访问编程内容时,往上查找其父节点,学生就是其经常访问的领域,当n取2时,当用户经常访问编程内容时it技术就是其经常访问的领域。由于用户可能访问多个领域,因此将出现次数排名在前预设个数的n级节点作为用户的经常访问领域,如用n取2,并用用户访问最多的时会计和it技术,则会计和it技术是用户最经常访问的领域。
59.当然还可能出现叶子节点已经在n级以上的问题,此时可直接将该叶子节点设置为n级节点,例如当叶子节点为it技术,n取3时,直接将it技术作为此时的n级节点。
60.进一步地,还可以包括更新模块,用于每次用户在内网访问职业能力大数据知识图谱时都重新计算出现次数排名在前预设值数量的n级节点。
61.外网访问接收模块,接收用户从外网对职业能力大数据知识图谱数据的访问请求,服务器确定该用户本次从外网访问的叶子节点。
62.当服务器为代理服务器时,代理服务器可以很容易分辨用户是从内网访问还是从外网访问,当服务器为职业能力大数据知识图谱服务器时,可以在代理服务器转发请求时设置特殊的标识以识别用户是从外网访问的;具体现实均可以由现有技术实现,本发明不做过多限定。
63.当用户从外网访问时,记录本次访问的叶子节点,叶子节点的确认方法与前述内网访问时的确定方法相似,这里不再赘述。
64.类似地,服务器还可以记录用户在叶子节点的停留时间,只保留停留时间大于预设时间的叶子节点。
65.判断模块,判断所述外网访问的叶子节点是否落入所述n级节点领域范围内。
66.示例性地,当外网访问的叶子节点为图1中所示的html、java,预设个数的n级节点为会计、it技术时,html、java落入it技术的范围,此时外网访问的叶子节点落入预设个数的n级节点领域范围内。
67.示例性地,当外网访问的叶子节点为图1中所示的动物,预设个数的n级节点为会计、it技术时,动物没有落入会计、it技术的范围,此时外网访问的叶子节点没有落入预设个数的n级节点领域范围内。
68.判决模块,当所述外网访问的叶子节点没有落入所述n级节点领域范围内时,服务器判定用户账号出现异常,终止该用户对职业能力大数据知识图谱的访问。
69.当用户从内网访问时,访问人在校内可以看成是正常的用户。并且由于用户如学生、教学等都有相关的专业,其访问的领域一般比较集中。当用户在外网访问时,如果用户依然集中在这些领域访问,那么账号出现异常的可能性比较低。如果在外网访问时出了与内网不同领域的访问,那么账号可能正在被他人使用,此时极大可能出现账号泄露问题,为了阻止非法访问此时应该及时终止该用户对职业能力大数据知识图谱的访问。
70.进一步地,还包括二次谁模块,用于当认定用户账户出现异常时,对用户进行二次认证;所述二次认证为:人脸识别、短信认证、问答认证中的一项或多项。
71.在上述方案上,由于源ip为运营商占用的ip,伪造的难度较大,同时还使用了位置信息,同时伪造位置信息和ip信息的难道也较大,因此该方法的安全性是有保证的。
72.在本技术中,术语
“ꢀ
多个”则指两个或两个以上,除非另有明确的限定。术语
“ꢀ
安装”、
“ꢀ
相连”、
“ꢀ
连接”、
“ꢀ
固定”等术语均应做广义理解,例如,
“ꢀ
连接”可以是固定连接,也
可以是可拆卸连接,或一体地连接;
“ꢀ
相连”可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本技术中的具体含义。
73.在本说明书的描述中,术语
“ꢀ
一个实施例”、
“ꢀ
一些实施例”、
“ꢀ
具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
74.以上仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1