SparQL查询语句的预测方法和装置与流程

文档序号:22387460发布日期:2020-09-29 17:50阅读:来源:国知局

技术特征:

1.一种sparql查询语句的预测方法,其特征在于,包括:

获取用户在历史时刻使用过的至少一个sparql查询语句;

对每一sparql查询语句对应的图模式序列的每一组成部分进行独热编码,形成该sparql查询语句的特征向量;其中,所述组成部分包括以下至少一种:资源描述框架rdf三元组、三元组之间的运算符、用于确定三元组之间嵌套关系的左右括号;以及

将每一sparql查询语句的特征向量按照预设时间顺序输入预先训练完成的seq2seq模型,得到作为预测结果的目标查询语句;将目标查询语句的查询结果数据缓存。

2.根据权利要求1所述的方法,其特征在于,对每一sparql查询语句对应的图模式序列的每一组成部分进行独热编码,包括:

按照所述组成部分的排列顺序将每一组成部分转换为相同维度的独热编码。

3.根据权利要求2所述的方法,其特征在于,对任一rdf三元组进行独热编码,包括:

获取该rdf三元组所在的图模式序列中含有的常量总数和变量总数之间的最大值;其中,常量包括rdf三元组中的国际化资源标识符iri以及字面量;

基于该最大值对该rdf三元组中主语部分、谓语部分或宾语部分的每一常量进行独热编码;基于该最大值对该rdf三元组中主语部分、谓语部分或宾语部分的每一变量进行独热编码。

4.根据权利要求3所述的方法,其特征在于,所述运算符包括以下至少一种:and运算符、union运算符、optional运算符;以及,对任一图模式序列中的任一运算符、所述左右括号中的左括号或者所述左右括号中的右括号进行独热编码,包括:

统计该图模式序列中运算符、左括号和右括号的类别总数;

基于该类别总数为任一运算符、左括号或右括号进行独热编码。

5.根据权利要求4所述的方法,其特征在于,每一图模式序列的每一组成部分的独热编码包括三元组部分和组外部分,每一图模式序列的每一组成部分的独热编码包括:处于组外部分的第一特定位和第二特定位、以及处于三元组部分的常量变量标志位;其中,

第一特定位用于标识该组成部分是否为rdf三元组;

第二特定位用于标识该组成部分是否为该图模式序列的最后一个组成部分;

常量变量标志位用于标识rdf三元组的主语部分、谓语部分或宾语部分是常量还是变量。

6.根据权利要求1-5任一所述的方法,其特征在于,所述seq2seq模型通过以下步骤进行训练:

获取用户在历史时刻使用过的、按照时间先后顺序排列的多个sparql查询语句,将其中在前的一部分sparql查询语句作为训练数据,将其余sparql查询语句作为标签数据;

将所述多个sparql查询语句中的每一sparql查询语句转换为特征向量;以及

将训练数据的特征向量输入seq2seq模型的编码器部分、将标签数据的特征向量输入seq2seq模型的解码器部分,从而对seq2seq模型进行训练。

7.一种sparql查询语句的预测装置,其特征在于,包括:

获取单元,用于获取用户在历史时刻使用过的至少一个sparql查询语句;

编码单元,用于对每一sparql查询语句对应的图模式序列的每一组成部分进行独热编码,形成该sparql查询语句的特征向量;其中,所述组成部分包括以下至少一种:资源描述框架rdf三元组、三元组之间的运算符、用于确定三元组之间嵌套关系的左右括号;以及

预测单元,用于将每一sparql查询语句的特征向量按照预设时间顺序输入预先训练完成的seq2seq模型,得到作为预测结果的目标查询语句;将目标查询语句的查询结果数据缓存。

8.根据权利要求7所述的装置,其特征在于,编码单元进一步用于:

按照所述组成部分的排列顺序将每一组成部分转换为相同维度的独热编码。

9.一种电子设备,其特征在于,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。


技术总结
本发明公开一种SparQL查询语句的预测方法和装置,涉及计算机技术领域,该方法的一个实施方式包括:获取用户在历史时刻使用过的至少一个SparQL查询语句;对每一SparQL查询语句对应的图模式序列的每一组成部分进行独热编码,形成该SparQL查询语句的特征向量;其中,所述组成部分包括以下至少一种:资源描述框架RDF三元组、三元组之间的运算符、用于确定三元组之间嵌套关系的左右括号;将每一SparQL查询语句的特征向量按照预设时间顺序输入预先训练完成的Seq2Seq模型,得到作为预测结果的目标查询语句;将目标查询语句的查询结果数据缓存。该实施方式能够提高SparQL查询语句预测的准确性。

技术研发人员:王宏志;邹开发;郑博;梁栋;齐志鑫
受保护的技术使用者:北京松鼠山科技有限公司
技术研发日:2020.06.24
技术公布日:2020.09.29
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1