1.本发明涉及人工智能技术领域,特别是涉及以基于知识图谱与大数据的时空人工智能专家系统和机器人。
背景技术:2.在实现本发明过程中,发明人发现现有技术中至少存在如下问题:如果是从互联网爬取的知识,不经过人工整理,直接自动提取进知识图谱,会导致知识图谱的质量低下,错漏百出。如果从互联网爬取知识,再经过人工整理进知识图谱,同样存在人工成本高的问题。不管是否经过整理,从互联网爬取知识还存在一个致命的问题,爬取时需要提供关键词,爬取时所使用的关键词无法全覆盖用户提问时的问题中涉及到的关键词,也就会导致用户提的问题在知识图谱中找不到答案。如果只是收录一个或少数几个专家的知识,例如从一个或少数几个专家的专著中整理出知识构建知识图谱,会导致知识的匮乏,因为专家也无法考虑的面面俱到,专家的知识往往无法全覆盖用户提问时的问题中涉及到的关键词,也就会导致用户提的问题在知识图谱中找不到答案。
3.因此,现有技术还有待于改进和发展。
技术实现要素:4.基于此,有必要针对现有技术的缺陷或不足,提供以基于知识图谱与大数据的时空人工智能专家系统和机器人,提高问答专家系统的回答水平和回答范围。
5.第一方面,本发明实施例提供一种人工智能方法,所述方法包括:
6.时空范围确定步骤:获取专家系统的时空性范围,时空性范围包括时空性范围关键词;
7.知识图谱构建获取步骤:获取专家提供的知识集;或从专家的专著的文本中获取知识集;或从互联网通过时空性范围关键词搜索并爬取得到相关度高的预设个数据,作为知识集;基于所述知识集构建知识图谱;
8.用户问题获取步骤:获取用户的问题;
9.用户问题解析步骤:通过深度学习模型识别问题中的实体或/和关系、答案类型所组成的逻辑表达式;
10.知识图谱查询步骤:根据所述逻辑表达式生成查询语句;根据所述查询语句在知识图谱中进行查询得到知识图谱的答案;
11.知识图谱反馈步骤:若知识图谱的所述答案不为空,则将知识图谱的所述答案反馈给用户,执行或不执行大数据搜索步骤;若知识图谱的所述答案为空,则执行大数据搜索步骤;
12.搜索语句第一组合步骤:根据用户输入的关键词和所述时空性的范围关键词组合成搜索的第一输入;
13.大数据第一搜索步骤:通过所述搜索的第一输入,在一个或多个大数据引擎中进
行搜索,从得到的搜索结果中选取相关度大的前预设条搜索结果作为第一搜索结果反馈给用户。
14.优选地,所述方法还包括:
15.时空性范围关键词包括时间范围关键词、空间范围关键词、内容范围关键词;
16.时间范围关键词提取步骤:按照时间范围尺度的大小按照从大到小对时间范围关键词进行排序,得到时间关键词序列;
17.空间范围关键词提取步骤:按照空间范围尺度的大小按照从小范围到大范围对空间范围关键词进行排序,得到空间关键词序列;
18.内容范围关键词提取步骤:按照内容范围的大小按照从大范围到小范围对内容范围关键词进行排序,得到内容关键词序列。
19.优选地,所述方法还包括:
20.用户特征获取步骤:获取与问题范围相关的用户特征关键词;
21.搜索语句第二组合步骤:根据用户输入的关键词和所述时空性的范围关键词、用户特征关键词组合成搜索的第二输入;
22.大数据第二搜索步骤:通过所述搜索的输入,在一个或多个大数据引擎中进行搜索,得到的搜索结果中选取相关度大的前预设条搜索结果作为第二搜索结果反馈给用户。
23.优选地,所述方法还包括:
24.空间特征获取步骤:获取与问题范围相关的空间特征关键词;所述空间特征为所述空间范围的特征;
25.时间特征获取步骤:获取与问题范围相关的时间特征关键词;所述时间特征为所述时间范围的特征;
26.内容特征获取步骤:获取与问题范围相关的内容特征关键词;所述内容特征为所述内容范围的特征;
27.搜索语句第三组合步骤:根据用户输入的关键词和所述时空性的范围关键词、时空性的特征关键词组合成搜索的第三输入;
28.大数据第三搜索步骤:通过所述搜索的输入,在一个或多个大数据引擎中进行搜索,得到的搜索结果中选取相关度大的前预设条搜索结果作为第三搜索结果反馈给用户。
29.第二方面,本发明实施例提供一种人工智能系统,所述系统包括:
30.时空范围确定模块:获取专家系统的时空性范围,时空性范围包括时空性范围关键词;
31.知识图谱构建获取模块:获取专家提供的知识集;或从专家的专著的文本中获取知识集;或从互联网通过时空性范围关键词搜索并爬取得到相关度高的预设个数据,作为知识集;基于所述知识集构建知识图谱;
32.用户问题获取模块:获取用户的问题;
33.用户问题解析模块:通过深度学习模型识别问题中的实体或/和关系、答案类型所组成的逻辑表达式;
34.知识图谱查询模块:根据所述逻辑表达式生成查询语句;根据所述查询语句在知识图谱中进行查询得到知识图谱的答案;
35.知识图谱反馈模块:若知识图谱的所述答案不为空,则将知识图谱的所述答案反
馈给用户,执行或不执行大数据搜索模块;若知识图谱的所述答案为空,则执行大数据搜索模块;
36.搜索语句第一组合模块:根据用户输入的关键词和所述时空性的范围关键词组合成搜索的第一输入;
37.大数据第一搜索模块:通过所述搜索的第一输入,在一个或多个大数据引擎中进行搜索,从得到的搜索结果中选取相关度大的前预设条搜索结果作为第一搜索结果反馈给用户。
38.优选地,所述系统还包括:
39.时空性范围关键词包括时间范围关键词、空间范围关键词、内容范围关键词;
40.时间范围关键词提取模块:按照时间范围尺度的大小按照从大到小对时间范围关键词进行排序,得到时间关键词序列;
41.空间范围关键词提取模块:按照空间范围尺度的大小按照从小范围到大范围对空间范围关键词进行排序,得到空间关键词序列;
42.内容范围关键词提取模块:按照内容范围的大小按照从大范围到小范围对内容范围关键词进行排序,得到内容关键词序列。
43.优选地,所述系统还包括:
44.用户特征获取模块:获取与问题范围相关的用户特征关键词;
45.搜索语句第二组合模块:根据用户输入的关键词和所述时空性的范围关键词、用户特征关键词组合成搜索的第二输入;
46.大数据第二搜索模块:通过所述搜索的输入,在一个或多个大数据引擎中进行搜索,得到的搜索结果中选取相关度大的前预设条搜索结果作为第二搜索结果反馈给用户。
47.优选地,所述系统还包括:
48.空间特征获取模块:获取与问题范围相关的空间特征关键词;所述空间特征为所述空间范围的特征;
49.时间特征获取模块:获取与问题范围相关的时间特征关键词;所述时间特征为所述时间范围的特征;
50.内容特征获取模块:获取与问题范围相关的内容特征关键词;所述内容特征为所述内容范围的特征;
51.搜索语句第三组合模块:根据用户输入的关键词和所述时空性的范围关键词、时空性的特征关键词组合成搜索的第三输入;
52.大数据第三搜索模块:通过所述搜索的输入,在一个或多个大数据引擎中进行搜索,得到的搜索结果中选取相关度大的前预设条搜索结果作为第三搜索结果反馈给用户。
53.第三方面,本发明实施例提供一种人工智能装置,所述装置包括第二方面实施例任意一项所述装置的模块。
54.第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现第一方面实施例任意一项所述方法的步骤。
55.第五方面,本发明实施例提供一种机器人,包括存储器、处理器及存储在存储器上并可在处理器上运行的人工智能机器人程序,所述处理器执行所述程序时实现第一方面实施例任意一项所述方法的步骤。
56.本实施例提供的基于知识图谱与大数据的时空人工智能专家系统和机器人,包括:时空范围确定步骤;知识图谱构建获取步骤;用户问题获取步骤;用户问题解析步骤;知识图谱查询步骤;知识图谱反馈步骤;搜索语句第一组合步骤;大数据第一搜索步骤。上述方法、系统和机器人,通过大数据基本能全覆盖用户提问所涉及到的关键词的特点,将知识图谱的问答质量高和大数据搜索覆盖范围广的优势结合,克服传统知识图谱回答范围窄、很多问题无法回答的缺点,提高问答专家系统的回答水平和回答范围。
附图说明
57.图1为本发明的实施例提供的人工智能方法的流程图;
58.图2为本发明的实施例提供的人工智能方法的流程图;
59.图3为本发明的实施例提供的人工智能方法的流程图;
60.图4为本发明的实施例提供的人工智能方法的示意图。
具体实施方式
61.下面结合本发明实施方式,对本发明实施例中的技术方案进行详细地描述。
62.本发明的基本实施例
63.本发明实施例提供一种人工智能方法,如图1所示,所述方法包括:时空范围确定步骤;知识图谱构建获取步骤;用户问题获取步骤;用户问题解析步骤;知识图谱查询步骤;知识图谱反馈步骤;搜索语句第一组合步骤;大数据第一搜索步骤。技术效果:所述方法通过时空范围来约束大数据搜索的结果,从而得到更合理的更符合问答范围的搜索结果,来作为知识图谱的补充,使得人工智能问答专家系统的回答既准确又全面,不会出现回答不了的问题。
64.在其中一个优选实施例中,所述方法还包括:时间范围关键词提取步骤;空间范围关键词提取步骤;内容范围关键词提取步骤。技术效果:所述方法通过各种时空范围的关键词的排序来提升搜索结果的准确性,提高用户的搜索体验。
65.在其中一个优选实施例中,如图2所示,所述方法还包括:用户特征获取步骤;搜索语句第二组合步骤;大数据第二搜索步骤。技术效果:所述方法通过加入用户属性,使得搜索结果更能符合用户的个性化需求,提高用户的问答体验。
66.在其中一个优选实施例中,如图3所示,所述方法还包括:空间特征获取步骤;时间特征获取步骤;内容特征获取步骤;搜索语句第三组合步骤;大数据第三搜索步骤。技术效果:所述方法加入时空性范围的特性,从而使得回答系统能够更为深入地理解时空性范围,使得搜索的结果更符合问答的范围,进而提高回答的准确率。
67.本发明的优选实施例
68.如图4所示,通过时空范围来确定知识图谱的数据采集范围和大数据搜索的时空性关键词,同时结合用户输入的关键词来得到知识图谱的回答和大数据搜索的关键词组合,结合知识图谱回答相对准确和大数据搜索覆盖面更广的优势,提高人工智能问答专家系统的回答准确率和全面性。
69.时空范围确定步骤:获取专家系统的时空性范围,时空性范围包括时间范围关键词、空间范围关键词、内容范围关键词;根据专家系统的问答范围确定时空性的范围关键
词;
70.例如如果是非遗问答专家系统,那么时间范围关键词和空间范围可以不限,内容范围关键词是非遗;又例如,如果是广东省非遗问答专家系统,那么时间范围可以不限,空间范围关键词是广东省,内容范围关键词是非遗;又例如,如果是广东省增城市非遗问答专家系统,那么时间范围可以不限,空间范围关键词是广东省增城市,内容范围关键词是非遗;又例如,如果是广东省增城市雕塑非遗问答专家系统,那么时间范围可以不限,空间范围关键词是广东省增城市,内容范围关键词是雕塑非遗;又例如,如果是广东省增城市明清雕刻非遗问答专家系统,那么时间范围关键词为明清,空间范围关键词是广东省增城市,内容范围关键词是雕刻非遗;
71.例如如果是人工智能知识问答专家系统,那么时间范围关键词和空间范围可以不限,内容范围关键词是人工智能知识;又例如,如果是中国人工智能知识问答专家系统,那么时间范围可以不限,空间范围关键词是中国,内容范围关键词是人工智能知识;又例如,如果是中国北京大学人工智能知识问答专家系统,那么时间范围可以不限,空间范围关键词是中国北京大学,内容范围关键词是人工智能知识;又例如,如果是中国北京大学深度学习人工智能知识问答专家系统,那么时间范围可以不限,空间范围关键词是中国北京大学,内容范围关键词是深度学习人工智能知识;又例如,如果是中国北京大学2021年深度学习人工智能知识问答专家系统,那么时间范围关键词为2021年,空间范围关键词是中国北京大学,内容范围关键词是深度学习人工智能知识;
72.例如如果是病虫害知识问答专家系统,那么时间范围关键词和空间范围可以不限,内容范围关键词是病虫害知识;又例如,如果是广东省病虫害知识问答专家系统,那么时间范围可以不限,空间范围关键词是广东省,内容范围关键词是病虫害知识;又例如,如果是广东省广州市病虫害知识问答专家系统,那么时间范围可以不限,空间范围关键词是广东省广州市,内容范围关键词是病虫害知识;又例如,如果是广东省广州市荔枝病虫害知识问答专家系统,那么时间范围可以不限,空间范围关键词是广东省广州市,内容范围关键词是荔枝病虫害知识;又例如,如果是广东省广州市春秋季荔枝病虫害知识问答专家系统,那么时间范围关键词为春秋季,空间范围关键词是广东省广州市,内容范围关键词是荔枝病虫害知识;
73.若内容范围关键词中含有“知识”,“知识”可以从关键词中省略,例如“人工智能知识”可以转换为“人工智能”;
74.时间范围关键词提取步骤:按照时间范围尺度的大小按照从大到小对时间范围关键词进行排序,关键词之间通过预设符号隔开,得到时间关键词序列;按照世纪关键词、年代关键词、年份关键词、季节关键词、月份关键词、日期关键词、时间关键词进行排序;所述预设符号为空格;因为时间是周期性的,大的周期确定了才能确定大周期中的小周期,所以大的周期应该放到前面;
75.空间范围关键词提取步骤:按照空间范围尺度的大小按照从小范围到大范围对空间范围关键词进行排序,关键词之间通过预设符号隔开,得到空间关键词序列;按照社区、区、市、省、国家、星球、宇宙、世界进行排序;所述预设符号为空格;因为地名一般都是不重复的,所以越是小范围的地名越具体,也就越能反映专家系统的问答范围,所以越是小范围的地名关键词越放到前面;
76.内容范围关键词提取步骤:按照内容范围的大小按照从小范围到大范围对内容范围关键词进行排序,关键词之间通过预设符号隔开,得到内容关键词序列;所述预设符号为空格;因为内容关键词一般都是不重复的,所以越是小范围的内容关键词越具体,也就越能反映专家系统的问答范围,所以越是小范围的内容关键词越放到前面;
77.知识图谱构建获取步骤:获取专家提供的知识集;或从专家的专著的文本中获取知识集;或从互联网通过时空性范围关键词搜索并爬取得到相关度高的预设个数据,作为知识集;基于所述知识集构建知识图谱;此时构建出来的知识图谱都只是包含一些典型的知识,因为专家的知识也不可能面面俱到;通过互联网搜索获取的也只是跟时空性范围关键词相关性高的知识,而相关性不高但仍然存在相关性的知识中也存在用户可能会问到的问题,这些问题都没有被收录进知识图谱,所以此时的知识图谱中的知识是不全面地,在实际使用过程中,会有存在无法回答用户的某些问题的缺陷;
78.用户问题获取步骤:获取用户的问题;
79.用户问题解析步骤:通过深度学习模型识别问题中的实体或/和关系、答案类型所组成的逻辑表达式;所述逻辑表达式包括一个或多个三元组;
80.知识图谱查询步骤:根据所述逻辑表达式生成查询语句;根据所述查询语句在知识图谱中进行查询得到知识图谱的答案;若所述逻辑表达式包括多个三元组,则所述查询需要在知识图谱中进行多步推理;
81.知识图谱反馈步骤:若知识图谱的所述答案不为空,则将知识图谱的所述答案反馈给用户,执行或不执行大数据搜索步骤;若知识图谱的所述答案为空,则执行大数据搜索步骤;若知识图谱的所述答案不为空,也可以执行大数据搜索步骤(可选);
82.搜索语句第一组合步骤:根据用户输入的关键词和所述时空性的范围关键词组合成搜索的第一输入;所述搜索输入包括用户输入的关键词、内容范围关键词、空间范围关键词、时间范围关键词,例如“花瓶非遗增城广东”;关键词与关键词之间通过空格隔开;
83.大数据第一搜索步骤:通过所述搜索的第一输入,在一个或多个大数据引擎中进行搜索,例如百度、谷歌;从得到的搜索结果中选取相关度大的前预设条搜索结果作为第一搜索结果反馈给用户;
84.用户特征获取步骤:获取与问题范围相关的用户特征关键词;所述用户特征可以通过用户的注册信息或从用户数据库获取;例如,用户张三的特征为“男”;
85.搜索语句第二组合步骤:根据用户输入的关键词和所述时空性的范围关键词、用户特征关键词组合成搜索的第二输入;关键词与关键词之间通过空格隔开;
86.大数据第二搜索步骤:通过所述搜索的输入,在一个或多个大数据引擎中进行搜索,例如百度、谷歌;得到的搜索结果中选取相关度大的前预设条搜索结果作为第二搜索结果反馈给用户;
87.用户特征获取步骤:获取与问题范围相关的用户特征关键词;所述用户特征可以通过用户的注册信息或从用户数据库获取;例如,用户张三的特征为“男”88.空间特征获取步骤:获取与问题范围相关的空间特征关键词;所述空间特征为所述空间范围的特征;例如:空间范围“广东”的特征为“华南”;
89.时间特征获取步骤:获取与问题范围相关的时间特征关键词;所述时间特征为所述时间范围的特征;例如:时间范围“明清”的特征为“古代”;
90.内容特征获取步骤:获取与问题范围相关的内容特征关键词;所述内容特征为所述内容范围的特征;例如:内容范围“雕刻非遗”的特征为“艺术”;
91.搜索语句第三组合步骤:根据用户输入的关键词和所述时空性的范围关键词、时空性的特征关键词组合成搜索的第三输入;所述时空性的特征关键词包括内容特征关键词、空间特征关键词、时间特征关键词;关键词与关键词之间通过空格隔开;
92.大数据第三搜索步骤:通过所述搜索的第三输入,在一个或多个大数据引擎中进行搜索,例如百度、谷歌;得到的搜索结果中选取相关度大的前预设条搜索结果作为第三搜索结果反馈给用户。
93.搜索语句第四组合步骤:根据用户输入的关键词和所述时空性的范围关键词、用户特征关键词、时空性的特征关键词组合成搜索的第四输入;
94.大数据第四搜索步骤:通过所述搜索的第四输入,在一个或多个大数据引擎中进行搜索,例如百度、谷歌;得到的搜索结果中选取相关度大的前预设条搜索结果作为第四搜索结果反馈给用户。
95.搜索语句第五组合步骤:根据用户输入的关键词和所述时空性的范围关键词、时空性的特征关键词、用户特征关键词组合成搜索的第五输入;
96.大数据第四搜索步骤:通过所述搜索的第五输入,在一个或多个大数据引擎中进行搜索,例如百度、谷歌;得到的搜索结果中选取相关度大的前预设条搜索结果作为第五搜索结果反馈给用户。
97.以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,则对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。