具有提取问答的会话式AI平台的制作方法

文档序号:35204706发布日期:2023-08-22 15:24阅读:55来源:国知局
具有提取问答的会话式AI平台的制作方法


背景技术:

1、跨各个平台使用会话式人工智能(ai)助理来实现用户的口头请求。例如,智能设备(如电话、计算机、平板电脑、显示器和扬声器)可以使用ai助理来与用户的对于信息(例如,天气、新闻、财务信息等)的口头请求和/或用于智能设备或通信耦合设备(例如,播放歌曲、装备安全系统、订购项目等)的激活进行交互。此外,这些ai助理可以响应于请求在显示器上显示信息——例如,加载网页、执行音乐应用程序的图形用户界面、提供任务完成的视觉指示符、显示所请求的视频剪辑、表演或电影等。然而,这些传统的ai助理具有构建对话存储器的有限能力,并且通常仅能够回答与先前存储的信息相关的查询。因此,当某些信息丢失(例如,用户喜爱的餐厅的名称、家庭地址等)时,传统的ai助理不能填写该丢失的信息,或者当提示该信息时有效地回复。此外,这些传统的ai助理通常需要针对它们被使用的每个特定域被编程,因此需要针对每个单独域存储单独的域特定信息。因此,即使在来自一个域的信息对另一域可能有用的情况下,传统的ai助理也经常需要再次向另一域输入或提供相同的信息。


技术实现思路

1、本公开的实施例涉及一种具有提取问答的会话式人工智能(ai)平台。公开了包括会话式ai平台(例如,包括虚拟助理)的系统和方法,会话式ai平台维护用于生成对查询(例如,用户查询)的响应的结构化和非结构化存储器两者。在示例中,会话式ai平台维护非结构化数据(例如,文档或其他非结构化数据结构),包括与特定用户的交互,所述交互可以用于生成对查询的响应和/或生成要存储在结构化存储器(例如,会话式ai平台的短期存储器或长期存储器)中的数据。因此,这个非结构化数据可用于跨各种不同域交互,而无需要求对每一不同域的相同信息的单独请求。

2、与诸如以上所描述的那些的常规系统相反,会话式ai平台可以生成对包括未定义和/或未知术语的查询的响应。在一个示例中,用户询问(例如,视频、音频、文本和/或来自用户输入设备的其他输入)“我的家乡的天气是什么”,其中用户的家乡没有被会话式ai平台定义(例如,没有存储在结构化数据中和/或没有包括在结构化数据的所定义的键值对的集合中)在何处。在这样的示例中,经训练的问答(qna)模型执行对与用户相关联的非结构化数据的搜索以确定和/或提取用户的家乡。至少部分地基于通过qna模型的搜索的结果,例如,生成对查询的响应。返回以上示例,其中非结构化数据包括指示用户的家乡是“旧金山”的记录,会话式ai平台然后用“旧金山”替换查询中的“用户的家乡”。照此,从用户接收的音频、文本、视频和/或其他用户输入数据由执行会话式ai平台的系统处理并用于渲染ai代理(例如,会话式ai平台的组件)的视频、音频和/或文本响应,然后由与执行会话式ai平台相关联的一个或更多个设备(例如,显示器、扬声器等)显示或输出。此外,在各个实施例中,从用户接收的用户输入数据和由会话式ai平台生成的响应被维护为由qna模型用来提取用于生成响应的信息的非结构化数据。

3、在各个示例中,此非结构化数据包括会话历史的记录和/或用户与会话式ai平台和/或其组件(如ai代理)之间的交互的日志。例如,会话式ai平台为各个用户维护单独的非结构化数据结构(例如,文档),包含在特定用户和会话式ai平台之间交换的查询、响应和其他数据。照此,至少部分地基于用户和会话式ai平台之间的交互随时间生成非结构化数据。此外,在各个示例中,会话式ai平台维护包括用于各个定义的槽的键值对的结构化数据(例如,短期存储器或长期存储器)。例如,会话式ai平台可以包括存储值“旧金山”的键“家乡”。在各个示例中,从非结构化数据中提取与特定键相关联的值。

4、当用户向会话式ai平台呈现查询时,例如,会话式ai平台首先搜索结构化数据(例如,至少部分地基于从查询提取的数据的关键字搜索),然后,如果搜索不成功(例如,结构化数据不包含相应的键或不包含预该键相对应的值),则搜索非结构化数据。与需要定义键值对的结构化数据相反,本公开中描述的非结构化数据不需要定义的数据,因此可以为会话式ai平台提供更大的灵活性和响应性。在一个示例中,会话式ai平台不包括与“最喜欢的餐馆”相关联的定义的键,但是仍然能够至少部分地基于包括指示用户的最喜欢的餐馆的数据的非结构化数据对查询“在我最喜欢的餐馆进行预订”做出响应。



技术特征:

1.一种处理器,包括:

2.根据权利要求1所述的处理器,其中所述非结构化数据结构包括与用户相关联的文档,至少部分地基于所述用户与所述会话式ai应用之间的一个或更多个先前交互填充所述文档。

3.根据权利要求1所述的处理器,其中所述非结构化数据结构包括所述会话式ai应用与用户之间的交互的记录。

4.根据权利要求1所述的处理器,其中所述非结构化数据结构与对所述会话式ai应用的一组用户中的用户唯一的用户标识相关联。

5.根据权利要求1所述的处理器,所述一个或更多个电路还包括用于以下操作的电路:

6.根据权利要求1所述的处理器,其中所述意图包括检索与对信息的请求相对应的数据的意图。

7.根据权利要求1所述的处理器,所述一个或更多个电路还包括用于分析所述非结构化数据结构以确定要添加到所述一个或更多个槽的一个或更多个附加槽的电路。

8.根据权利要求1所述的处理器,其中所述会话式ai应用是会话式ai平台、车辆的车舱内应用、食品或饮料订购应用、计算机辅助设计cad应用、客户服务应用、网络服务应用、智能扬声器或智能显示应用、零售应用、财务应用或食品服务应用中的至少一个。

9.根据权利要求1所述的处理器,其中所述处理器被包括在以下至少一者中:

10.一种系统,包括:

11.根据权利要求10所述的系统,其中所述处理电路进一步用于将表示所述查询和所述响应的数据存储在所述非结构化数据结构中。

12.根据权利要求10所述的系统,其中所述查询从自动语音识别应用获得。

13.根据权利要求10所述的系统,其中所述响应包括至少部分地基于文本至语音算法生成的音频数据。

14.根据权利要求10所述的系统,其中所述系统被包括在以下至少一者中:

15.一种方法,包括:

16.根据权利要求15所述的方法,其中所述方法还包括:至少部分地基于所述非结构化数据确定与所述查询相关联的域信息。

17.根据权利要求15所述的方法,其中通过相机、麦克风或者用户设备的输入设备中的至少一个生成所述视频、音频或者文本。

18.根据权利要求15所述的方法,其中所述结构化数据结构包括javascript对象表示法json数据对象。

19.根据权利要求15所述的方法,其中所述非结构化数据结构包括文档,所述文档包括所述用户与会话式ai代理之间的一组交互。

20.根据权利要求15所述的方法,其中所述响应的所述部分与第一域相关联,所述第一域与和所述查询相关联的第二域不同。


技术总结
公开了具有提取问答的会话式AI平台。在各个示例中,会话式人工智能(AI)平台使用结构化数据和非结构化数据以生成对来自用户的查询的响应。在示例中,如果用于对查询的响应的数据没有存储在结构化的数据结构中,会话式AI平台搜索非结构化的数据结构中的数据。

技术研发人员:S·达斯,S·巴塔查里亚,R·库马尔
受保护的技术使用者:辉达公司
技术研发日:
技术公布日:2024/1/14
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1