本技术涉及人工智能,尤其涉及一种表生文转换方法、系统、设备及介质。
背景技术:
1、随着大数据时代的到来,信息量呈指数级增长,大量的数据以表格形式存在。尽管表格为用户提供清晰的数据组织方式,但对于不具备专业背景知识的广大用户群体而言,直接阅读和理解表格内容仍然较为困难。因此,将表格数据转换成易于理解的自然语言描述成为了人们关注的重点内容之一。
2、目前,传统的表生文转换方式大体可以分为两类,第一类转换方式主要通过预先训练好的大语言模型直接生成与表格数据对应的自然语言描述文本,该种方式所需的计算资源较多,推理生成的耗时较长;第二类转换方式主要通过直接将表格数据和对应的提示共同输入至大语言模型,由大语言模型生成与表格数据对应的自然语言描述文本,该种方式生成的自然语言描述文本的准确度不高。
3、综上,相关技术中存在的技术问题有待得到改善。
技术实现思路
1、本发明的目的在于至少一定程度上解决相关技术中存在的技术问题之一。
2、本技术实施例的主要目的在于提出一种表生文转换方法,该转换方法可以减少表格转换成文本所需的计算资源及推理耗时,提高表格转换成文本的生成准确度。
3、为实现上述目的,本技术实施例的一方面提出了一种表生文转换方法,该转换方法包括:
4、获取记录有关键查询信息的第一字典、待转换的数据表格和与所述关键查询信息对应的第一提示语,所述第一提示语用于指示检索所述数据表格中与所述关键查询信息对应的表格类型数据;
5、将所述数据表格和所述第一提示语输入至语言模型,通过所述语言模型得到目标表格类型数据;
6、根据所述目标表格类型数据,对所述第一字典进行存储更新,得到第二字典;
7、将所述第二字典和第二提示语输入至所述语言模型,得到目标生成文本,所述第二提示语用于指示检索所述第二字典中与所述关键查询信息对应的字典结构数据。
8、在一些实施例中,所述获取记录有关键查询信息的第一字典,包括:
9、获取用户输入的用户查询语句和初始字典;
10、对所述用户查询语句中的至少一个查询问题进行关键信息提取,得到所述关键查询信息,每个所述查询问题对应一个所述关键查询信息;
11、根据所述关键查询信息,对所述初始字典进行关键信息更新,得到所述第一字典。
12、在一些实施例中,所述对所述用户查询语句中的至少一个查询问题进行关键信息提取,得到所述关键查询信息,包括:
13、获取与至少一个所述查询问题对应的第三提示语;
14、将所述用户查询语句和所述第三提示语输入至所述语言模型,得到所述语言模型输出的所述关键查询信息。
15、在一些实施例中,所述根据所述目标表格类型数据,对所述第一字典进行存储更新,通过所述语言模型得到第二字典,包括:
16、获取所述第一字典的字典结构;
17、基于所述字典结构,对所述目标表格类型数据进行字典结构分类,得到表格数据键和表格数据值,所述表格数据键用于指示所述目标表格类型数据中与所述关键查询信息对应的表格属性,所述表格数据值用于指示所述目标表格类型数据中与所述表格属性对应的表格值;
18、根据所述表格数据键和所述表格数据值,对所述第一字典进行键值存储更新,得到所述第二字典。
19、在一些实施例中,所述根据所述表格数据键和所述表格数据值,对所述第一字典进行键值存储更新,得到所述第二字典,包括:
20、根据所述表格数据键,对所述第一字典进行键值查询验证,得到查询验证结果,所述查询验证结果用于指示所述第一字典是否存在与所述表格数据键对应的属性键;
21、若所述查询验证结果指示所述第一字典不存在与所述表格数据键对应的属性键,则根据所述表格数据键和所述表格数据值,对所述第一字典进行键值添加更新,得到所述第二字典;或者,若所述查询验证结果指示所述第一字典存在与所述表格数据键对应的属性键,则获取预设的字典更新条件,并根据所述字典更新条件、所述表格数据键和所述表格数据值,对所述第一字典进行条件更新,得到所述第二字典。
22、在一些实施例中,所述根据所述目标表格类型数据,对所述第一字典进行存储更新,得到第二字典,包括:
23、获取与所述目标表格类型数据对应的第三提示语,所述第三提示语用于指示生成与所述目标表格类型数据对应的字典结构数据;
24、将所述第三提示语和所述目标表格类型数据输入至所述语言模型,通过所述语言模型生成得到第一字典结构数据;
25、根据所述第一字典结构数据,对所述第一字典进行字典更新,得到所述第二字典。
26、在一些实施例中,所述将所述第二字典和第二提示语输入至所述语言模型,得到目标生成文本,包括:
27、将所述第二字典和所述第二提示语输入至所述语言模型,通过所述语言模型得到第二字典结构数据;
28、将第四提示语和所有所述第二字典结构数据输入至所述语言模型,通过所述语言模型得到所述目标生成文本,所述第四提示语用于指示生成与用户查询语句对应的自然语言文本。
29、为实现上述目的,本技术实施例的另一方面提出了一种表生文转换系统,包括:
30、第一处理单元,用于获取记录有关键查询信息的第一字典、待转换的数据表格和与所述关键查询信息对应的第一提示语,所述第一提示语用于指示检索所述数据表格中与所述关键查询信息对应的表格类型数据;
31、第二处理单元,用于将所述数据表格和所述第一提示语输入至语言模型,通过所述语言模型得到目标表格类型数据;
32、第三处理单元,用于根据所述目标表格类型数据,对所述第一字典进行存储更新,得到第二字典;
33、第四处理单元,用于将所述第二字典和第二提示语输入至所述语言模型,得到目标生成文本,所述第二提示语用于指示检索所述第二字典中与所述关键查询信息对应的字典结构数据。
34、为实现上述目的,本技术实施例的另一方面提出了一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现前面所述的方法。
35、为实现上述目的,本技术实施例的另一方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现前面所述的方法。
36、本技术实施例至少包括以下有益效果:
37、本技术提供一种表生文转换方法、系统、设备及介质,其中,该转换方法获取记录有关键查询信息的第一字典、待转换的数据表格和与所述关键查询信息对应的第一提示语,所述第一提示语用于指示检索所述数据表格中与所述关键查询信息对应的表格类型数据;将所述数据表格和所述第一提示语输入至语言模型,通过所述语言模型得到目标表格类型数据;根据所述目标表格类型数据,对所述第一字典进行存储更新,得到第二字典;将所述第二字典和第二提示语输入至所述语言模型,得到目标生成文本,所述第二提示语用于指示检索所述第二字典中与所述关键查询信息对应的字典结构数据。该转换方法基于数据表格中确定出目标表格类型数据,并基于目标表格类型数据的属性及值构建字典数据结构,可以缩小用于生成文本的表格数据规模,可以有效降低所需的计算资源及推理耗时;另外,该转换方法还基于与用户查询语句相关的第二字典输出对应的自然语言文本,可以有效减轻大语言模型的幻觉问题,提高表格转换文本的生成准确度。