本公开至少涉及人工智能,尤其涉及一种演示文档生成方法、演示文档生成装置以及计算机可读存储介质。
背景技术:
1、在人工智能领域,现有自动生成演示文档的技术,通常依赖于手动编写或简单的模板匹配,往往无法充分发挥大语言模型的潜力。手动编写演示文档虽然灵活,但耗时且容易出错;而简单的模板匹配,则可能导致生成的内容,缺乏深度和个性化。因此如何生成高效、准确且符合需求的演示文档,仍是当前技术研究中的一个重要课题。
技术实现思路
1、本公开所要解决的技术问题是针对上述不足,提供一种演示文档生成方法、演示文档生成装置以及计算机可读存储介质,以解决如何生成高效、准确且符合需求的演示文档的问题。
2、第一方面,本公开提供一种演示文档生成方法,所述方法包括:
3、对比用户主动输入信息与本地数据库中预设的主题,确定生成演示文档的用户期望主题;
4、获取本地数据库中用户期望主题下预设的子主题,根据子主题生成用户问题,通过用户问题与用户对话,以确定生成演示文档的若干用户期望子主题;
5、根据用户期望主题和若干用户期望子主题,生成演示文档的主标题和若干子标题;
6、获取本地数据库中每个用户期望子主题对应的内容数据,根据对应的内容数据生成每个子标题的子内容,根据全部子内容生成主标题的主内容;
7、组合主标题与主内容和子标题与子内容,以生成演示文档。
8、进一步地,所述方法还包括建立本地数据库,具体包括:
9、收集包括专业图片和专业文档的专业内容数据;
10、按照预设的主类别为专业内容数据分类,设定每个主类别的主题;
11、对专业图片加入第一关键词,提取专业文档中的专业图表并结合专业文档中的上下文生成专业图表的第二关键词,根据专业文档的结构提取专业文档段落及其第三关键词;
12、计算第一关键词、第二关键词和第三关键词的第一相似度,将第一相似度大于第一阈值的专业图片、专业图表和专业文档段落归为同一子类别,根据第一关键词、第二关键词和第三关键词生成每个子类别的子主题;
13、将专业图片、专业图表和专业文档段落,归属于对应的子主题和主题存储在本地数据库中。
14、进一步地,所述方法还包括预训练模型,具体包括:
15、采用本地数据库中存储的至少部分数据预训练图生文模型的图片描述能力,包括通过人工标注预训练图生文模型根据专业图片和专业图表生成图片描述文本的能力;
16、采用本地数据库中存储的至少部分数据预训练大语言模型的内容生成能力,包括:根据子主题生成用户问题的能力、根据主题和子主题生成主标题和子标题的能力、根据专业文档段落和图片描述文本生成扩写文档段落的能力、根据若干扩写文档段落生成摘要的能力。
17、进一步地,对比用户主动输入信息与本地数据库中预设的主题,确定生成演示文档的用户期望主题,具体包括:
18、识别用户主动输入信息中指明生成演示文档的专业领域和主题类型;
19、计算专业领域与主题类型与本地数据库中预设的主题的第二相似度;
20、将第二相似度大于第二阈值的主题,确定为生成演示文档的用户期望主题。
21、进一步地,获取本地数据库中用户期望主题下预设的子主题,根据子主题生成用户问题,通过用户问题与用户对话,以确定生成演示文档的若干用户期望子主题,具体包括:
22、获取预设的演示文档布局模板,获取本地数据库中用户期望主题下预设的全部子主题;
23、生成包括询问用户选择和修改演示文档布局模板、用户期望生成演示文档的总页数、选择的子主题和对应子主题的子页数的用户问题;
24、通过用户问题与用户对话获取用户指定的第一演示文档布局模板、用户期望生成演示文档的总页数、从子主题中选择的若干用户期望子主题和对应每个用户期望子主题的子页数。
25、进一步地,根据用户期望主题和若干用户期望子主题,生成演示文档的主标题和若干子标题,具体包括:
26、根据用户期望子主题和对应的子页数筛选本地数据库中的内容数据,内容数据是专业图片、专业图表和专业文档段落;
27、根据筛选的内容数据的第一关键词、第二关键词和第三关键词结合用户期望子主题,生成演示文档的子标题;
28、根据若干子标题结合用户期望主题,生成演示文档的主标题。
29、进一步地,获取本地数据库中每个用户期望子主题对应的内容数据,根据对应的内容数据生成每个子标题的子内容,根据全部子内容生成主标题的主内容,具体包括:
30、获取从本地数据库中筛选的专业图片、专业图表和专业文档段落;
31、将筛选的专业图片和专业图表及其第一关键词和第二关键词输入图生文模型,以生成图片描述文本;
32、将生成的图片描述文本和筛选的专业文档段落输入大语言模型,以生成扩写文档段落;
33、根据扩写文档段落与专业图片和专业图表,生成每个子标题的子内容;
34、将全部子内容的扩写文档段落输入大语言模型生成摘要,以摘要主标题的主内容。
35、进一步地,组合主标题与主内容和子标题与子内容,以生成演示文档,具体包括:
36、将主标题与主内容和子标题与子内容填入第一演示文档布局模板并向用户展示,接收用户对展示内容的确认或修改指令,以生成演示文档。
37、第二方面,本公开提供一种演示文档生成装置,所述装置包括:
38、主题确定单元,用于对比用户主动输入信息与本地数据库中预设的主题,确定生成演示文档的用户期望主题;
39、子主题确定单元,与主题确定单元连接,用于获取本地数据库中用户期望主题下预设的子主题,根据子主题生成用户问题,通过用户问题与用户对话,以确定生成演示文档的若干用户期望子主题;
40、标题生成单元,与子主题确定单元连接,用于根据用户期望主题和若干用户期望子主题,生成演示文档的主标题和若干子标题;
41、内容生成单元,与标题生成单元连接,用于获取本地数据库中每个用户期望子主题对应的内容数据,根据对应的内容数据生成每个子标题的子内容,根据全部子内容生成主标题的主内容;
42、文档生成单元,与内容生成单元连接,用于组合主标题与主内容和子标题与子内容,以生成演示文档。
43、第三方面,本公开提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序被处理器运行时,实现如上所述的演示文档生成方法。
44、本公开提供一种演示文档生成方法、演示文档生成装置以及计算机可读存储介质,通过与用户交互,并结合本地数据库预设的多级分类内容,逐步确定演示文档的主题、子主题以及生成各级标题和与标题对应的内容,最终高效生成准确且符合用户需求的演示文档。
1.一种演示文档生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括建立本地数据库,具体包括:
3.根据权利要求2所述的方法,其特征在于,所述方法还包括预训练模型,具体包括:
4.根据权利要求2或3所述的方法,其特征在于,对比用户主动输入信息与本地数据库中预设的主题,确定生成演示文档的用户期望主题,具体包括:
5.根据权利要求2或3所述的方法,其特征在于,获取本地数据库中用户期望主题下预设的子主题,根据子主题生成用户问题,通过用户问题与用户对话,以确定生成演示文档的若干用户期望子主题,具体包括:
6.根据权利要求5所述的方法,其特征在于,根据用户期望主题和若干用户期望子主题,生成演示文档的主标题和若干子标题,具体包括:
7.根据权利要求6所述的方法,其特征在于,获取本地数据库中每个用户期望子主题对应的内容数据,根据对应的内容数据生成每个子标题的子内容,根据全部子内容生成主标题的主内容,具体包括:
8.根据权利要求5所述的方法,其特征在于,组合主标题与主内容和子标题与子内容,以生成演示文档,具体包括:
9.一种演示文档生成装置,其特征在于,所述装置包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序被处理器运行时,实现如权利要求1-8任一项所述的演示文档生成方法。