本发明涉及自然语言处理,尤其涉及基于自然语言处理的交互式批文生成方法、装置及系统。
背景技术:
1、心理沙盘是一种心理治疗工具,它通过沙盘和各种小型模型、道具等物品,让用户通过表现自己的内心世界来缓解心理问题。
2、随着信息技术与虚拟现实技术的发展,用软件化手段来模拟沙盘游戏、取代实体心理沙盘成为一种客观需求。因此市场上出现模拟心理沙盘运行的电子化心理沙盘工具。
3、现有的电子化心理沙盘工具在实现上已经具有相当的成熟度,但它们仍然存在以下缺点:
4、(1)缺乏文化内涵和传统文化元素的融入;
5、(2)一般依靠3d建模实现,缺乏互动性和娱乐性,难以吸引更多的用户和受众;
6、(3)进行心理沙盘分析时一般使用固定模板,缺乏个性化的服务和体验,难以满足不同用户的需求和偏好。
技术实现思路
1、本发明提供了基于自然语言处理的交互式批文生成方法、装置及系统,解决了现有的电子化心理沙盘工具缺乏个性化、互动性、娱乐性及文化性的技术问题。
2、本发明第一方面提供一种基于自然语言处理的交互式批文生成方法,包括:
3、获取目标用户的个性化信息和心理沙盘物件信息;
4、基于随机森林算法解析所述心理沙盘物件信息,得到相应的心理沙盘主题;
5、根据所述相应的心理沙盘主题所属的心理沙盘主题类型,选择相应的预先训练完成的批文生成模型作为目标批文生成模型;所述心理沙盘主题类型分为受伤主题和治愈主题;
6、接收所述目标用户在预置词库中随机抽取的多个不同的关键词,以每个所述关键词和所述个性化信息作为一个前文提示,将各所述前文提示分别输入至所述目标批文生成模型,得到各所述前文提示对应的现代文批文;
7、将各所述现代文批文分别输入至预先训练完成的批文选择模型,得到各所述现代文批文对应的分数,从中选取分数最高的现代文批文作为目标批文;
8、将所述目标批文输入至预先训练完成的现代文-文言文神经机器翻译模型,得到所述目标批文对应的目标文言文;
9、输出所述目标批文和所述目标文言文。
10、根据本发明第一方面的一种能够实现的方式,所述获取目标用户的个性化信息和心理沙盘物件信息,包括:
11、获取所述目标用户基于定制的交互界面输入的定制化信息,根据所述定制化信息得到所述个性化信息;所述交互界面可输入的定制化信息包括性别、生日、学历、职业和城市;
12、基于rfid阅读器获取附着于目标心理沙盘中物件上的rfid电子标签的标签信息,将所述标签信息作为心理沙盘物件信息。
13、根据本发明第一方面的一种能够实现的方式,所述定制化信息由所述目标用户通过触控屏幕在所述定制的交互界面上进行输入。
14、根据本发明第一方面的一种能够实现的方式,所述预置词库基于tf-idf技术构建得到。
15、根据本发明第一方面的一种能够实现的方式,所述方法还包括:
16、采集关于现代文批文的数据集;
17、对所述数据集进行清洗和预处理,得到目标数据集;
18、计算所述目标数据集中每个词语的tf-idf权重;
19、将tf-idf权重超过预置权重阈值的词语作为重要词语;
20、将各所述重要词语导出到一个字典文件中,得到所述预置词库。
21、根据本发明第一方面的一种能够实现的方式,所述批文生成模型为gpt-2模型;
22、所述批文选择模型为bert模型;
23、和/或,所述现代文-文言文神经机器翻译模型为anchibert模型。
24、本发明第二方面提供了一种基于自然语言处理的交互式批文生成装置,包括:
25、存储器,用于存储指令;其中,所述指令用于实现如上任意一项能够实现的方式所述的基于自然语言处理的交互式批文生成方法;
26、处理器,用于执行所述存储器中的指令。
27、本发明第三方面一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任意一项能够实现的方式所述的基于自然语言处理的交互式批文生成方法。
28、本发明第四方面提供一种基于自然语言处理的交互式批文生成装置,包括:
29、信息获取模块,用于获取目标用户的个性化信息和心理沙盘物件信息;
30、主题解析模块,用于基于随机森林算法解析所述心理沙盘物件信息,得到相应的心理沙盘主题;
31、模型选择模块,用于根据所述相应的心理沙盘主题所属的心理沙盘主题类型,选择相应的预先训练完成的批文生成模型作为目标批文生成模型;所述心理沙盘主题类型分为受伤主题和治愈主题;
32、批文生成模块,用于接收所述目标用户在预置词库中随机抽取的多个不同的关键词,以每个所述关键词和所述个性化信息作为一个前文提示,将各所述前文提示分别输入至所述目标批文生成模型,得到各所述前文提示对应的现代文批文;
33、目标批文确定模块,用于将各所述现代文批文分别输入至预先训练完成的批文选择模型,得到各所述现代文批文对应的分数,从中选取分数最高的现代文批文作为目标批文;
34、批文翻译模块,用于将所述目标批文输入至预先训练完成的现代文-文言文神经机器翻译模型,得到所述目标批文对应的目标文言文;
35、输出模块,用于输出所述目标批文和所述目标文言文。
36、根据本发明第四方面的一种能够实现的方式,所述信息获取模块包括:
37、第一信息获取单元,用于获取所述目标用户基于定制的交互界面输入的定制化信息,根据所述定制化信息得到所述个性化信息;所述交互界面可输入的定制化信息包括性别、生日、学历、职业和城市;
38、第二信息获取单元,用于基于rfid阅读器获取附着于目标心理沙盘中物件上的rfid电子标签的标签信息,将所述标签信息作为心理沙盘物件信息。
39、根据本发明第四方面的一种能够实现的方式,所述定制化信息由所述目标用户通过触控屏幕在所述定制的交互界面上进行输入。
40、根据本发明第四方面的一种能够实现的方式,所述预置词库基于tf-idf技术构建得到。
41、根据本发明第四方面的一种能够实现的方式,所述装置还包括:
42、采集模块,用于采集关于现代文批文的数据集;
43、处理模块,用于对所述数据集进行清洗和预处理,得到目标数据集;
44、计算模块,用于计算所述目标数据集中每个词语的tf-idf权重;
45、筛选模块,用于将tf-idf权重超过预置权重阈值的词语作为重要词语;
46、导出模块,用于将各所述重要词语导出到一个字典文件中,得到所述预置词库。
47、根据本发明第四方面的一种能够实现的方式,所述批文生成模型为gpt-2模型;
48、所述批文选择模型为bert模型;
49、和/或,所述现代文-文言文神经机器翻译模型为anchibert模型。
50、本发明第五方面提供一种基于自然语言处理的交互式批文生成系统,包括目标心理沙盘、所述目标心理沙盘上附着有rfid电子标签的物件以及如上任意一项能够实现的方式所述的基于自然语言处理的交互式批文生成装置。
51、从以上技术方案可以看出,本发明具有以下优点:
52、本发明获取目标用户的个性化信息和心理沙盘物件信息;基于随机森林算法解析所述心理沙盘物件信息,并根据得到的心理沙盘主题所属的心理沙盘主题类型,选择相应的预先训练完成的批文生成模型作为目标批文生成模型;接收目标用户在预置词库中随机抽取的多个不同的关键词,以每个关键词和该个性化信息作为一个前文提示,将各前文提示分别输入至目标批文生成模型,得到各前文提示对应的现代文批文;将各个现代文批文分别输入至预先训练完成的批文选择模型,得到各所述现代文批文对应的分数,从中选取分数最高的现代文批文作为目标批文;将目标批文输入至预先训练完成的现代文-文言文神经机器翻译模型,得到目标批文对应的目标文言文,最后输出目标批文和目标文言文;本发明结合心理沙盘、图像处理、自然语言处理等多种技术,实现了目标批文和目标文言文的自动生成,能够提供个性化、有趣、互动的用户体验,通过现代文批文转文言文批文的翻译操作,增强了文化性,可以提高人们对中国传统文化的认知和理解,促进科技创新和应用的发展;本发明可以在心理治疗、文化旅游、娱乐、教育等领域得到应用和推广,能够为企业和机构提供新的商业模式和市场机会,具有广泛的应用前景和推广价值。