本申请涉及生成识别文本,具体而言,涉及一种识别文本智能生成系统和方法。
背景技术:
1、便秘是指由于大肠传导功能失常,排便周期延长,或周期不长,但粪质干结难解,或粪质不硬,虽有便意,而排出不畅的病证。排便次数少、大便干结、排便困难及排便不尽四个症状中一个症状,均称为便秘。
2、相关技术中,对于便秘的识别通常基于人工的方式实现,该方式识别效率低、并且无法保证识别准确率。
技术实现思路
1、本申请的主要目的在于提供一种识别文本智能生成系统和方法,以解决相关技术中识别效率低和识别准确率低的问题。
2、为了实现上述目的,第一方面,本申请提供了一种识别文本智能生成系统,该系统包括:信息获取模块,用于获取便秘描述信息;特征提取模块,用于采用自然语言处理算法对所述便秘描述信息提取关键特征信息,以得到与所述便秘描述信息对应的目标特征描述信息;以及文本生成模块,用于采用决策树算法和支持向量机算法对所述目标特征描述信息进行处理,得到与所述便秘描述信息对应的便秘类型信息、以及与所述便秘类型信息对应的辨证论治文本。
3、根据本申请的识别文本智能生成系统,所述信息获取模块还用于获取第一训练信息和第二训练信息,所述第一训练信息为训练描述信息,所述第二训练信息为与所述训练描述信息相关联的训练类型信息;所述特征提取模块还用于采用所述自然语言处理算法对所述第一训练信息和所述第二训练信息分别提取关键特征信息,以得到与所述第一训练信息对应的第一目标特征训练信息和与所述第二训练信息对应的第二目标特征训练信息;所述识别文本智能生成系统还包括:第一模型训练模块,用于根据所述第一训练信息和所述第二训练信息采用所述决策树算法进行模型训练,以得到第一文本生成模型;第二模型训练模块,用于根据所述第一训练信息和所述第二训练信息采用所述支持向量机算法进行模型训练,以得到第二文本生成模型;所述文本生成模块还用于采用所述第一文本生成模型和所述第二文本生成模型根据所述目标特征描述信息得到所述便秘类型信息。
4、根据本申请的识别文本智能生成系统,所述文本生成模块包括:第一分型计算单元,用于采用所述第一模型训练模块根据所述目标特征描述信息得到第一分型结果;第一概率计算单元,用于计算所述第一分型结果的后验概率,即第一后验概率;第二分型计算单元,用于采用所述第二模型训练模块根据所述目标特征描述信息得到第二分型结果;第二概率计算单元,用于计算所述第二分型结果的后验概率,即第二后验概率;以及分型结果计算单元,用于对所述第一后验概率和所述第二后验概率进行加权求和得到的结果来确定所述便秘类型信息。
5、根据本申请的识别文本智能生成系统,所述第一后验概率的权重为预先已知的决策树算法精准度,所述第二后验概率的权重为预先已知的支持向量机算法精准度。
6、根据本申请的识别文本智能生成系统,该系统还包括:信息存储模块,用于存储每一种便秘类型及其对应的辨证论治文本;以及所述文本生成模块还用于在得到便秘类型信息之后通过所述信息存储模块得到相应的辨证论治文本;其中,所述辨证论治文本包括病因、临床描述、辨证论治方案和辨证论治药方。
7、第二方面,本申请还提供了一种识别文本智能生成方法,该方法包括:获取便秘描述;采用自然语言处理算法对所述便秘描述信息提取关键特征信息,以得到与所述便秘描述信息对应的目标特征描述信息;以及采用决策树算法和支持向量机算法对所述目标特征描述信息进行处理,得到与所述便秘描述信息对应的便秘类型信息、以及与所述便秘类型信息对应的辨证论治文本。
8、根据本申请的识别文本智能生成方法,该方法还包括:获取第一训练信息和第二训练信息,所述第一训练信息为训练描述信息,所述第二训练信息为与所述训练描述信息相关联的训练类型信息;采用所述自然语言处理算法对所述第一训练信息和所述第二训练信息分别提取关键特征信息,以得到与所述第一训练信息对应的第一目标特征训练信息和与所述第二训练信息对应的第二目标特征训练信息;根据所述第一训练信息和所述第二训练信息采用所述决策树算法进行模型训练,以得到第一文本生成模型;根据所述第一训练信息和所述第二训练信息采用所述支持向量机算法进行模型训练,以得到第二文本生成模型;以及采用所述第一文本生成模型和所述第二文本生成模型根据所述目标特征描述信息得到所述便秘类型信息。
9、根据本申请的识别文本智能生成方法,采用所述第一文本生成模型和所述第二文本生成模型根据所述目标特征描述信息得到所述便秘类型信息包括:采用所述第一模型训练模块根据所述目标特征描述信息得到第一分型结果;计算所述第一分型结果的后验概率,即第一后验概率;采用所述第二模型训练模块根据所述目标特征描述信息得到第二分型结果;计算所述第二分型结果的后验概率,即第二后验概率;以及对所述第一后验概率和所述第二后验概率进行加权求和得到的结果来确定所述便秘类型信息。
10、根据本申请的识别文本智能生成方法,所述第一后验概率的权重为预先已知的决策树算法精准度,所述第二后验概率的权重为预先已知的支持向量机算法精准度。
11、根据本申请的识别文本智能生成方法,该方法还包括:存储每一种便秘类型及其对应的辨证论治文本;以及在得到便秘类型信息之后通过所述信息存储模块得到相应的辨证论治文本;其中,所述辨证论治文本包括病因、临床描述、辨证论治方案和辨证论治药方。
12、本申请通过采用决策树算法和支持向量机算法构建文本生成模型,为提供了一种简单的针对便秘的生成识别文本的方式,大大提高的传统方式的识别效率,并且可以保证识别准确率。
1.一种识别文本智能生成系统,其特征在于,该系统包括:
2.如权利要求1所述的识别文本智能生成系统,其特征在于,
3.如权利要求2所述的识别文本智能生成系统,其特征在于,所述文本生成模块包括:
4.如权利要求3所述的识别文本智能生成系统,其特征在于,所述第一后验概率的权重为预先已知的决策树算法精准度,所述第二后验概率的权重为预先已知的支持向量机算法精准度。
5.如权利要求1所述的识别文本智能生成系统,其特征在于,该系统还包括:
6.一种识别文本智能生成方法,其特征在于,该方法包括:
7.如权利要求6所述的识别文本智能生成方法,其特征在于,该方法还包括:
8.如权利要求7所述的识别文本智能生成方法,其特征在于,采用所述第一文本生成模型和所述第二文本生成模型根据所述目标特征描述信息得到所述便秘类型信息包括:
9.如权利要求8所述的识别文本智能生成方法,其特征在于,所述第一后验概率的权重为预先已知的决策树算法精准度,所述第二后验概率的权重为预先已知的支持向量机算法精准度。
10.如权利要求6所述的识别文本智能生成方法,其特征在于,该方法还包括: