本发明涉及信息处理,尤其涉及一种投诉工单智能处理方法、装置、设备及存储介质。
背景技术:
1、随着科技的发展,人们的交流越来越便捷,但在用户使用通信设备与他人联系时,不可避免地会出现种种问题,用户可能会就遇到的问题进行投诉。
2、现有技术方案在投诉工单处理时,主要依靠运维人员检查客服投诉工单填写规范、理解工单内容并根据业务知识归纳问题类型、抽取工单要素信息进行信息查询,依据问题类型、查询信息编写回复文本进行回复,从而解决问题,过多依赖于人工操作。
3、但是这种方式存在的问题为:每天的投诉工单数千,工单数据量大,运维人员需对客服填写的每一份工单进行规范检查,耗费了大量人力与时间成本,很难准确归纳出真实的问题类型。同时仅依靠运维人员从投诉工单中抽取要素信息进行信息查询,很容易因获取的要素信息疏漏造成查询信息不准确。
技术实现思路
1、本发明的主要目的在于提供一种投诉工单智能处理方法、装置、设备及存储介质,旨在提升投诉工单处理的效率和准确性。
2、为实现上述目的,本发明提供一种投诉工单智能处理方法,所述投诉工单智能处理方法包括以下步骤:
3、接收投诉工单;
4、确认所述投诉工单的场景类型;
5、加载要素提取模型,对所述投诉工单进行内容要素提取,获取所述投诉工单的要素信息;
6、根据所述投诉工单的场景类型和所述投诉工单的要素信息,生成回复文本。
7、可选地,所述确认所述投诉工单的场景类型的步骤包括:
8、提取所述投诉工单中的数据,得到第一工单数据;
9、根据预设的关键字规则,判断所述投诉工单是否匹配热点场景类型;
10、若所述投诉工单不匹配热点场景类型,则对所述第一工单数据进行预处理,获取第二工单数据;
11、根据所述第二工单数据,构建基于tf-idf的关键词重要性表征向量;
12、根据所述基于tf-idf的关键词重要性表征向量和所述第二工单数据,通过场景推理模型,确认所述投诉工单的场景类型。
13、可选地,所述根据所述第二工单数据,构建基于tf-idf的关键词重要性表征向量的步骤包括:
14、对所述第二工单数据进行分词处理,得到工单数据分词;
15、统计所述工单数据分词在所述第二工单数据中出现的频数;
16、统计所述第二工单数据中的总词数;
17、根据所述频数和所述总词数,计算词频tf;
18、统计工单数据集中含有所述工单数据分词的第二工单数量;
19、统计所述工单数据集中的总第二工单数量;
20、根据所述含有所述工单数据分词的第二工单数量和所述总第二工单数量,计算逆文档频idf;
21、根据所述词频tf和所述逆文档频idf,计算所述工单数据分词的tf-idf值;
22、根据所述工单数据分词的tf-idf值,构建所述工单数据分词的基于tf-idf的关键词重要性表征向量。
23、可选地,所述根据所述基于tf-idf的关键词重要性表征向量和所述第二工单数据,通过场景推理模型,获取所述投诉工单的场景类型的步骤包括:
24、将所述基于tf-idf的关键词重要性表征向量加载到所述场景推理模型;
25、将所述第二工单数据输入所述加载关键词重要性表征向量的场景推理模型;
26、通过所述场景推理模型,对所述第二工单数据进行推理,确认所述投诉工单的场景类型。
27、可选地,所述加载要素提取模型,对所述投诉工单进行内容要素提取,获取所述投诉工单的要素信息的步骤包括:
28、将所述基于tf-idf的关键词重要性表征向量加载到所述要素提取模型;
29、将所述第一工单数据输入所述加载关键词重要性表征向量的要素提取模型;
30、通过所述要素提取模型,根据所述第一工单数据,获取所述投诉工单的要素信息。
31、可选地,所述根据预设的关键字规则,判断所述投诉工单是否匹配热点场景类型的步骤之后,还包括:
32、若所述投诉工单匹配热点场景类型,则根据预设的关键字规则,确认所述投诉工单的场景类型;
33、将所述第一工单数据输入所述要素提取模型,获取所述投诉工单的要素信息。
34、可选地,所述根据所述投诉工单的场景类型和所述投诉工单的要素信息,生成回复文本的步骤包括:
35、根据所述投诉工单的场景类型和所述投诉工单的要素信息,获取所述投诉工单的数据信息;
36、根据所述投诉工单的数据信息和预设的回复文本模板,生成所述投诉工单的回复文本并回复。
37、可选地,所述确认所述投诉工单的场景类型的步骤之前,还包括:
38、确认所述投诉工单填写规范。
39、可选地,所述确认所述投诉工单填写规范的步骤包括:
40、基于规则,判断所述投诉工单中的要素是否完整;
41、若所述投诉工单中的要素完整,则基于fasttext算法,确认所述投诉工单中的要素填写正确。
42、可选地,所述根据所述投诉工单的场景类型和所述投诉工单的要素信息,生成回复文本的步骤之后,还包括:
43、根据所述第一工单数据,更新所述场景推理模型和所述要素提取模型。
44、可选地,所述根据所述第一工单数据,更新所述场景推理模型和所述要素提取模型的步骤包括:
45、根据所述第一工单数据,建立第一训练数据集;
46、对所述第一训练数据集进行预处理,获取第二训练数据集;
47、根据第一预设条件,对所述第二训练数据集进行筛选,获取第三训练数据集;
48、根据所述第二工单数据,构建所述基于tf-idf的关键词重要性表征向量;
49、将所述第三训练数据集划分为训练集、测试集、验证集;
50、根据所述训练集、测试集、验证集更新所述场景推理模型和所述要素提取模型。
51、可选地,所述根据第一预设条件,对所述第二训练数据集进行筛选,获取第三训练数据集的步骤包括:
52、根据场景类别,将所述第二训练数据集中的投诉工单数据分类,获取第一场景类别工单数据与第一场景类别工单数;
53、判断所述第一场景类别工单数是否大于第一阈值;
54、若所述第一场景类别工单数大于第一阈值,则随机选取k1倍的所述第一场景类别工单数据,建立所述第三训练数据集,所述k1为正数。
55、可选地,所述判断所述第一场景类别工单数是否大于第一阈值的步骤之后,还包括:
56、若所述第一场景类别工单数不大于第一阈值,则判断所述第一场景类别工单数是否小于第二阈值;
57、若第一场景类别工单数小于第二阈值,则通过同义词词典,构建样本数据;
58、将所述样本数据加入所述第一场景类别工单数据,获取第二场景类别工单数据与第二场景类别工单数;
59、判断所述第二场景类别工单数是否小于第二阈值;
60、若所述第二场景类别工单数小于第二阈值,则复制k2倍的所述第二场景类别工单数据,建立所述第三训练数据集,所述k2为正数。
61、可选地,所述根据所述训练集、测试集、验证集更新所述场景推理模型和所述要素提取模型的步骤包括:
62、基于randomizedsearchcv算法,根据所述验证集,获取最优超参数组合;
63、根据所述基于tf-idf的关键词重要性表征向量、所述最优超参数组合和所述训练集,训练所述场景推理模型;
64、通过所述测试集,判断所述训练后的场景推理模型准确率是否大于历史最优准确率且小于或等于第三阈值,或准确率大于第三阈值;
65、若所述训练后的场景推理模型准确率大于历史最优准确率且准确率小于等于第三阈值或准确率大于第三阈值,则更新所述场景推理模型和所述要素提取模型。
66、此外,为实现上述目的,本发明还提供一种投诉工单智能处理装置,所述投诉工单智能处理装置包括:
67、接收模块,用于接收投诉工单;
68、场景确认模块,用于确认所述投诉工单的场景类型;
69、要素提取模块,用于加载要素提取模型,对所述投诉工单进行内容要素提取,获取所述投诉工单的要素信息;
70、文本回复模块,用于根据所述投诉工单的场景类型和所述投诉工单的要素信息,生成回复文本。
71、本发明实施例还提出一种终端设备,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的投诉工单智能处理程序,所述投诉工单智能处理程序被所述处理器执行时实现如上所述的投诉工单智能处理方法的步骤。
72、本发明实施例还提出一种计算器可读存储介质,所述计算机可读存储介质上存储有投诉工单智能处理程序,所述投诉工单智能处理程序被处理器执行时实现如上所述的投诉工单智能处理方法的步骤。
73、本发明实施例提出的一种投诉工单智能处理方法、装置、设备及存储介质,通过接收投诉工单;确认所述投诉工单的场景类型;加载要素提取模型,对所述投诉工单进行内容要素提取,获取所述投诉工单的要素信息;根据所述投诉工单的场景类型和所述投诉工单的要素信息,生成回复文本。通过要素提取模型,自动化生成了对投诉工单的回复文本。由此,实现了对投诉工单的智能处理,解决了现有技术中投诉工单处理方式依赖人工操作的技术问题。相较于现有技术,具有低成本、高效率、操作简单、准确率更高的优势。以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。