本公开涉及大数据处理领域,特别涉及一种调研数据处理方法、装置和存储介质。
背景技术:
1、调研问卷是一组与研究目标有关的问题,它是人们在社会调研活动中用来收集资料的一种常用工具。 调研人员借助调研问卷对社会活动过程进行准确、具体的测定,并应用统计方法对调研问卷的回答信息进行量的描述和分析,获取所需要的调研资料。
2、在一些相关技术中,一份调研问卷经常被复制多份,分发给不同的被调研用户。然而,各个被调研用户受限于自己的经历或经验,并不一定知道调研题目的答案,出现胡乱填写调研题目的答案的情况,影响调研结果的准确性,最终影响调研效果。
技术实现思路
1、本公开实施例,选出与被调研对象相关的被调研用户,根据被调研用户的用户行为图谱,确定被调研用户对被调研对象的各调研属性的预测评价信息,根据被调研用户对被调研对象的各调研属性的预测评价信息,从被调研对象的调研题目集中,确定适配被调研用户的调研题目,以形成合适被调研用户的个性化的调研问卷。从而,提高调研结果的准确性,提升调研效果。
2、本公开一些实施例提出一种调研数据处理方法,包括:
3、选出与被调研对象相关的被调研用户;
4、根据所述被调研用户的用户行为图谱,确定所述被调研用户对所述被调研对象的各调研属性的预测评价信息;
5、根据所述被调研用户对所述被调研对象的各调研属性的预测评价信息,从所述被调研对象的调研题目集中,确定适配所述被调研用户的调研题目,以形成所述被调研用户的调研问卷。
6、在一些实施例中,所述选出与被调研对象相关的被调研用户包括:选出与所述被调研对象有交互行为的用户作为被调研用户。
7、在一些实施例中,所述确定所述被调研用户对所述被调研对象的各调研属性的预测评价信息包括:
8、在所述被调研用户对被调研对象的调研属性有正面评价的情况下,确定所述被调研用户对所述被调研对象的所述调研属性的预测评价信息为预设评价值;
9、在所述被调研用户对被调研对象的调研属性没有正面评价的情况下,根据所述被调研用户的用户行为图谱,利用评价预测模型进行预测得到所述被调研用户对所述被调研对象的各调研属性的预测评价信息。
10、在一些实施例中,所述利用评价预测模型进行预测得到所述被调研用户对所述被调研对象的各调研属性的预测评价信息包括:根据所述被调研用户的特征和所述用户行为图谱、所述被调研对象的特征和各调研属性,利用所述评价预测模型进行预测得到所述被调研用户对所述被调研对象的各调研属性的预测评价信息。
11、在一些实施例中,所述评价预测模型包括:依次级联的图神经网络、注意力模块和深度学习神经网络;
12、所述利用所述评价预测模型进行预测得到所述被调研用户对所述被调研对象的各调研属性的预测评价信息包括:
13、根据所述用户行为图谱、所述被调研对象的各调研属性,利用所述图神经网络,确定所述被调研用户对所述被调研对象的各调研属性的第一元路径特征;
14、根据所述第一元路径特征,利用所述注意力模块,确定第二元路径特征;
15、根据所述被调研用户的特征、所述被调研对象的特征、所述第二元路径特征,利用所述深度学习神经网络,确定所述被调研用户对所述被调研对象的各调研属性的预测评价信息。
16、在一些实施例中,所述被调研用户的用户行为图谱通过在所述被调研对象相关的专家知识图谱上设置以下至少一项来形成:所述被调研用户对被调研对象的交互行为连接关系、所述被调研用户对被调研对象的历史评价连接关系、所述被调研用户对被调研对象相关问题的历史解答关系。
17、在一些实施例中,所述专家知识图谱通过集成物品类属关系、物品分类体系、概念属性关系来构建。
18、在一些实施例中,所述确定适配所述被调研用户的调研题目,以形成所述被调研用户的调研问卷包括以下至少一项:
19、将与所述被调研用户没有交互关系的调研题目的数量减少至预设数量;
20、将与所述被调研用户没有交互关系、且所述预测评价信息的评价值小于预设值的调研题目的数量减少至预设数量;
21、根据所述预测评价信息,确定各类型的调研题目的数量,其中各类型的调研题目的数量达到预设比例。
22、在一些实施例中,所述调研题目的类型根据所述预测评价信息的评价值所对应的范围区间确定。
23、在一些实施例中,所述调研题目的类型包括中性评价类型、正面评价类型、负面评价类型中的至少两个。
24、在一些实施例中,还包括:
25、通过生成和抽取的对抗式学习方法,确定信息提取模型;
26、根据所述被调研用户的调研问卷回答信息,利用所述信息提取模型,确定所述被调研用户对所述被调研对象的各调研属性的实际评价信息。
27、在一些实施例中,所述通过生成和抽取的对抗式学习方法,确定信息提取模型包括:
28、利用抽取式摘要模型对所述被调研用户的调研问卷回答信息进行信息提取得到第一用户评价结果;
29、将所述第一用户评价结果与所述用户行为图谱进行对照得到第二用户评价结果;
30、利用生成式摘要模型对所述第二用户评价结果进行信息提取得到第三用户评价结果;
31、将所述第一用户评价结果与所述第三用户评价结果进行比较,如果二者的差异大于预设值,对抽取式摘要模型的参数、生成式摘要模型的参数中的一项或多项进行调整,以使得所述差异小于预设值,对抗学习结束;
32、将对抗学习后得到的抽取式摘要模型、生成式摘要模型中的一项或多项,确定为信息提取模型。
33、在一些实施例中,所述利用所述信息提取模型,确定所述被调研用户对所述被调研对象的各调研属性的实际评价信息包括以下至少一项:
34、当所述信息提取模型为对抗学习后得到的抽取式摘要模型时,将所述被调研用户的调研问卷回答信息输入对抗学习后得到的抽取式摘要模型得到第四用户评价结果,将第四用户评价结果与所述用户行为图谱进行对照得到第五用户评价结果,将第五用户评价结果作为用户对被调研对象的各调研属性的实际评价信息;
35、当所述信息提取模型为对抗学习后得到的生成式摘要模型时,将所述被调研用户的调研问卷回答信息输入对抗学习后得到的生成式摘要模型得到第六用户评价结果,将第六用户评价结果与所述用户行为图谱进行对照得到第七用户评价结果,将第七用户评价结果作为用户对被调研对象的各调研属性的实际评价信息;
36、当所述信息提取模型为对抗学习后得到的抽取式摘要模型和生成式摘要模型时,将所述被调研用户的调研问卷回答信息输入对抗学习后得到的生成式摘要模型得到第六用户评价结果,将第六用户评价结果和所述被调研用户的调研问卷回答信息输入对抗学习后得到的抽取式摘要模型得到第八用户评价结果,将第八用户评价结果与所述用户行为图谱进行对照得到第九用户评价结果,将第九用户评价结果作为用户对被调研对象的各调研属性的实际评价信息。
37、在一些实施例中,还包括:根据所述被调研用户对所述被调研对象的各调研属性的预测评价信息和实际评价信息之间的评价偏差信息,确定所述实际评价信息的显著性权重,用于表征所述实际评价信息在调研结果中展示的显著性。
38、在一些实施例中,所述确定所述实际评价信息的显著性权重包括:
39、计算被调研对象、调研属性、预测评价信息形成的第一向量和被调研对象、调研属性、实际评价信息形成的第二向量之间的相关系数;
40、根据所述相关系数的倒数,确定所述实际评价信息的显著性权重,其中,相关系数越小,评价偏差越大,显著性权重越大。
41、在一些实施例中,还包括:汇集各个被调研用户的调研问卷回答信息,根据实际评价信息对应的被调研用户的数量和显著性权重中的至少一项,确定调研结果。
42、在一些实施例中,所述确定调研结果包括以下一项或多项:
43、如果第一实际评价信息对应的被调研用户的数量或比例大于预设数量或预设比例,确定调研结果包括所述第一实际评价信息;
44、如果第二实际评价信息对应的被调研用户的数量或比例不大于预设数量或预设比例,且第二实际评价信息的显著性权重高于预设权重,确定调研结果包括所述第二实际评价信息。
45、本公开一些实施例提出一种调研数据处理装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行调研数据处理方法。
46、本公开一些实施例提出一种调研数据处理装置,包括:执行调研数据处理方法的模块。
47、本公开一些实施例提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现调研数据处理方法的步骤。