一种数据校正方法、装置、电子设备及可读存储介质与流程

文档序号:30087129发布日期:2022-05-18 06:12阅读:76来源:国知局
一种数据校正方法、装置、电子设备及可读存储介质与流程

1.本发明涉及业务数据处理技术领域,特别是指一种数据校正方法、装置、电子设备及可读存储介质。


背景技术:

2.随着社会的进步以及科技的发展,用户对网络、业务、服务的要求越来越高,优质的服务已经成为企业的生命线。电信运营商、电商、零售业、金融、保险等行业通常会用调查测评的方式来开展满意度测评及nps监测,监督业务和服务的质量,提升用户体验。
3.现有的业务数据,如用户调研测评数据除了用调查结果不完整、相似或者重复的调查结果等规则剔除异常数据外,对用户调查结果数据的准确性没有校正过程,由于用户个人习惯等差异问题也造成数据偏差,影响数据的准确性。


技术实现要素:

4.本发明的目的是提供一种数据校正方法、装置、电子设备及可读存储介质,用以解决用户对于业务的评价相关数据的准确性较差的问题。
5.为达到上述目的,本发明的实施例提供一种数据校正方法,包括:
6.获取目标用户的评价相关数据;
7.根据所述评价相关数据获得所述目标用户的评价偏向度;
8.利用所述评价偏向度对所述目标用户的测评数据进行校正处理。
9.可选地,所述评价相关数据包括以下数据类型中的至少一项:
10.用户参加的历史调研数据;
11.用户的投诉数据;
12.用户的互联网内容评分数据。
13.可选地,所述根据所述评价相关数据获得所述目标用户的评价偏向度,包括:
14.分别计算所述评价相关数据中不同数据类型对应的数据偏差度;
15.对所述不同数据类型对应的数据偏差度进行加权求和,获得所述目标用户的评价偏向度。
16.可选地,所述分别计算所述评价相关数据中不同数据类型对应的数据偏差度,包括:
17.确定与所述目标用户的业务质量以及用户行为相似的至少一个第一用户;
18.获取所述第一用户的评价相关数据;
19.根据所述第一用户的评价相关数据,分别计算不同数据类型的数据均值;
20.根据所述目标用户的评价相关数据以及所述数据均值,分别计算所述目标用户在不同数据类型的数据偏差度。
21.可选地,所述确定与所述目标用户的业务质量以及用户行为相似的至少一个第一用户,包括:
22.分别获取所述目标用户和除所述目标用户外的其他用户的业务质量信息以及用户行为信息;
23.根据所述业务质量信息,计算所述目标用户与所述其他用户的业务质量相似度;
24.根据所述用户行为信息,计算所述目标用户和所述其他用户的用户行为相似度;
25.在所述业务质量相似度和所述用户行为相似度满足预设条件的情况下,确定所述其他用户为所述第一用户。
26.可选地,所述根据所述业务质量信息,计算所述目标用户与所述其他用户的业务质量相似度,包括:
27.通过公式:
28.计算所述业务质量相似度;
29.其中,x表示所述目标用户,y表示所述其他用户,cos(x,y)表示所述目标用户与所述其他用户的业务质量相似度,n表示所述业务质量的参数个数,xi表示所述目标用户的第i个业务质量的参数值,yi表示所述其他用户的第i个业务质量的参数值。
30.可选地,所述根据所述用户行为信息,计算所述目标用户和所述其他用户的用户行为相似度,包括:
31.通过公式:
32.计算所述用户行为相似度;
33.其中,a表示所述目标用户,b表示所述其他用户,cos(a,b)表示所述目标用户与所述其他用户的用户行为相似度,m表示所述用户行为的参数个数,aj表示所述目标用户的第j个用户行为的参数值,bj表示所述其他用户的第j个用户行为的参数值;
34.计算所述目标用户的用户行为权重;
35.根据所述用户行为权重以及所述用户行为相似度,计算所述用户行为相似度的最终值。
36.可选地,所述根据所述目标用户的评价相关数据以及所述数据均值,分别计算所述目标用户在不同数据类型的数据偏差度,包括:
37.将所述目标用户在第一数据类型中的评价数据,与所述第一数据类型的数据均值进行对比,得到所述目标用户在所述第一数据类型的数据偏差度。
38.可选地,所述利用所述评价偏向度对所述目标用户的测评数据进行校正处理,包括:
39.将所述目标用户的测评数据与所述评价偏向度相除,得到校正后的测评数据结果。
40.为达到上述目的,本发明的实施例提供一种数据校正装置,包括
41.第一获取模块,用于获取目标用户的评价相关数据;
42.第二获取模块,用于根据所述评价相关数据获得所述目标用户的评价偏向度;
43.处理模块,用于利用所述评价偏向度对所述目标用户的测评数据进行校正处理。
44.可选地,所述评价相关数据包括以下数据类型中的至少一项:
45.用户参加的历史调研数据;
46.用户的投诉数据;
47.用户的互联网内容评分数据。
48.可选地,所述第二获取模块包括:
49.第一计算单元,用于分别计算所述评价相关数据中不同数据类型对应的数据偏差度;
50.第二计算单元,用于对所述不同数据类型对应的数据偏差度进行加权求和,获得所述目标用户的评价偏向度。
51.可选地,所述第一计算单元包括:
52.确定子单元,用于确定与所述目标用户的业务质量以及用户行为相似的至少一个第一用户;
53.第一获取子单元,用于获取所述第一用户的评价相关数据;
54.第一计算子单元,用于根据所述第一用户的评价相关数据,分别计算不同数据类型的数据均值;
55.第三计算子单元,用于根据所述目标用户的评价相关数据以及所述数据均值,分别计算所述目标用户在不同数据类型的数据偏差度。
56.可选地,所述确定子单元具体用于:
57.分别获取所述目标用户和除所述目标用户外的其他用户的业务质量信息以及用户行为信息;
58.根据所述业务质量信息,计算所述目标用户与所述其他用户的业务质量相似度;
59.根据所述用户行为信息,计算所述目标用户和所述其他用户的用户行为相似度;
60.在所述业务质量相似度和所述用户行为相似度满足预设条件的情况下,确定所述其他用户为所述第一用户。
61.可选地,所述根据所述业务质量信息,计算所述目标用户与所述其他用户的业务质量相似度,包括:
62.通过公式:
63.计算所述业务质量相似度;
64.其中,x表示所述目标用户,y表示所述其他用户,cos(x,y)表示所述目标用户与所述其他用户的业务质量相似度,n表示所述业务质量的参数个数,xi表示所述目标用户的第i个业务质量的参数值,yi表示所述其他用户的第i个业务质量的参数值。
65.可选地,所述根据所述用户行为信息,计算所述目标用户和所述其他用户的用户行为相似度,包括:
66.通过公式:
67.计算所述用户行为相似度;
68.其中,a表示所述目标用户,b表示所述其他用户,cos(a,b)表示所述目标用户与所述其他用户的用户行为相似度,m表示所述用户行为的参数个数,aj表示所述目标用户的第j个用户行为的参数值,bj表示所述其他用户的第j个用户行为的参数值;
69.计算所述目标用户的用户行为权重;
70.根据所述用户行为权重以及所述用户行为相似度,计算所述用户行为相似度的最终值。
71.可选地,所述第三计算子单元具体用于:将所述目标用户在第一数据类型中的评价数据,与所述第一数据类型的数据均值进行对比,得到所述目标用户在所述第一数据类型的数据偏差度。
72.可选地,所述处理模块具体用于:将所述目标用户的测评数据与所述评价偏向度相除,得到校正后的测评数据结果。
73.为达到上述目的,本发明的实施例提供一种电子设备,包括处理器和收发器,其中,
74.所述收发器用于获取目标用户的评价相关数据;
75.根据所述评价相关数据获得所述目标用户的评价偏向度;
76.所述处理器用于利用所述评价偏向度对所述目标用户的测评数据进行校正处理。
77.可选地,所述评价相关数据包括以下数据类型中的至少一项:
78.用户参加的历史调研数据;
79.用户的投诉数据;
80.用户的互联网内容评分数据。
81.可选地,所述根据所述评价相关数据获得所述目标用户的评价偏向度,包括:
82.分别计算所述评价相关数据中不同数据类型对应的数据偏差度;
83.对所述不同数据类型对应的数据偏差度进行加权求和,获得所述目标用户的评价偏向度。
84.可选地,所述分别计算所述评价相关数据中不同数据类型对应的数据偏差度,包括:
85.确定与所述目标用户的业务质量以及用户行为相似的至少一个第一用户;
86.获取所述第一用户的评价相关数据;
87.根据所述第一用户的评价相关数据,分别计算不同数据类型的数据均值;
88.根据所述目标用户的评价相关数据以及所述数据均值,分别计算所述目标用户在不同数据类型的数据偏差度。
89.可选地,所述确定与所述目标用户的业务质量以及用户行为相似的至少一个第一用户,包括:
90.分别获取所述目标用户和除所述目标用户外的其他用户的业务质量信息以及用户行为信息;
91.根据所述业务质量信息,计算所述目标用户与所述其他用户的业务质量相似度;
92.根据所述用户行为信息,计算所述目标用户和所述其他用户的用户行为相似度;
93.在所述业务质量相似度和所述用户行为相似度满足预设条件的情况下,确定所述其他用户为所述第一用户。
94.可选地,所述根据所述业务质量信息,计算所述目标用户与所述其他用户的业务质量相似度,包括:
95.通过公式:
96.计算所述业务质量相似度;
97.其中,x表示所述目标用户,y表示所述其他用户,cos(x,y)表示所述目标用户与所述其他用户的业务质量相似度,n表示所述业务质量的参数个数,xi表示所述目标用户的第i个业务质量的参数值,yi表示所述其他用户的第i个业务质量的参数值。
98.可选地,所述根据所述用户行为信息,计算所述目标用户和所述其他用户的用户行为相似度,包括:
99.通过公式:
100.计算所述用户行为相似度;
101.其中,a表示所述目标用户,b表示所述其他用户,cos(a,b)表示所述目标用户与所述其他用户的用户行为相似度,m表示所述用户行为的参数个数,aj表示所述目标用户的第j个用户行为的参数值,bj表示所述其他用户的第j个用户行为的参数值;
102.计算所述目标用户的用户行为权重;
103.根据所述用户行为权重以及所述用户行为相似度,计算所述用户行为相似度的最终值。
104.可选地,所述根据所述目标用户的评价相关数据以及所述数据均值,分别计算所述目标用户在不同数据类型的数据偏差度,包括:
105.将所述目标用户在第一数据类型中的评价数据,与所述第一数据类型的数据均值进行对比,得到所述目标用户在所述第一数据类型的数据偏差度。
106.可选地,所述利用所述评价偏向度对所述目标用户的测评数据进行校正处理,包括:
107.将所述目标用户的测评数据与所述评价偏向度相除,得到校正后的测评数据结果。
108.为达到上述目的,本发明的实施例提供一种电子设备,包括收发器、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令;所述处理器执行所程序或指令时实现如上所述的数据校正方法。
109.为达到上述目的,本发明的实施例提供一种可读存储介质,其上存储有程序或指令,所述程序或指令被处理器执行时实现如上所述的数据校正方法中的步骤。
110.本发明的上述技术方案的有益效果如下:
111.本技术的实施例,通过对用户的评价相关数据进行分析,综合计算用户评价偏向,并以用户的评价偏向度校正用户的测评数据,校正因个别用户评价偏差较大导致的测评结果偏差问题,能够保证测评结果的准确性。
附图说明
112.图1为本发明实施例的数据校正方法的流程示意图;
113.图2为本发明实施例的数据校正装置的结构示意图之一;
114.图3为本发明实施例的数据校正装置的结构示意图之二;
115.图4为本发明实施例的电子设备的结构示意图之一;
116.图5为本发明实施例的电子设备的结构示意图之二。
具体实施方式
117.为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
118.应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。
119.在本发明的各种实施例中,应理解,下述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
120.另外,本文中术语“系统”和“网络”在本文中常可互换使用。
121.在本技术所提供的实施例中,应理解,“与a相应的b”表示b与a相关联,根据a可以确定b。但还应理解,根据a确定b并不意味着仅仅根据a确定b,还可以根据a和/或其它信息确定b。
122.如图1所示,本发明实施例的一种数据校正方法,包括:
123.步骤101、获取目标用户的评价相关数据。
124.具体地,所述评价相关数据可以包括:用户参加的历史调研数据;用户的投诉数据;用户的互联网内容评分数据。所述评价相关数据还可以包括其他数据,如:基本信息、业务订购等。
125.步骤102、根据所述评价相关数据获得所述目标用户的评价偏向度。
126.根据所述评价相关数据,针对不同数据类型分别计算评价偏向度,并根据各个数据类型的评价偏向度,计算所述目标用户总的评价偏向。例如:对于所述评价相关数据中的用户的投诉数据,计算用户在投诉类型数据的偏向度,从而能够得知用户对于投诉的偏向;对于所述评价相关数据中的互联网内容评分数据,计算用户在评分类型数据的偏向度,从而得知该用户更偏向于评高分或者低分。
127.步骤103、利用所述评价偏向度对所述目标用户的测评数据进行校正处理。
128.利用计算得到的所述目标用户的评价偏向度,对所述目标用户的测评数据进行校正处理,校正因个别用户评价偏差较大导致的测评结果偏差问题,能够保证测评结果的准确性。
129.本技术的实施例,通过对用户的评价相关数据进行分析,综合计算用户评价偏向,并以用户的评价偏向度校正用户的测评数据,校正因个别用户评价偏差较大导致的测评结果偏差问题,能够保证测评结果的准确性,能够解决因个别样本导致的结果偏差问题。
130.具体地,所述评价相关数据包括以下数据类型中的至少一项:
131.a:用户参加的历史调研数据。如参与过历史某段时间内各业务用户满意度调研的用户相关信息和调查结果数据。
132.b:用户的投诉数据。例如用户对重点业务(如4g、家宽、语音等)的相关投诉数据,包括投诉文本和语音信息等。
133.c:用户的互联网内容评分数据。用户在应用程序或者网站媒体上对商品、内容进行的评分数据。
134.所述评价相关数据还可以包括用户其他数据,如用户基本信息、通信业务订购等。该实施例中,分别采集不同数据类型对应的数据,并利用各个数据类型分别计算用户的评价偏向度,基于用户的历史调研数据、业务投诉数据、互联网内容评分数据等多维数据分析,综合计算用户评价偏向,并以此校正测评结果,能够保障测评数据的准确性。
135.进一步地,所述步骤102可以包括:分别计算所述评价相关数据中不同数据类型对应的数据偏差度;对所述不同数据类型对应的数据偏差度进行加权求和,获得所述目标用户的评价偏向度。
136.具体地,所述分别计算所述评价相关数据中不同数据类型对应的数据偏差度,包括:确定与所述目标用户的业务质量以及用户行为相似的至少一个第一用户;获取所述第一用户的评价相关数据;根据所述第一用户的评价相关数据,分别计算不同数据类型的数据均值;根据所述目标用户的评价相关数据以及所述数据均值,分别计算所述目标用户在不同数据类型的数据偏差度。
137.所述业务质量可以为业务质量指标,如网络质量,涉及网络响应时延、上传/下载速率、丢包率、信号强度、卡顿次数、网络请求成功率、掉线等指标。所述用户行为例如用户上网使用行为,具体可涉及:访问网站/应用程序类型(如视频类、搜索类、即时通讯类等)、每个网站/应用程序的访问时长、访问次数、流量消耗等行为数据。
138.根据所述业务质量的相关数据以及用户行为的相关数据,对业务质量和用户行为相似的用户进行聚类,即寻找与目标用户在特定业务指标相似、业务使用行为相仿的其他用户,以这些用户为一个群组,计算该群组的不同数据类型的数据均值,进而根据所述均值计算该群组中每个用户与均值的数据偏差度。
139.具体地,所述确定与所述目标用户的业务质量以及用户行为相似的至少一个第一用户,包括:
140.分别获取所述目标用户和除所述目标用户外的其他用户的业务质量信息以及用户行为信息;根据所述业务质量信息,计算所述目标用户与所述其他用户的业务质量相似度;根据所述用户行为信息,计算所述目标用户和所述其他用户的用户行为相似度;在所述业务质量相似度和所述用户行为相似度满足预设条件的情况下,确定所述其他用户为所述第一用户。
141.所述根据所述业务质量信息,计算所述目标用户与所述其他用户的业务质量相似度,包括:
142.通过公式:
143.计算所述业务质量相似度;
144.其中,x表示所述目标用户,y表示所述其他用户,cos(x,y)表示所述目标用户与所述其他用户的业务质量相似度,n表示所述业务质量的参数个数,xi表示所述目标用户的第i个业务质量的参数值,yi表示所述其他用户的第i个业务质量的参数值。
145.所述根据所述用户行为信息,计算所述目标用户和所述其他用户的用户行为相似度,包括:
146.通过公式:
147.计算所述用户行为相似度;
148.其中,a表示所述目标用户,b表示所述其他用户,cos(a,b)表示所述目标用户与所述其他用户的用户行为相似度,m表示所述用户行为的参数个数,aj表示所述目标用户的第j个用户行为的参数值,bj表示所述其他用户的第j个用户行为的参数值;
149.计算所述目标用户的用户行为权重;根据所述用户行为权重以及所述用户行为相似度,计算所述用户行为相似度的最终值。
150.在根据所述业务质量相似度和所述用户行为相似度确定所述第一用户后,利用所述第一用户和所述目标用户形成为一个群组,计算该群组的不同数据类型的数据均值,进而根据所述均值分别计算所述目标用户在不同数据类型的数据偏差度。具体地,所述根据所述目标用户的评价相关数据以及所述数据均值,分别计算所述目标用户在不同数据类型的数据偏差度,可以包括:将所述目标用户在第一数据类型中的评价数据,与所述第一数据类型的数据均值进行对比,得到所述目标用户在所述第一数据类型的数据偏差度。
151.下面以所述评价相关数据包括用户参加的历史调研数据、用户的投诉数据以及用户的互联网内容评分数据为例,说明在通信业务领域,针对不同类型数据获得用户的评价偏向度的具体实现过程。
152.一、针对用户参加的历史调研数据的评价偏向度。
153.以家宽/4g性能指标为例,首先获取业务质量、用户行为相关的数据,所述业务质量为网络质量,所述用户行为为用户上网行为,计算网络质量相似、上网行为相似的用户,根据这些用户满意度调研分数的均值,计算当前用户的数据偏差度。
154.(1):用户网络质量相似度计算。
155.获取与用户网络质量感知相关的数据,具体网络质量指标可涉及:网络响应时延、上传/下载速率、丢包率、信号强度、卡顿次数、网络请求成功率、掉线等指标,根据上述数据得到每个用户的网络质量指标向量表示为:
156.[i1,i2,

ik,
…in
],其中n表示网络质量指标的个数,ik表示用户在第k个网络质量指标上的值。
[0157]
由于各指标值取值范围不一致,对不同用户网络质量相似度计算影响较大,所以需要将各个指标值进行标准化,可采用如下两种方式:
[0158]
0-1标准化:即数据归一化、最大值-最小值标准化,将原始指标值缩放到0~1之间的区间内。计算如下:
[0159]
x

=(x-min)/(max-min)
[0160]
其中min为指标x上各用户取值的最大值,min为最小值。
[0161]
z-score标准化:将原始指标值标准化为均值为0、标准化为1的正态分布计算如下:
[0162]
x

=(x-mean)/σ
[0163]
其中mean为指标x上各用户取值的均值,σ为方差。
[0164]
根据以上方法得到每个用户的各指标归一化后的网络质量向量。将用户x,y的网络质量向量分别表示为:[x1,x2,

,xn],[y1,y2,

,yn],则两个用户的网络质量相似度可用两向量之间的余弦相似度表示,具体如下:
[0165][0166]
由此得到x,y量用户的网络质量相似度。
[0167]
(2):用户上网行为相似度计算。
[0168]
获取与用户上网使用行为相关的数据,具体可涉及:访问网站/app类型(如视频类、搜索类、即时通讯类等)、每个网站/app的访问时长、访问次数、流量消耗等行为数据。
[0169]
首先,计算x,y两用户在每类网站/应用程序上的访问行为相似度,可采用与网络质量相似度计算相似的方式,具体为:构建用户在每个网站/应用程序上的使用行为向量,对向量中每个指标取值进行标准化,利用余弦相似度得到用户在每类网站/应用程序上的访问行为相似度。
[0170]
其次,计算用户在每类网站/应用程序上的偏好权重,可采用如下方式:
[0171][0172]
其中,其中ti、fi、di分别表示用户在某个网站/应用程序类型i上的使用时长、次数、流量,t
all
、f
all
、d
all
分别表示用户总上网时长、次数、流量,α为各部分权重,且α1+α2+α3=1。
[0173]
最后,基于用户在每类网站/应用程序上的访问行为相似度及权重,进行加权求和后,得到x、y两用户的上网行为相似度。
[0174]
(3):用户的历史调研数据的评价偏向度计算。
[0175]
根据上述步骤(1)和(2)中的网络质量相似度和用户上网行为相似度,确定网络质量相似、上网行为相似的用户构建群组,群组内的用户数大于等于1。如果某一群组中用户数量较少,低于预设阈值,将群组与邻近的群组合并,即将其与网络质量和上网行为相似的群组合并处理。
[0176]
其中,与用户u网络质量相似、用户行为相似的用户集合(群组)可以表示为:set(su),集合中的用户的个数可以为n。
[0177]
(4):历史调研数据的评价偏向度计算。
[0178]
将群组set(su)中每个用户u评价分值与该群组中所有用户测评分数的均值进行对比,得到当前用户调研数据中的满意度测评偏差度,表示如下:
[0179][0180]
其中,nps(u)为当前用户的历史调研数据中的满意度调研结果值,dv1(u)即为用户u在历史调研数据中的满意度测评偏差度。
[0181]
二、针对用户的投诉数据的评价偏向度。
[0182]
针对用户投诉数据,分析用户的投诉评价强度偏向。首先,根据投诉数据,计算每个用户投诉评价强度;然后,根据历史投诉用户,寻找与该用户在特定业务质量指标相似、业务使用行为相似的用户,并建立群组,计算该用户与群组中所有用户投诉强度均值的比值,得到该用户的投诉偏向度。
[0183]
以家宽业务投诉为例,首先计算每个投诉用户投诉评价强度,具体的实现方法如下:
[0184]
1):构建情感词词典(如差、卡、慢、好等)、程度副词词典(如很、非常、有点等)、否定词词典(如不、不是等),每个词都赋予一定的强度值;
[0185]
2):对每条投诉文本进行句法依存关系分析;
[0186]
3):根据句法依存关系规则,提取情感词、程度副词、否定词的词对等;
[0187]
4):根据情感词、否定词得到情感倾向,根据程度副词强度,计算各个词对的情感强度;
[0188]
5):各词对情感强度加和后,得到单个投诉文本的情感强度;
[0189]
6):基于单个投诉文本的投诉强度,综合用户对同一业务问题的投诉次数,得到用户的整体投诉情感强度。
[0190]
然后,获取家宽网络性能、用户上网行为相关的数据,按照上述“针对用户参加的历史调研数据的评价偏向度”中用户调研偏好方案中的方法找到网络质量相似、上网行为相似的用户群组,根据群组中用户投诉强度的均值,计算当前用户的投诉情感强度偏向度。具体实现方法与上述的历史调研数据的评价偏向度的方法类似,在次此不做赘述。
[0191]
三、针对用户的互联网内容评分数据的评价偏向度。
[0192]
针对用户对商品或数字内容(图书、音乐等)的行为数据,寻找与该用户行为偏好相似的用户,并建立群组,计算每个用户与群组中所有人对同一商品评分均值的比值,得到用户的商品评分偏向度。
[0193]
具体计算方法具体如下:
[0194]
a):构建商品内容标签;
[0195]
b):提取用户行为数据,包括点击、购买、评论评分等行为,提取用户访问过的商品;
[0196]
c):根据a)、b),构建用户偏好标签;
[0197]
d):基于用户偏好标签,计算用户与用户之间的相似度,并建立群组;
[0198]
e):采用上述相似的方法计算每个用户与群组中所有人对同一商品评分的均值偏向,得到用户的商品评分偏向度。
[0199]
四、根据历史调研数据得到的评价偏向度、投诉数据得到的评价偏向度以及互联网内容评分数据得到的评价偏向度,计算用户的总评价偏向度。
[0200]
将以上基于历史调研数据计算出的用户调查偏向度dv1、基于用户投诉数据计算出的用户投诉偏向度dv2、基于用户互联网内容评分数据计算出的用户网络评价偏向度dv3,进行加权求和,得到用户间的总评价偏向度dv,如下:
[0201]
dv(u)=α1dv1+α2dv2+α3dv3[0202]
其中,dv(u)表示用户u的总评价偏向度,其中,α1、α2、α3为各部分权重,是贡献参数,且α1+α2+α3=1。
[0203]
可选地,所述利用所述评价偏向度对所述目标用户的测评数据进行校正处理,包括:将所述目标用户的测评数据与所述评价偏向度相除,得到校正后的测评数据结果。
[0204]
根据计算得到的所述评价偏向度对所述目标用户的测评数据进行校正计算,重新计算和评估用户调查测评结果。用户调查结果数据校正示例:
[0205]
用户用户总体评价偏好度用户原始调查结果最终校正结果用户a0.988.9用户b188用户c1.187.3
[0206]
在对用户的测评数据校正后,可以根据校正的测评结果数据进行多维交叉分析,挖掘和洞察业务问题。并根据调查效果,并调整算法。
[0207]
本技术的实施例,通过对用户的评价相关数据进行分析,综合计算用户评价偏向,并以用户的评价偏向度校正用户的测评数据,校正因个别用户评价偏差较大导致的测评结果偏差问题,能够保证测评结果的准确性,能够解决因个别样本导致的结果偏差问题。
[0208]
如图2所示,本发明实施例还提供一种数据校正装置200,包括:
[0209]
第一获取模块210,用于获取目标用户的评价相关数据;
[0210]
第二获取模块220,用于根据所述评价相关数据获得所述目标用户的评价偏向度;
[0211]
处理模块230,用于利用所述评价偏向度对所述目标用户的测评数据进行校正处理。
[0212]
可选地,所述评价相关数据包括以下数据类型中的至少一项:
[0213]
用户参加的历史调研数据;
[0214]
用户的投诉数据;
[0215]
用户的互联网内容评分数据。
[0216]
可选地,所述第二获取模块包括:
[0217]
第一计算单元,用于分别计算所述评价相关数据中不同数据类型对应的数据偏差度;
[0218]
第二计算单元,用于对所述不同数据类型对应的数据偏差度进行加权求和,获得所述目标用户的评价偏向度。
[0219]
可选地,所述第一计算单元包括:
[0220]
确定子单元,用于确定与所述目标用户的业务质量以及用户行为相似的至少一个第一用户;
[0221]
第一获取子单元,用于获取所述第一用户的评价相关数据;
[0222]
第一计算子单元,用于根据所述第一用户的评价相关数据,分别计算不同数据类型的数据均值;
[0223]
第三计算子单元,用于根据所述目标用户的评价相关数据以及所述数据均值,分别计算所述目标用户在不同数据类型的数据偏差度。
[0224]
可选地,所述确定子单元具体用于:
[0225]
分别获取所述目标用户和除所述目标用户外的其他用户的业务质量信息以及用户行为信息;
[0226]
根据所述业务质量信息,计算所述目标用户与所述其他用户的业务质量相似度;
[0227]
根据所述用户行为信息,计算所述目标用户和所述其他用户的用户行为相似度;
[0228]
在所述业务质量相似度和所述用户行为相似度满足预设条件的情况下,确定所述其他用户为所述第一用户。
[0229]
可选地,所述根据所述业务质量信息,计算所述目标用户与所述其他用户的业务质量相似度,包括:
[0230]
通过公式:
[0231]
计算所述业务质量相似度;
[0232]
其中,x表示所述目标用户,y表示所述其他用户,cos(x,y)表示所述目标用户与所述其他用户的业务质量相似度,n表示所述业务质量的参数个数,xi表示所述目标用户的第i个业务质量的参数值,yi表示所述其他用户的第i个业务质量的参数值。
[0233]
可选地,所述根据所述用户行为信息,计算所述目标用户和所述其他用户的用户行为相似度,包括:
[0234]
通过公式:
[0235]
计算所述用户行为相似度;
[0236]
其中,a表示所述目标用户,b表示所述其他用户,cos(a,b)表示所述目标用户与所述其他用户的用户行为相似度,m表示所述用户行为的参数个数,aj表示所述目标用户的第j个用户行为的参数值,bj表示所述其他用户的第j个用户行为的参数值;
[0237]
计算所述目标用户的用户行为权重;
[0238]
根据所述用户行为权重以及所述用户行为相似度,计算所述用户行为相似度的最终值。
[0239]
可选地,所述第三计算子单元具体用于:将所述目标用户在第一数据类型中的评价数据,与所述第一数据类型的数据均值进行对比,得到所述目标用户在所述第一数据类型的数据偏差度。
[0240]
可选地,所述处理模块具体用于:将所述目标用户的测评数据与所述评价偏向度相除,得到校正后的测评数据结果。
[0241]
下面以所述评价相关数据包括:用户参加的历史调研数据、用户的投诉数据以及用户的互联网内容评分数据为例,说明本发明实施例的数据校正装置的结构,如图3所示。
[0242]
所述装置包括用户数据采集模块310,采集用户的历史调查数据、用户投诉数据、互联网内容评分数据,及其他数据,如基本信息、业务订购等;
[0243]
用户评价偏向计算模块320,包括用户调研数据评价偏向计算单元321、用户投诉数据评价偏向计算单元322、用户互联网内容评分偏向计算单元323;用户总评价偏向计算单元324,用于根据以上各单元的输出,计算最终用户评价偏向;
[0244]
用户测评结果校正模块330,用于根据用户总评价偏向计算模块,对用户的满意度测评结果进行校正计算,得到最终用户最终的测评结果;
[0245]
数据分析和问题挖掘模块340:用于根据校正的测评数据进行多维交叉分析,挖掘和洞察业务问题,并根据调查效果,并调整算法。
[0246]
本技术的实施例,通过对用户的评价相关数据进行分析,综合计算用户评价偏向,并以用户的评价偏向度校正用户的测评数据,校正因个别用户评价偏差较大导致的测评结果偏差问题,能够保证测评结果的准确性,能够解决因个别样本导致的结果偏差问题。
[0247]
在此需要说明的是,本发明实施例提供的上述数据校正装置,能够实现上述的数据校正方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
[0248]
如图4所示,本发明实施例的一种电子设备400,包括处理器410和收发器420,其中,
[0249]
所述收发器420用于获取目标用户的评价相关数据;
[0250]
根据所述评价相关数据获得所述目标用户的评价偏向度;
[0251]
所述处理器410用于利用所述评价偏向度对所述目标用户的测评数据进行校正处理。
[0252]
可选地,所述评价相关数据包括以下数据类型中的至少一项:
[0253]
用户参加的历史调研数据;
[0254]
用户的投诉数据;
[0255]
用户的互联网内容评分数据。
[0256]
可选地,所述根据所述评价相关数据获得所述目标用户的评价偏向度,包括:
[0257]
分别计算所述评价相关数据中不同数据类型对应的数据偏差度;
[0258]
对所述不同数据类型对应的数据偏差度进行加权求和,获得所述目标用户的评价偏向度。
[0259]
可选地,所述分别计算所述评价相关数据中不同数据类型对应的数据偏差度,包括:
[0260]
确定与所述目标用户的业务质量以及用户行为相似的至少一个第一用户;
[0261]
获取所述第一用户的评价相关数据;
[0262]
根据所述第一用户的评价相关数据,分别计算不同数据类型的数据均值;
[0263]
根据所述目标用户的评价相关数据以及所述数据均值,分别计算所述目标用户在不同数据类型的数据偏差度。
[0264]
可选地,所述确定与所述目标用户的业务质量以及用户行为相似的至少一个第一用户,包括:
[0265]
分别获取所述目标用户和除所述目标用户外的其他用户的业务质量信息以及用户行为信息;
[0266]
根据所述业务质量信息,计算所述目标用户与所述其他用户的业务质量相似度;
[0267]
根据所述用户行为信息,计算所述目标用户和所述其他用户的用户行为相似度;
[0268]
在所述业务质量相似度和所述用户行为相似度满足预设条件的情况下,确定所述其他用户为所述第一用户。
[0269]
可选地,所述根据所述业务质量信息,计算所述目标用户与所述其他用户的业务质量相似度,包括:
[0270]
通过公式:
[0271]
计算所述业务质量相似度;
[0272]
其中,x表示所述目标用户,y表示所述其他用户,cos(x,y)表示所述目标用户与所述其他用户的业务质量相似度,n表示所述业务质量的参数个数,xi表示所述目标用户的第i个业务质量的参数值,yi表示所述其他用户的第i个业务质量的参数值。
[0273]
可选地,所述根据所述用户行为信息,计算所述目标用户和所述其他用户的用户行为相似度,包括:
[0274]
通过公式:
[0275]
计算所述用户行为相似度;
[0276]
其中,a表示所述目标用户,b表示所述其他用户,cos(a,b)表示所述目标用户与所述其他用户的用户行为相似度,m表示所述用户行为的参数个数,aj表示所述目标用户的第j个用户行为的参数值,bj表示所述其他用户的第j个用户行为的参数值;
[0277]
计算所述目标用户的用户行为权重;
[0278]
根据所述用户行为权重以及所述用户行为相似度,计算所述用户行为相似度的最终值。
[0279]
可选地,所述根据所述目标用户的评价相关数据以及所述数据均值,分别计算所述目标用户在不同数据类型的数据偏差度,包括:
[0280]
将所述目标用户在第一数据类型中的评价数据,与所述第一数据类型的数据均值进行对比,得到所述目标用户在所述第一数据类型的数据偏差度。
[0281]
可选地,所述利用所述评价偏向度对所述目标用户的测评数据进行校正处理,包括:
[0282]
将所述目标用户的测评数据与所述评价偏向度相除,得到校正后的测评数据结果。
[0283]
本技术的实施例,通过对用户的评价相关数据进行分析,综合计算用户评价偏向,并以用户的评价偏向度校正用户的测评数据,校正因个别用户评价偏差较大导致的测评结果偏差问题,能够保证测评结果的准确性,能够解决因个别样本导致的结果偏差问题。
[0284]
本发明另一实施例的电子设备,如图5所示,包括收发器510、处理器500、存储器520及存储在所述存储器520上并可在所述处理器500上运行的程序或指令;所述处理器500执行所述程序或指令时实现上述数据校正方法。
[0285]
所述收发器510,用于在处理器500的控制下接收和发送数据。
[0286]
其中,在图5中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器500代表的一个或多个处理器和存储器520代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发器510可以是多个元件,即包括发送机和接收机,提供用于在传输介质上与各种其他装置通信的单元。处理器500负责管理总线架构和通常的处理,存储器520可以存储处理器500在执行操作时所使用的数据。
[0287]
本发明实施例的一种可读存储介质,其上存储有程序或指令,所述程序或指令被处理器执行时实现如上所述的数据校正方法中的步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0288]
其中,所述处理器为上述实施例中所述的数据校正方法的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等。
[0289]
进一步需要说明的是,此说明书中所描述的电子设备包括但不限于智能手机、平板电脑等,且所描述的许多功能部件都被称为模块,以便更加特别地强调其实现方式的独立性。
[0290]
本发明实施例中,模块可以用软件实现,以便由各种类型的处理器执行。举例来说,一个标识的可执行代码模块可以包括计算机指令的一个或多个物理或者逻辑块,举例来说,其可以被构建为对象、过程或函数。尽管如此,所标识模块的可执行代码无需物理地位于一起,而是可以包括存储在不同位里上的不同的指令,当这些指令逻辑上结合在一起时,其构成模块并且实现该模块的规定目的。
[0291]
实际上,可执行代码模块可以是单条指令或者是许多条指令,并且甚至可以分布在多个不同的代码段上,分布在不同程序当中,以及跨越多个存储器设备分布。同样地,操作数据可以在模块内被识别,并且可以依照任何适当的形式实现并且被组织在任何适当类型的数据结构内。所述操作数据可以作为单个数据集被收集,或者可以分布在不同位置上(包括在不同存储设备上),并且至少部分地可以仅作为电子信号存在于系统或网络上。
[0292]
在模块可以利用软件实现时,考虑到现有硬件工艺的水平,所以可以以软件实现的模块,在不考虑成本的情况下,本领域技术人员都可以搭建对应的硬件电路来实现对应的功能,所述硬件电路包括常规的超大规模集成(vlsi)电路或者门阵列以及诸如逻辑芯片、晶体管之类的现有半导体或者是其它分立的元件。模块还可以用可编程硬件设备,诸如现场可编程门阵列、可编程阵列逻辑、可编程逻辑设备等实现。
[0293]
上述范例性实施例是参考该些附图来描述的,许多不同的形式和实施例是可行而不偏离本发明精神及教示,因此,本发明不应被建构成为在此所提出范例性实施例的限制。更确切地说,这些范例性实施例被提供以使得本发明会是完善又完整,且会将本发明范围传达给那些熟知此项技术的人士。在该些图式中,组件尺寸及相对尺寸也许基于清晰起见而被夸大。在此所使用的术语只是基于描述特定范例性实施例目的,并无意成为限制用。如在此所使用地,除非该内文清楚地另有所指,否则该单数形式“一”、“一个”和“该”是意欲将该些多个形式也纳入。会进一步了解到该些术语“包含”及/或“包括”在使用于本说明书时,表示所述特征、整数、步骤、操作、构件及/或组件的存在,但不排除一或更多其它特征、整
数、步骤、操作、构件、组件及/或其族群的存在或增加。除非另有所示,陈述时,一值范围包含该范围的上下限及其间的任何子范围。
[0294]
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1