基于大数据的问卷调查数据处理方法、装置及存储介质与流程

文档序号:23005957发布日期:2020-11-20 11:57阅读:271来源:国知局
基于大数据的问卷调查数据处理方法、装置及存储介质与流程

本申请涉及大数据技术领域,具体涉及一种基于大数据的问卷调查数据处理方法、装置及存储介质。



背景技术:

随着信息科技的不断发展,各行业的数据量与日俱增、数据采集方式也发生了巨大的变化,而在统计调查行业,数据采集方式仍以入户调查、电话访问等真人接触式调查。当调查对象因各种原因不能或不愿接受入户调查时,电话访问成为采集相关数据的重要替代方案。然而,在当今的电访调查工作中,占主导地位的传统的人工拨打电话形式存在以下问题:一是损耗大量的时间和人力;二是对电访员的要求较高,前期培训成本较高;三是人工访问的话术因人而异,标准化、规范化程度难以得到保证;四是人工记录问题答案时常常因为反应不及时而记错或漏记关键信息;五是电访员容易因被访者的不配合或故意刁难而出现情绪波动,影响后续工作稳定性,因此,如何提升调查数据的处理效率问题亟待解决。



技术实现要素:

本申请实施例提供了一种基于大数据的问卷调查数据处理方法、装置及存储介质,能够提升调查数据的处理效率。

第一方面,本申请实施例提供一种基于大数据的问卷调查数据处理方法,应用于电子设备,所述方法包括:

根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据,所述调查数据包括针对所述初始调查问卷的多份已填写的调查问卷,所述初始调查问卷包括包括主观题集和客观题集,所述主观题集至少包括一道主观题,所述客观题集至少包括一道客观题,所述调查脚本基础库为针对所述初始调查问卷的调查脚本;

调用所述调查数据对所述调查脚本基础库进行机器学习,得到调查原始数据库;

对所述调查原始数据库进行数据处理,得到有效调查数据库。

第二方面,本申请实施例提供一种基于大数据的问卷调查数据处理装置,应用于电子设备,所述装置包括:调查单元、学习单元和处理单元,其中,

所述调查单元,用于根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据,所述调查数据包括针对所述初始调查问卷的多份已填写的调查问卷,所述初始调查问卷包括包括主观题集和客观题集,所述主观题集至少包括一道主观题,所述客观题集至少包括一道客观题,所述调查脚本基础库为针对所述初始调查问卷的调查脚本;

所述学习单元,用于调用所述调查数据对所述调查脚本基础库进行机器学习,得到调查原始数据库;

所述处理单元,用于对所述调查原始数据库进行数据处理,得到有效调查数据库。

第三方面,本申请实施例提供了一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。

第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。

第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

实施本申请实施例,具备如下有益效果:

可以看出,本申请实施例中所描述的基于大数据的问卷调查数据处理方法、装置及存储介质,应用于电子设备,根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据,调查数据包括针对初始调查问卷的多份已填写的调查问卷,初始调查问卷包括包括主观题集和客观题集,主观题集至少包括一道主观题,客观题集至少包括一道客观题,调查脚本基础库为针对初始调查问卷的调查脚本,调用调查数据对调查脚本基础库进行机器学习,得到调查原始数据库,对调查原始数据库进行数据处理,得到有效调查数据库,如此,一方面,能够通过机器学习优化调查脚本基础库,另一方面,还能通过对优化后的调查脚本基础库进一步优化,得到参考价值高的调查数据,有助于提升调查数据处理效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种电子设备的结构示意图;

图2是本申请实施例提供的一种基于大数据的问卷调查数据处理方法的流程示意图;

图3是本申请实施例提供的一种基于大数据的问卷调查数据处理方法的流程示意图;

图4是本申请实施例提供的一种电子设备的结构示意图;

图5是本申请实施例提供的一种基于大数据的问卷调查数据处理装置的功能单元组成框图。

具体实施方式

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请实施例中,电子设备可以包括各种具有无线通信功能的手持设备、车载设备、智能机器人、可穿戴设备(例如智能手表、智能眼镜、智能手环、计步器等)、路由器、智能相机(如智能单反摄像机、高速摄像机)、计算设备或通信连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(userequipment,ue),移动台(mobilestation,ms),终端设备(terminaldevice)、服务器等等。为方便描述,上面提到的设备统称为电子设备。

电子设备可以还可以包括智能家居设备,智能家居设备可以以下至少一种:智能音箱、智能电视、智能冰箱、智能洗衣机、智能饮水机、智能马桶、智能按摩椅、智能门控系统、智能门铃、智能开关面板、智能网关、智能路由器、智能摄像头等等,在此不做限定。

如图1所示,图1是本申请实施例提供的一种电子设备的结构示意图。该电子设备包括处理器、存储器、信号处理器、收发器、显示屏、扬声器、麦克风、随机存取存储器(randomaccessmemory,ram)、摄像头、传感器和网络模块等等。其中,存储器、dsp、扬声器、麦克风、ram、摄像头、传感器、网络模块与处理器连接,收发器与信号处理器连接。

其中,处理器是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器内的软体程序和/或模块,以及调用存储在存储器内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控,处理器可以为中央处理器(centralprocessingunit/processor,cpu)、图形处理器(graphicsprocessingunit,gpu)或者网络处理器(neural-networkprocessingunit,npu)。

进一步地,处理器可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器中。

其中,存储器用于存储软体程序和/或模块,处理器通过运行存储在存储器的软件程序和/或模块,从而执行电子设备的各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的软体程序等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

其中,传感器包括以下至少一种:光感传感器、陀螺仪、红外接近传感器、振动检测传感器,压力传感器等等。其中,光感传感器,也称为环境光传感器,用于检测环境光亮度。光线传感器可以包括光敏元件和模数转换器。其中,光敏元件用于将采集的光信号转换为电信号,模数转换器用于将上述电信号转换为数字信号。可选的,光线传感器还可以包括信号放大器,信号放大器可以将光敏元件转换的电信号进行放大后输出至模数转换器。上述光敏元件可以包括光电二极管、光电三极管、光敏电阻、硅光电池中的至少一种。

其中,该摄像头可以是可见光摄像头(一般视角摄像头、广角摄像头)、也可以是红外摄像头,还可以为双摄像头(具备测距功能),在此不作限定。

网络模块可以为以下至少一种:蓝牙模块、无线保真(wirelessfidelity,wi-fi)等等,在此不做限定。

为了提高电话访问的标准化、规范化程度,提升电话访问的效率,增强采集数据的有效性,确保调查工作顺利推进,市场调查行业采用智能机器设备和系统进行数据采集是大势所趋。鉴于相关技术中,智能对话机器人技术已相对成熟,在市场调查行业采用智能机器人开展电话访问调查具有较强的可操作性。

基于上述图1所描述的电子设备,能够执行如下基于大数据的问卷调查数据处理方法,具体步骤如下:

根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据,所述调查数据包括针对所述初始调查问卷的多份已填写的调查问卷,所述初始调查问卷包括包括主观题集和客观题集,所述主观题集至少包括一道主观题,所述客观题集至少包括一道客观题,所述调查脚本基础库为针对所述初始调查问卷的调查脚本;

调用所述调查数据对所述调查脚本基础库进行机器学习,得到调查原始数据库;

对所述调查原始数据库进行数据处理,得到有效调查数据库。

可以看出,本申请实施例中所描述的基于大数据的问卷调查数据处理方法,应用于电子设备,根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据,调查数据包括针对初始调查问卷的多份已填写的调查问卷,初始调查问卷包括包括主观题集和客观题集,主观题集至少包括一道主观题,客观题集至少包括一道客观题,调查脚本基础库为针对初始调查问卷的调查脚本,调用调查数据对调查脚本基础库进行机器学习,得到调查原始数据库,对调查原始数据库进行数据处理,得到有效调查数据库,如此,一方面,能够通过机器学习优化调查脚本基础库,另一方面,还能通过对优化后的调查脚本基础库进一步优化,得到参考价值高的调查数据,有助于提升调查数据处理效率。

请参阅图2,图2是本申请实施例提供的一种基于大数据的问卷调查数据处理方法的流程示意图,如图所示,应用于如图1所示的电子设备,本基于大数据的问卷调查数据处理方法包括:

201、根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据,所述调查数据包括针对所述初始调查问卷的多份已填写的调查问卷,所述初始调查问卷包括包括主观题集和客观题集,所述主观题集至少包括一道主观题,所述客观题集至少包括一道客观题,所述调查脚本基础库为针对所述初始调查问卷的调查脚本。

其中,初始调查问卷可以预先设置,初始调查问卷可以为针对至少一个主题的调查问卷,例如,食品调查问卷,选举调查问卷等等。初始调查问卷可以包括多个题目,初始调查问卷可以主观题集和客观题集,主观题集可以包括至少一道主观题,客观题集包括至少一道客观题。调查脚本基础库可以为针对初始调查问卷的调查脚本,具体可以理解为针对初始调查问卷中的题目的参考答案,一道题目可以对应一个或者多个参考答案。

具体实现中,电子设备可以根据初始调查问卷和调查脚本基础库进行对话调查,即电子设备依据初始调查问卷进行提问,用户针对提问进行回答,得到调查数据,该调查数据包括针对初始调查问卷的多份已填写的调查问卷,上述回答可以通过鼠标或者键盘或者触控显示屏输入,或者可以通过语音识别实现。

在一个可能的示例中,所述调查数据包括已填写的调查问卷i,所述调查问卷i包括调查答案j,上述步骤201,根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据,可以包括如下步骤:

21、获取对象i的影像信息;

22、依据所述影像信息确定所述对象i的目标状态值;

23、展示所述初始调查问卷中的题目j,所述题目j为客观题;

24、获取针对所述题目j的目标语音信息;

25、对所述目标语音信息进行语音识别,得到所述题目j的目标答案j;

26、从所述调查脚本基础库中获取所述题目j对应的第一参考答案;

27、确定所述目标答案j与所述第一参考答案之间的第一相似度;

28、依据所述目标状态值确定所述目标答案j的目标可信度;

29、依据所述目标可信度对所述第一相似度进行调整,得到第二相似度;

30、依据所述第二相似度对所述目标答案j进行筛选,得到所述调查答案j。

其中,电子设备可以包括摄像头,该摄像头的数量可以为一个或者多个,该摄像头可以包括双摄像头或者多摄像头,每一摄像头可以关注用户不同的部位,以对象i为例,对象i为参与调查问卷的任一用户,电子设备可以获取对象i的影像信息,该影像信息可以为以下至少一种:人脸、全身、半身、身体某一部位的影像等等,在此不做限定。由于用户的表情或者行为在一定程度上反应了用户的状态,因此,电子设备可以利用影像信息分析对象i的目标状态值。

进而,针对客观题而言,申请人在具体实践中发现,用户的状态直接决定了用户回答问题的发挥程度,即反应了回答的答案的可信度。电子设备可以展示初始调查问卷中的题目j,题目j为客观题,可以获取针对题目j的目标语音信息,对目标语音信息进行语音识别,得到题目j的目标答案j,相应地,电子设备还可以从调查脚本基础库中获取题目j对应的第一参考答案,确定目标答案j与第一参考答案之间的第一相似度,具体可以提取目标答案j或者第一参考答案中的特征,将两者的特征加以匹配,具体匹配算法可以为ssim或者其他相似度计算算法。

进一步地,电子设备中可以预先存储状态值与可信度之间的映射关系,依据该映射关系可以确定目标状态值对应的目标答案j的目标可信度,并且可以依据目标可信度对第一相似度进行调整,得到第二相似度,具体地:可以按照预设的可信度与调节系数之间的映射关系,依据该映射关系确定目标可信度对应的目标调节系数,本申请实施例中,调节系数的取值范围可以为-0.2~0.2,则第二相似度可以按照如下方式计算得到:

第二相似度=(1+目标调节系数)*第一相似度

进一步地,电子设备可以依据第二相似度对目标答案j进行筛选,得到调查答案j,例如,第二相似度大则少删除点目标答案j中的内容,第二相似度小则多删除点目标答案j中的内容。

进一步地,在一个可能的示例中,上述步骤22,依据所述影像信息确定所述对象i的目标状态值,可以包括如下步骤:

221、依据所述影像信息进行特征提取,得到第一特征集和第二特征集,所述第一特征集为面部特征集,所述第二特征集为行为特征集;

222、依据所述第一特征集确定所述对象i的目标精神面貌值;

223、依据所述第二特征集确定所述对象i的目标个性性格值;

224、获取所述对象i的目标信用积分;

225、确定与所述目标信用积分对应的第一权重值和第二权重值,所述第一权重值与所述第二权重值之和为1;

226、依据所述目标精神面貌值、所述目标个性性格值、所述第一权重值和所述第二权重值进行加权运算,得到所述对象i的目标状态值。

其中,第一特征集可以理解为面部特征,第一特征集可以包括多个第一特征,具体可以为以下至少一种:面部表情、面部纹路、面部洁净度、眼部特征等等,在此不做限定。其中,眼部特征可以以下至少一种:眨眼频率、眼睛张合程度、眼睛周围颜色、眼袋深度等等,在此不做限定。第二特征集可以理解为行为特征,第二特征集可以包括多个第二特征,具体可以为以下至少一种:整体动作或者局部动作,整体动作可以包括整个身体的动作,局部动作可以包括身体局部部位的动作,例如,嘴唇动作、手臂动作、臀部动作等等。

具体实现中,电子设备可以依据影像信息进行特征提取,得到第一特征集和第二特征集,第一特征集可以为面部特征集,第二特征集可以为行为特征集,电子设备可以依据第一特征集确定对象i的目标精神面貌值,电子设备中可以预先存储特征值与精神面貌值之间的映射关系,进而,依据该映射关系可以确定第一特征集中每一第一特征对应的精神面貌值,另外,还可以确定每一特征对应的区域标识,区域标识用于标记第一特征位于人脸的区域位置,电子设备中还可以预先存储区域标识与权重之间的映射关系,确定每一区域标识对应的权重,得到多个权重,依据多个权重以及多个精神面貌值进行加权运算,得到目标精神面貌值。

进一步地,电子设备可以依据第二特征集确定对象i的目标个性性格值,对第二特征集进行筛选,得到预设数量的第二特征,预设数量可以由用户自行设置或者系统默认,例如,预设数量可以为3或者5,具体筛选方式可以为,确定第二特征集中每一第二特征的位置,按照预设的位置与个性之间的关联度,确定第二特征集中每一第二特征的位置对应的关联度,保留关联度靠前的预设数量的关联度,保留其对应的第二特征,按照预设的特征与个性值之间的映射关系,确定筛选后的每一第二特征对应的个性值,得到预设数量的个性值,按照预设的位置与权重之间的映射关系,确定每一第二特征对应的位置对应的权重,得到预设数量的权重,将预设数量的个性值、预设数量的权重进行加权运算,得到目标个性性格值。

进一步地,本申请实施例中,电子设备可以获取对象i的目标信用积分,目标信用信息可以基于金融应用或者社交应用的信用积分,例如,芝麻分,不同的积分可以对应不同的权值对,即电子设备中可以预先存储积分与权值对之间的映射关系,电子设备可以依据该映射关系确定与目标信用积分对应的第一权重值和第二权重值,第一权重值与第二权重值之和为1,进而,可以依据目标精神面貌值、目标个性性格值、第一权重值和第二权重值进行加权运算,得到对象i的目标状态值,具体如下:

目标状态值=目标精神面貌值*第一权重值+目标个性性格值*第二权重值

进一步地,在一个可能的示例中,上述步骤30,依据所述第二相似度对所述目标答案j进行筛选,得到所述调查答案j,可以包括如下步骤:

31、确定与所述第二相似度对应的目标筛选比例;

32、将所述目标答案j划分为多个分段;

33、确定所述多个分段中每一分段与所述第一参考答案之间的相似度,得到多个相似度;

34、依据所述多个相似度将所述目标答案j进行排序;

35、依据所述目标筛选比例,确定排序后的所述目标答案j的目标筛选节点;

36、依据所述目标筛选节点对所述目标答案j进行筛选,得到所述调查答案j。

其中,电子设备中可以预先存储相似度与筛选比例之间的映射关系,进而,可以依据该映射关系确定第二相似度对应的目标筛选比例。目标答案j可以为一段内容,可以由输入时间决定,进而,可以依据时间将目标答案j划分为多个分段,或者,也可以依据语义识别技术将目标答案j划分为多个分段。

进一步地,电子设备可以确定多个分段中每一分段与第一参考答案之间的相似度,得到多个相似度,以及依据多个相似度将目标答案j进行排序,即对多个分段进行排序,例如,相似度高的在前,相似度低的在后,依据目标筛选比例,确定排序后的目标答案j的目标筛选节点,依据目标筛选节点对目标答案j进行筛选,即保留相似度高的内容,得到调查答案j。

202、调用所述调查数据对所述调查脚本基础库进行机器学习,得到调查原始数据库。

其中,电子设备可以调用调查数据中的部分数据或者全部数据对调查脚本基础库进行机器学习,得到调查原始数据库。上述机器学习可以为以下至少一种:深度学习、神经网络运算、语义分析、增强学习、自然语言处理等等,在此不做限定。

203、对所述调查原始数据库进行数据处理,得到有效调查数据库。

其中,上述数据处理可以为数据清洗或者数据归集,具体实现中,电子设备可以对调查原始数据库进行数据清洗或者数据归集,得到有效调查数据集。

在一个可能的示例中,上述步骤201之前,还可以包括如下步骤:

a1、对所述主观题集中的主观题进行问卷脚本调查,得到主观题调查脚本;

a2、对所述客观题集中的客观题进行对话设计以及对话管理,并进行模拟调查,得到客观题调查脚本;

a3、对所述主观题调查脚本和所述客观题调查脚本进行汇整,得到所述调查脚本基础库。

具体实现中,电子设备可以对主观题集中的主观题进行问卷脚本调查,得到主观题调查脚本,具体可以通过人机互动,以实现问卷脚本调查,并对客观题集中的客观题进行对话设计以及对话管理,并进行模拟调查,得到客观题调查脚本,对主观题调查脚本和客观题调查脚本进行汇整,得到调查脚本基础库。

可以看出,本申请实施例中所描述的基于大数据的问卷调查数据处理方法,应用于电子设备,根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据,调查数据包括针对初始调查问卷的多份已填写的调查问卷,初始调查问卷包括包括主观题集和客观题集,主观题集至少包括一道主观题,客观题集至少包括一道客观题,调查脚本基础库为针对初始调查问卷的调查脚本,调用调查数据对调查脚本基础库进行机器学习,得到调查原始数据库,对调查原始数据库进行数据处理,得到有效调查数据库,如此,一方面,能够通过机器学习优化调查脚本基础库,另一方面,还能通过对优化后的调查脚本基础库进一步优化,得到参考价值高的调查数据,有助于提升调查数据处理效率。

与上述图2所示的实施例一致地,请参阅图3,图3是本申请实施例提供的一种基于大数据的问卷调查数据处理方法的流程示意图,应用于如图1所示的电子设备,本基于大数据的问卷调查数据处理方法包括:

301、获取初始调查问卷,所述初始调查问卷包括包括主观题集和客观题集,所述主观题集至少包括一道主观题,所述客观题集至少包括一道客观题。

302、对所述主观题集中的主观题进行问卷脚本调查,得到主观题调查脚本。

303、对所述客观题集中的客观题进行对话设计以及对话管理,并进行模拟调查,得到客观题调查脚本。

304、对所述主观题调查脚本和所述客观题调查脚本进行汇整,得到所述调查脚本基础库。

305、根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据。所述调查数据包括针对所述初始调查问卷的多份已填写的调查问卷。

306、调用所述调查数据对所述调查脚本基础库进行机器学习,得到调查原始数据库。

307、对所述调查原始数据库进行数据处理,得到有效调查数据库。

其中,上述步骤301-步骤307的具体描述可以参照上述图2所描述的基于大数据的问卷调查数据处理方法的相应步骤,在此不再赘述。

举例说明下,以ai机器人为例,可以将调查问卷按照题型划分为主观题(选择题)和客观题(开放题)两类,以便对不同类型的调查题目的预期答案进行处理,对主观题进行问卷脚本调查,形成主观题调查脚本以及对客观题进行对话设计和对话管理,并根据设计进行模拟调查,形成客观题调查脚本,将主观题调查脚本和客观题调查脚本进行汇总,形成调查脚本基础库,并导入到机器人智能系统中,利用机器人开展智能对话调查,通过调用调查脚本基础库中的相关信息开展调查工作,通过对智能对话调查回收的数据进行机器学习、深度学习、增强学习、语义识别和自然语言处理,丰富和完善调查脚本基础库,将回收数据统一集成到调查原始数据库中,通过相关数据清洗、归集技术,对原始数据进行初步处理,形成有效调查数据库,并做好数据存储,以便后续分析使用。

可以看出,本申请实施例中所描述的基于大数据的问卷调查数据处理方法,一方面,能够构建调查脚本基础库,以及通过机器学习优化调查脚本基础库,另一方面,还能通过对优化后的调查脚本基础库进一步优化,得到参考价值高的调查数据,有助于提升调查数据处理效率。

与上述实施例一致地,请参阅图4,图4是本申请实施例提供的一种电子设备的结构示意图,如图所示,该包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,本申请实施例中,上述程序包括用于执行以下步骤的指令:

根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据,所述调查数据包括针对所述初始调查问卷的多份已填写的调查问卷,所述初始调查问卷包括包括主观题集和客观题集,所述主观题集至少包括一道主观题,所述客观题集至少包括一道客观题,所述调查脚本基础库为针对所述初始调查问卷的调查脚本;

调用所述调查数据对所述调查脚本基础库进行机器学习,得到调查原始数据库;

对所述调查原始数据库进行数据处理,得到有效调查数据库。

可以看出,本申请实施例中所描述的电子设备,根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据,调查数据包括针对初始调查问卷的多份已填写的调查问卷,初始调查问卷包括包括主观题集和客观题集,主观题集至少包括一道主观题,客观题集至少包括一道客观题,调查脚本基础库为针对初始调查问卷的调查脚本,调用调查数据对调查脚本基础库进行机器学习,得到调查原始数据库,对调查原始数据库进行数据处理,得到有效调查数据库,如此,一方面,能够通过机器学习优化调查脚本基础库,另一方面,还能通过对优化后的调查脚本基础库进一步优化,得到参考价值高的调查数据,有助于提升调查数据处理效率。

在一个可能的示例中,所述调查数据包括已填写的调查问卷i,所述调查问卷i包括调查答案j,在所述根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据方面,上述程序包括用于执行以下步骤的指令:

获取对象i的影像信息;

依据所述影像信息确定所述对象i的目标状态值;

展示所述初始调查问卷中的题目j,所述题目j为客观题;

获取针对所述题目j的目标语音信息;

对所述目标语音信息进行语音识别,得到所述题目j的目标答案j;

从所述调查脚本基础库中获取所述题目j对应的第一参考答案;

确定所述目标答案j与所述第一参考答案之间的第一相似度;

依据所述目标状态值确定所述目标答案j的目标可信度;

依据所述目标可信度对所述第一相似度进行调整,得到第二相似度;

依据所述第二相似度对所述目标答案j进行筛选,得到所述调查答案j。

在一个可能的示例中,在所述依据所述影像信息确定所述对象i的目标状态值方面,上述程序包括用于执行以下步骤的指令:

依据所述影像信息进行特征提取,得到第一特征集和第二特征集,所述第一特征集为面部特征集,所述第二特征集为行为特征集;

依据所述第一特征集确定所述对象i的目标精神面貌值;

依据所述第二特征集确定所述对象i的目标个性性格值;

获取所述对象i的目标信用积分;

确定与所述目标信用积分对应的第一权重值和第二权重值,所述第一权重值与所述第二权重值之和为1;

依据所述目标精神面貌值、所述目标个性性格值、所述第一权重值和所述第二权重值进行加权运算,得到所述对象i的目标状态值。

在一个可能的示例中,在所述依据所述第二相似度对所述目标答案j进行筛选,得到所述调查答案j方面,上述程序包括用于执行以下步骤的指令:

确定与所述第二相似度对应的目标筛选比例;

将所述目标答案j划分为多个分段;

确定所述多个分段中每一分段与所述第一参考答案之间的相似度,得到多个相似度;

依据所述多个相似度将所述目标答案j进行排序;

依据所述目标筛选比例,确定排序后的所述目标答案j的目标筛选节点;

依据所述目标筛选节点对所述目标答案j进行筛选,得到所述调查答案j。

在一个可能的示例中,上述程序还包括用于执行以下步骤的指令:

对所述主观题集中的主观题进行问卷脚本调查,得到主观题调查脚本;

对所述客观题集中的客观题进行对话设计以及对话管理,并进行模拟调查,得到客观题调查脚本;

对所述主观题调查脚本和所述客观题调查脚本进行汇整,得到所述调查脚本基础库。

上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例对进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

图5是本申请实施例中所涉及的基于大数据的问卷调查数据处理装置500的功能单元组成框图,该装置500,应用于电子设备,所述装置500包括:调查单元501、学习单元502和处理单元503,其中,

所述调查单元501,用于根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据,所述调查数据包括针对所述初始调查问卷的多份已填写的调查问卷,所述初始调查问卷包括包括主观题集和客观题集,所述主观题集至少包括一道主观题,所述客观题集至少包括一道客观题,所述调查脚本基础库为针对所述初始调查问卷的调查脚本;

所述学习单元502,用于调用所述调查数据对所述调查脚本基础库进行机器学习,得到调查原始数据库;

所述处理单元503,用于对所述调查原始数据库进行数据处理,得到有效调查数据库。

可以看出,本申请实施例中所描述的基于大数据的问卷调查数据处理装置,应用于电子设备,根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据,调查数据包括针对初始调查问卷的多份已填写的调查问卷,初始调查问卷包括包括主观题集和客观题集,主观题集至少包括一道主观题,客观题集至少包括一道客观题,调查脚本基础库为针对初始调查问卷的调查脚本,调用调查数据对调查脚本基础库进行机器学习,得到调查原始数据库,对调查原始数据库进行数据处理,得到有效调查数据库,如此,一方面,能够通过机器学习优化调查脚本基础库,另一方面,还能通过对优化后的调查脚本基础库进一步优化,得到参考价值高的调查数据,有助于提升调查数据处理效率。

在一个可能的示例中,所述调查数据包括已填写的调查问卷i,所述调查问卷i包括调查答案j,在所述根据初始调查问卷和调查脚本基础库进行对话调查,得到调查数据方面,所述调查单元501具体用于:

获取对象i的影像信息;

依据所述影像信息确定所述对象i的目标状态值;

展示所述初始调查问卷中的题目j,所述题目j为客观题;

获取针对所述题目j的目标语音信息;

对所述目标语音信息进行语音识别,得到所述题目j的目标答案j;

从所述调查脚本基础库中获取所述题目j对应的第一参考答案;

确定所述目标答案j与所述第一参考答案之间的第一相似度;

依据所述目标状态值确定所述目标答案j的目标可信度;

依据所述目标可信度对所述第一相似度进行调整,得到第二相似度;

依据所述第二相似度对所述目标答案j进行筛选,得到所述调查答案j。

在一个可能的示例中,在所述依据所述影像信息确定所述对象i的目标状态值方面,所述调查单元501具体:

依据所述影像信息进行特征提取,得到第一特征集和第二特征集,所述第一特征集为面部特征集,所述第二特征集为行为特征集;

依据所述第一特征集确定所述对象i的目标精神面貌值;

依据所述第二特征集确定所述对象i的目标个性性格值;

获取所述对象i的目标信用积分;

确定与所述目标信用积分对应的第一权重值和第二权重值,所述第一权重值与所述第二权重值之和为1;

依据所述目标精神面貌值、所述目标个性性格值、所述第一权重值和所述第二权重值进行加权运算,得到所述对象i的目标状态值。

在一个可能的示例中,在所述依据所述第二相似度对所述目标答案j进行筛选,得到所述调查答案j方面,所述调查单元501具体用于:

确定与所述第二相似度对应的目标筛选比例;

将所述目标答案j划分为多个分段;

确定所述多个分段中每一分段与所述第一参考答案之间的相似度,得到多个相似度;

依据所述多个相似度将所述目标答案j进行排序;

依据所述目标筛选比例,确定排序后的所述目标答案j的目标筛选节点;

依据所述目标筛选节点对所述目标答案j进行筛选,得到所述调查答案j。

在一个可能的示例中,所述调查单元501还用于实现如下功能:

对所述主观题集中的主观题进行问卷脚本调查,得到主观题调查脚本;

对所述客观题集中的客观题进行对话设计以及对话管理,并进行模拟调查,得到客观题调查脚本;

对所述主观题调查脚本和所述客观题调查脚本进行汇整,得到所述调查脚本基础库。

可以理解的是,本实施例的基于大数据的问卷调查数据处理装置的各程序模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。

本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。

本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:read-onlymemory,简称:rom)、随机存取器(英文:randomaccessmemory,简称:ram)、磁盘或光盘等。

以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1