一种住建领域政务热线工单数据分析方法及系统与流程

文档序号:24240771发布日期:2021-03-12 13:15阅读:来源:国知局

技术特征:

1.一种住建领域政务热线工单数据分析方法,其特征是:包括以下步骤:

获取热线电话,记录语音信息,将语音数据转化为文本信息,形成工单;

对工单数据进行预处理,根据工单的受理时间,描绘各工单的时间趋势变化;

提取工单中工单涉及区域数据,确定工单涉及问题所在位置;

构建住建领域专业词库,对工单内容进行分词,基于分词结果,构建文档词条矩阵;

获取各个工单的文档词条矩阵,进行文本主题的识别,将不同主题下频率大于设定值的关键词作为主题关键词;

基于时间趋势变化、涉及问题所在位置和主题关键词,生成工单数据分析报告。

2.如权利要求1所述的一种住建领域政务热线工单数据分析方法,其特征是:对工单数据进行预处理的具体过程包括:构建噪音数据库,剔除工单中属于噪音数据库中的数据。

3.如权利要求1所述的一种住建领域政务热线工单数据分析方法,其特征是:提取工单内受理时间,确定年份、月份、星期以及具体时刻,进行时间趋势的分析。

4.如权利要求1所述的一种住建领域政务热线工单数据分析方法,其特征是:构建住建领域专业词库,对工单内容进行分词的具体过程包括:构建住建领域的专业词库,包括自定义专业词库与停用词词库;自定义专业词库是指作为整体出现的词语,停用词库是指无意义的语气助词。

5.如权利要求4所述的一种住建领域政务热线工单数据分析方法,其特征是:所述住建领域专业词库内的词语分行存储,每一个词语占一行。

6.如权利要求1所述的一种住建领域政务热线工单数据分析方法,其特征是:基于分词结果,构建文档词条矩阵的具体过程包括:以每一个分词作为单独的一列,每一行表示的是工单内容,以词语出现次数进行排列。

7.如权利要求1所述的一种住建领域政务热线工单数据分析方法,其特征是:进行文本主题的识别的具体过程包括:使用lda算法获取工单的主题,利用无监督机器学习方法将主题进行分类,根据每个主题下频率超过设定值的若干关键词,概括出该主题的主旨。

8.一种住建领域政务热线工单数据分析系统,其特征是:包括:

工单转化模块,被配置为获取热线电话,记录语音信息,将语音数据转化为文本信息,形成工单;

时间趋势分析模块,被配置为根据工单的受理时间,描绘各工单的时间趋势变化;

空间分析模块,被配置为提取工单中工单涉及区域数据,确定工单涉及问题所在位置;

主题分析模块,被配置为构建住建领域专业词库,对工单内容进行分词,基于分词结果,构建文档词条矩阵,获取各个工单的文档词条矩阵,进行文本主题的识别,将不同主题下频率大于设定值的关键词作为主题关键词;

分析报告生成模块,被配置为基于时间趋势变化、涉及问题所在位置和主题关键词,生成工单数据分析报告。

9.一种计算机可读存储介质,其特征是:其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行权利要求1-7中任一项所述的一种住建领域政务热线工单数据分析方法中的步骤。

10.一种终端设备,其特征是:包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行权利要求1-7中任一项所述的一种住建领域政务热线工单数据分析方法中的步骤。


技术总结
本发明提供了一种住建领域政务热线工单数据分析方法及系统,获取热线电话,记录语音信息,将语音数据转化为文本信息,形成工单;对工单数据进行预处理,根据工单的受理时间,描绘各工单的时间趋势变化;提取工单中工单涉及区域数据,确定工单涉及问题所在位置;构建住建领域专业词库,对工单内容进行分词,基于分词结果,构建文档词条矩阵;获取各个工单的文档词条矩阵,进行文本主题的识别,将不同主题下频率大于设定值的关键词作为主题关键词;基于时间趋势变化、涉及问题所在位置和主题关键词,生成工单数据分析报告。本发明能够实现对诉求工单的时间趋势分析、空间分布分析和主题挖掘,解决住建领域的数据分析问题,特别是大数据的分析。

技术研发人员:史勇明;孙宗锋;王立峰;赵兴华;管一鸣;柳冬;魏新;滕璇;李如坤;陈庆峰
受保护的技术使用者:济南市城乡建设数字化中心;山东大学
技术研发日:2020.12.15
技术公布日:2021.03.12
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1