环境形象的评估方法、装置和设备与流程

文档序号:21695289发布日期:2020-07-31 22:31阅读:221来源:国知局
环境形象的评估方法、装置和设备与流程

本发明实施例涉及环境信息处理领域,具体涉及环境形象的评估方法、装置和设备。



背景技术:

随着网络覆盖率的提升和新兴媒体的发展,互联网上出现了大量关于企业或者地区的环境类信息。这些信息常以环境类新闻的形式存在,体现了相关主体在环境保护领域的形象和作为。由于网络信息数量大,来源广的特点,互联网信息的处理通常借助计算机技术来实现。自然语言处理技术在电商评价、医疗诊断等领域都已经有所应用,但在环境领域应用很少。

目前在环境形象评价(环境信息处理)领域存在诸多缺陷和空白:(1)仅存在对环境类舆情的计算机分析方法,应用面窄;(2)所基于的算法比较初级,分析精度有待提高;(3)自然语言处理技术没有运用到环境新闻处理、环境形象评估等领域,存在应用上的空白。(4)缺乏环境类信息内在语料库和的系统的处理流程。



技术实现要素:

本发明实施例的目的在于提供环境形象的评估方法、装置和设备,用以解决现有环境形象信息处理的缺陷。

为实现上述目的,本发明实施例主要提供如下技术方案:

第一方面,本发明实施例提供了一种环境形象的评估方法,包括:获取企业环境类的文本信息;从所述企业环境类的文本信息中选择部分文本,根据所述部分文本、给定的标签数据、预设的分类维度和情感属性生成训练语料库;根据所述训练语料库生成环境筛选模型、环境新闻维度模型、环境要素分类模型和环境情感模型;根据所述环境筛选模型、所述环境新闻维度模型、所述环境要素分类模型和所述环境情感模型对目标企业的环境相关文本进行评估得到所述目标企业的环境形象结果。

根据本发明的一个实施例,根据给定的关键词,利用网络爬虫从互联网上获取所述企业环境类的文本信息。

根据本发明的一个实施例,所述训练语料库包括多条文本信息,每条文本信息包括文本标题、文本内容、是否属于环境新闻的分类信息、形象类别、涉及要素和情感属性。

根据本发明的一个实施例,根据所述训练语料库使用支持向量机(supportvectormachine,svm)、贝叶斯算法或卷积神经网络(convolutionalneuralnetworks,cnn)生成所述环境筛选模型、所述环境新闻维度模型、所述环境要素分类模型和所述环境情感模型。

第二方面,本发明实施例还提供一种xx装置,包括:获取模块,用于获取企业环境类的文本信息;训练语料库生成模块,用于从所述企业环境类的文本信息中选择部分文本,根据所述部分文本、给定的标签数据、预设的分类维度和情感属性生成训练语料库;模型训练模块,用于根据所述训练语料库生成环境筛选模型、环境新闻维度模型、环境要素分类模型和环境情感模型;评估模块,用于根据所述环境筛选模型、所述环境新闻维度模型、所述环境要素分类模型和所述环境情感模型对目标企业的环境相关文本进行评估得到所述目标企业的环境形象结果。

根据本发明的一个实施例,所述获取模块用于根据给定的关键词,利用网络爬虫从互联网上获取所述企业环境类的文本信息。

根据本发明的一个实施例,所述训练语料库包括多条文本信息,每条文本信息包括文本标题、文本内容、是否属于环境新闻的分类信息、形象类别、涉及要素和情感属性。

根据本发明的一个实施例,所述模型训练模块用于根据所述训练语料库使用支持向量机、贝叶斯算法或卷积神经网络生成所述环境筛选模型、所述环境新闻维度模型、所述环境要素分类模型和所述环境情感模型。

第三方面,本发明实施例还提供一种电子设备,包括:至少一个处理器和至少一个存储器;所述存储器用于存储一个或多个程序指令;所述处理器,用于运行一个或多个程序指令,用以执行如第一方面所述的环境形象的评估方法。

第四方面,本发明实施例还提供一种计算机可读存储介质,包含一个或多个程序指令,所述一个或多个程序指令用于被执行如第一方面所述的环境形象的评估方法。

本发明实施例提供的技术方案至少具有如下优点:

本发明实施例提供的环境形象的评估方法、装置和设备,可以实时爬取大量的网络环境文本,动态、快速地分析和显示地区和企业环境形象,相对于人工检索更加快速和便捷。本发明建立了一个标准环境类语料库,对后续环境领域的计算机应用十分重要。本发明通过cnn、svm等算法,对某一地区或企业的环境信息进行自动分类和情感分析,弥补了计算机自然语言处理在环境领域应用的空白。

附图说明

图1为本发明实施例的环境形象的评估方法的流程图。

图2为本发明一个示例中对某个企业环境形象的评价结果图。

图3为本发明实施例的环境形象的评估装置的结构框图。

具体实施方式

以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效。

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本发明。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。

在本发明的描述中,需要理解的是,术语“第一”和“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。

图1为本发明实施例的环境形象的评估方法的流程图。如图1所示,本发明实施例的环境形象的评估方法,包括:

s1:获取企业环境类的文本信息。

在本发明的一个实施例中,步骤s1具体包括:根据给定的关键词,利用网络爬虫从互联网上获取环境类新闻文本,定义为企业环境类的文本信息,存储到数据库中。示例性地,关键词可以包括:污染、环保、废水、垃圾排放等等。

s2:从企业环境类的文本信息中选择部分文本,根据部分文本、给定的标签数据、预设的分类维度和情感属性生成训练语料库。

具体地,从企业环境类的文本信息选择一部分文本(例如百分之九十的文本),根据这部分的文本按照给定的环境分类维度和情感极性、给定的人工标签数据生成训练语料库。

表1部分训练语料库

表1是一个示例中的部分训练语料库。在本发明的实施例中,训练语料库包括多条文本信息,每条文本信息包括文本标题、文本内容、是否属于环境新闻的分类信息、形象类别、涉及要素和情感属性。

在本发明的实施例中,将选择的部分文本分为四个层次。

第一个层次,该文本是否属于环境类新闻或是否与环境领域相关。

第二个层次,该文本可归为属于什么环境形象类别,类别遵循上述的6个环境维度:分为常规污染、事故风险、生态影响、资源消耗、绿色宣教和绿色管理等,编码时分别用大写字母a、b、c、d、e、f表示。

第三个层次,该文本的包含了哪种环境要素,主要要素有水、大气、土壤、废物、生物和声,编码时分别用小写字母a、b、c、d、e、f表示。

第四个层次,该文本的情感倾向如何,情感倾向程度以五点量表的形式表示,从程度倾向负面到正面依次评价为-3、-1、0、1、3,如表1。

其中第二个层次和第三个层次之间的分类允许有所交叉。

s3:根据训练语料库生成环境筛选模型、环境新闻维度模型、环境要素分类模型和环境情感模型。

在本发明的一个实施例中,基于训练语料库使用svm、贝叶斯算法或卷积神经网络中的一种进行训练生成环境筛选模型、环境新闻维度模型、环境要素分类模型和环境情感模型。其中,环境筛选模型用于筛选是否为环境新闻。环境新闻维度模型用于分类成不同维度。环境要素分类模型用于分类成不同要素。环境情感模型用于分类成不同情感。

s4:根据环境筛选模型、环境新闻维度模型、环境要素分类模型和环境情感模型对目标企业的环境相关文本进行评估得到目标企业的环境形象结果。

具体地,调用步骤s3训练好的模型,对目标企业的环境相关文本进行分类处理,可以理解为机器对文本的自动标签,结果存储到数据库中。根据统计结果和数量,可以生成企业的环境形象结果。

图2为本发明一个示例中对某个企业环境形象的评价结果图。如图2所示,环境形象结果可以采用饼状图、柱状图或其他格式的图。

本发明实施例提供的环境形象的评估方法,可以实时爬取大量的网络环境文本,动态、快速地分析和显示地区和企业环境形象,相对于人工检索更加快速和便捷。本发明建立了一个标准环境类语料库,对后续环境领域的计算机应用十分重要。本发明通过cnn和svm等算法,对某一地区或企业的环境信息进行自动分类和情感分析,弥补了计算机自然语言处理在环境领域应用的空白。

图3为本发明实施例的环境形象的评估装置的结构框图。如图3所示,本发明实施例的环境形象的评估装置,包括:获取模块100、训练语料库生成模块200、模型训练模块300和评估模块400。

其中,获取模块100用于获取企业环境类的文本信息。训练语料库生成模块200用于从企业环境类的文本信息中选择部分文本,根据部分文本、给定的标签数据、预设的分类维度和情感属性生成训练语料库。模型训练模块300用于根据训练语料库生成环境筛选模型、环境新闻维度模型、环境要素分类模型和环境情感模型。评估模块400用于根据环境筛选模型、环境新闻维度模型、环境要素分类模型和环境情感模型对目标企业的环境相关文本进行评估得到目标企业的环境形象结果。

在本发明的一个实施例中,获取模块100用于根据给定的关键词,利用网络爬虫从互联网上获取企业环境类的文本信息。

在本发明的一个实施例中,训练语料库包括多条文本信息,每条文本信息包括文本标题、文本内容、是否属于环境新闻的分类信息、形象类别、涉及要素和情感属性。

在本发明的一个实施例中,模型训练模块300用于根据训练语料库使用支持向量机、贝叶斯算法或卷积神经网络生成环境筛选模型、环境新闻维度模型、环境要素分类模型和环境情感模型。

需要说明的是,本发明实施例的环境形象的评估装置的具体实施方式与本发明实施例的环境形象的评估方法的具体实施方式类似,具体参见环境形象的评估方法部分的描述,为了减少冗余,不做赘述。

本发明实施例还提供一种电子设备,包括:至少一个处理器和至少一个存储器;所述存储器用于存储一个或多个程序指令;所述处理器,用于运行一个或多个程序指令,用以执行如第一方面所述的环境形象的评估方法。

本发明所公开的实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序指令,当所述计算机程序指令在计算机上运行时,使得计算机执行上述的环境形象的评估方法。

在本发明实施例中,处理器可以是一种集成电路芯片,具有信号的处理能力。处理器可以是通用处理器、数字信号处理器(digitalsignalprocessor,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现场可编程门阵列(fieldprogrammablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。处理器读取存储介质中的信息,结合其硬件完成上述方法的步骤。

存储介质可以是存储器,例如可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。

其中,非易失性存储器可以是只读存储器(read-onlymemory,简称rom)、可编程只读存储器(programmablerom,简称prom)、可擦除可编程只读存储器(erasableprom,简称eprom)、电可擦除可编程只读存储器(electricallyeprom,简称eeprom)或闪存。

易失性存储器可以是随机存取存储器(randomaccessmemory,简称ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(staticram,简称sram)、动态随机存取存储器(dynamicram,简称dram)、同步动态随机存取存储器(synchronousdram,简称sdram)、双倍数据速率同步动态随机存取存储器(doubledataratesdram,简称ddrsdram)、增强型同步动态随机存取存储器(enhancedsdram,简称esdram)、同步连接动态随机存取存储器(synchlinkdram,简称sldram)和直接内存总线随机存取存储器(directrambusram,简称drram)。

本发明实施例描述的存储介质旨在包括但不限于这些和任意其它适合类型的存储器。

本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件与软件组合来实现。当应用软件时,可以将相应功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1