文化生态因子的识别与提取方法及设备和存储介质与流程

文档序号:27336987发布日期:2021-11-10 02:27阅读:248来源:国知局
文化生态因子的识别与提取方法及设备和存储介质与流程

1.本发明涉及文化生态保护利用,具体地,涉及一种文化生态因子的识别与提取方法及设备和计算机可读存储介质。


背景技术:

[0002]“文化生态”(cultural ecology)的概念早已提出。随着文化生态理论的发展,文化生态的概念与非物质文化遗产的保护紧密地联系在一起。“文化生态保护”已经成为非物质文化遗产保护的方式之一。
[0003]
目前,对于文化生态的研究主要集中于人类学、社会学、文化学等人文社科类领域,并且仅应用定性研究的分析方法,缺乏科学、定量的分析工具,对于文化生态系统的复杂性把握不足。在文化生态保护的实际操作中,对文化生态的保护多简化为对于文化遗产所处的自然和社会环境的保护,对于构成文化生态系统的文化生态因子的识别和提取还存在很大的技术空白。


技术实现要素:

[0004]
针对上述问题,本发明提出了一种文化生态因子的识别与提取方法及设备和计算机可读存储介质,以对于构成文化生态系统的各种文化生态因子进行识别和提取。
[0005]
根据本发明的一个方面,提供一种文化生态因子的识别提取方法,包括:识别并提取自然环境因子;识别并提取人文环境因子;识别并提取技术信息因子;识别并提取区域人群与外部文化因子;以及识别并提取制度与政策等因子。
[0006]
根据本发明的实施例,所述人文环境因子可以包括物质人文环境因子和非物质人文环境因子。
[0007]
根据本发明的实施例,可以通过空间信息技术进行自然环境因子和物质人文环境因子的识别和提取。
[0008]
根据本发明的实施例,可以通过语义分析技术进行非物质人文环境因子、区域人群与外部文化因子以及制度与政策等因子的识别和提取。
[0009]
根据本发明的实施例,所述语义分析技术可以包括基于大数据的自然语言处理与信息检索(natural language processing and information retrieval,nlpir)语义智能分析技术。
[0010]
根据本发明的实施例,识别并提取自然环境因子的步骤可以包括利用定量遥感技术提取植被指数。
[0011]
根据本发明的实施例,识别并提取自然环境因子的步骤可以包括利用定量遥感技术提取不透水表面。
[0012]
根据本发明的实施例,所述文化生态因子的识别提取方法还可以包括:通过地统计学方法对提取到的文化生态因子进行统计,以获得定量的空间分布信息。
[0013]
根据本发明的另一个方面,提供一种文化生态因子的识别提取装置,包括:自然环
境识别提取模块,用于识别并提取自然环境因子;人文环境识别提取模块,用于识别并提取人文环境因子;技术信息识别提取模块,用于识别并提取技术信息因子;人群与外部文化识别提取模块,用于识别并提取区域人群与外部文化因子;以及制度与政策识别提取模块,用于识别并提取制度与政策因子。
[0014]
根据本发明的另一个方面,提供一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时,使得所述处理器实现根据本发明各实施例的文化生态因子的识别提取方法。
[0015]
根据本发明的文化生态因子的识别提取方法及装置和计算机可读存储介质,能够科学地、定量地识别并提取各种文化生态因子,对文化生态系统的研究、监测与保护提供具体实际的数据,极大地促进了对于文化生态的保护。
附图说明
[0016]
将通过参照附图详细地描述本发明的示例性实施例,本发明的以上和其他特征将变得显而易见。此处所说明的附图用来提供对本发明实施例的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明实施例的技术方案,并不构成对本发明实施例的保护范围的不当限定。在附图中:
[0017]
图1是根据本发明实施例的文化生态因子的识别提取方法的示意性流程图;
[0018]
图2示出了根据本发明实施例的利用定量遥感技术提取植被指数ndvi的示例;
[0019]
图3示出了青海黄南州热贡文化生态保护实验区的小流域范围的划分结果;
[0020]
图4是根据本发明实施例的对于土地利用相关的文化生态因子的识别提取与分析的示图;
[0021]
图5示出了应用1:50000等高线和高程点数据构建dem的示图;以及
[0022]
图6是根据本发明实施例的文化生态因子的识别提取装置的示意性框图。
具体实施方式
[0023]
为使本领域的技术人员更好地理解本发明的技术方案,下面将结合附图对本发明提供的文化生态因子的识别提取方法及装置和计算机可读存储介质进行详细描述。
[0024]
在下文中将参考附图更充分地描述示例实施例,但是示例实施例可以以不同形式来具体实现,并且不应当被解释为限于本文阐述的实施例。提供这些实施例的目的在于使本发明透彻和完整,并将使本领域技术人员充分理解本发明的范围。应当认识到,附图仅用于对本发明的实施例进行描述,图中所示各个元件或部分的尺寸未按实际比例绘制。
[0025]
本文所用的术语仅是为了描述特定示例实施例,并且不旨在限定所要求保护的主题。如本文所使用的那样,除非上下文清楚地指明不是这样,否则单数形式“一”、“一个”和“该”也旨在包括复数形式。还应该理解的是,当术语“包括”和/或“包括
……
的”用于本说明书中时,指明存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其他特征、整体、步骤、操作、元件、组件和/或它们的组。
[0026]
将要理解的是,虽然本文使用了术语“第一”和“第二”等来描述各个元件、组件、区域、层和/或部分,但是这些元件、组件、区域、层和/或部分不受这些术语限定。这些术语仅用于将一个元件、组件、区域、层或部分与另一元件、组件、区域、层或部分区分开。因此,下
面所讨论的第一元件、第一组件、第一区域、第一层或第一部分可称作第二元件、第二组件、第二区域、第二层或第二部分,而没有背离本文所公开的指教。
[0027]
还应理解,除非上下文中另外清楚地指出,否则每个示例性实施例内的特征或方面的描述通常应被认为可用于其他示例性实施例中的其他相似特征或方面。
[0028]
除非另外进行限定,否则本文所使用的所有术语(包括技术术语和科学术语)具有与本文公开的主题所属技术领域的普通技术人员的通常理解相同的含义。还将理解的是,诸如在常用字典中定义的那些术语应当解释为具有与其在相关技术的语境中的含义一致的含义,并且不应理想化或过于形式化地进行解释,除非在本文中明确地进行了这样的定义。
[0029]
美国人类学家斯图尔德在1955年首次提出“文化生态”的概念,文化生态可以理解为根据人类生存的整个自然环境和社会环境的各种因素交互作用而形成的特定结构和状态。
[0030]
目前,对于文化生态的保护主要包括历史街区保护、国家公园保护、“生态博物馆”等。构建文化生态保护区是对非物质文化遗产保护的创新性实践。
[0031]
目前,对于文化生态的研究主要集中于人类学、社会学、文化学等人文社科类领域,缺乏科学、定量的分析工具,对于文化生态系统的复杂性把握不足。对文化生态的保护多为对于文化遗产所处的自然和社会环境的保护,对于构成文化生态系统的文化生态因子的识别和提取还存在很大的技术空白。
[0032]
本发明的发明人认识到上述问题,并且创造性地提出了文化生态因子的识别与提取所应遵守的原则,即:(1)人文要素与自然要素综合分析原则(以下简称为综合分析原则);以及(2)主导因素及其定性定量分析原则(以下简称为定性定量分析原则)。
[0033]
综合分析原则指出,要以自然地域分异(territorial differentiation)为基础,通过选取反映人类活动的关键指标,揭示它们的地域分异规律,分析人文因子和自然因子在空间分异(spatial differentiation)上的关系及其规律,并且寻求人文因子和自然因子的空间套合(spatial fit)。
[0034]
定性定量分析原则指出,要选择反映地域生态经济系统整体和主要特征的要素,这些要素需要能够反映出主流生态经济系统,并体现主要经济活动。通过对生态经济系统的主导要素的定性定量分析,选择合理的界限指标,以指导生态经济区划。
[0035]
本发明所述的“文化生态因子”主要包括对区域文化形成、传承与发展有影响的各种环境因子。基于上述发明构思,本发明的发明人创造性地将文化生态因子划分为以下几类:自然环境因子、人文环境因子、技术信息因子、区域人群与外部文化因子、制度与政策因子。
[0036]
图1是根据本发明实施例的文化生态因子的识别提取方法的示意性流程图。
[0037]
如图1所示,根据本发明实施例的文化生态因子的识别提取方法包括步骤s10至s50。
[0038]
在步骤s10,识别并提取自然环境因子。
[0039]
在步骤s20,识别并提取人文环境因子。
[0040]
在步骤s30,识别并提取技术信息因子。
[0041]
在步骤s40,识别并提取区域人群与外部文化因子。
[0042]
在步骤s50,识别并提取制度与政策因子。
[0043]
根据本发明的实施例,针对有形的文化生态因子,例如,自然环境因子、物质人文环境因子,可以利用空间信息技术进行识别和提取,并进行区域特征分析;针对无形的文化生态因子,例如,非物质人文环境因子、技术信息因子、区域人群与外部文化因子、制度与政策等因子,可以利用语义分析技术,例如,基于大数据的自然语言处理与信息检索(nlpir)语义智能分析技术,进行识别和提取并分析,从而可以从海量的数据中提取出相关信息,基于定性定量分析,对区域内的自然环境、资源、社会经济发展等方面的现状以及存在的问题作出科学的判断。
[0044]
下面将结合具体实施方式对本发明的技术方案进行更详细的说明。然而应当认识到,本发明并不限于以下所说明的各种具体实施方式。
[0045]
首先,对利用空间信息技术识别提取有形文化生态因子(例如,自然环境因子、物质人文环境因子)进行说明。
[0046]
可以通过利用多波段遥感技术获取的影像数据,针对规划内容提取需要的信息,这些信息可以包括,例如,城镇建设情况、植被分布与涨势、重大基础设施分布、土地利用现状等。
[0047]
以遥感技术为代表的空间信息技术为区域规划中的信息获取提供了强大的支撑。利用多源、海量的空间信息数据,通过遥感、地理信息系统(geographic information system,gis)等信息提取与数据挖掘的方法,可以提取区域规划所需要的信息。这些信息可以涵盖区域城镇化发展现状、区域自然特征、生态环境特征、基础设施条件、社会经济发展特征等。信息提取的数据源可以包括遥感影像数据、其它矢量或栅格空间数据、统计数据、抽样调查数据等。信息提取方法有很多种,按照区域规划对信息提取目标类型的需求,可以分为地物类别信息的提取方法、定量环境信息的提取方法以及变化信息的提取方法。
[0048]
对于有形文化生态因子而言,狭义的信息提取就是指地物类别信息的提取。在遥感卫星的数据获取技术与不断扩大的应用需求共同推动下,遥感信息提取技术经历了从人工提取到计算机提取的发展阶段。人工信息提取效率低,劳动强度大,而且依赖参与解译分析人员的经验,在很大程度上不具备重复性。利用计算机进行遥感信息的自动提取具有效率高、速度快、精度高等优点。
[0049]
在遥感信息提取过程中,还可以通过将采用了能够提供自学习、自适应及自推理的高效率处理方法的人工智技术应用于目标识别、土地利用分类、变化检测等遥感信息提取方面,来提高处理效率并提供智能化。下面简要介绍几种遥感地物类别信息的提取方法。
[0050]
参数分类法
[0051]
参数分类法基于遥感数据是正态分布的前提假设,根据先验概率和概率密度函数设计最优分类器,从而对影像数据进行类别划分。此外,根据先验概率等信息是否己知,参数分类法还可以分为监督分类法和非监督分类法。监督分类法根据获取的样本信息事先确定判别函数,然后将未知类别的样本的像元值依据确定的判别函数进行分类。非监督分类法是一种自组织分类方法,它不依赖于样本,根据待识别对象在特征空间的分布来进行聚类。常用的处理方法有平行六面体分类、动态聚类分类等。监督分类法和非监督分类法比较简单,在早期遥感数据分辨率不高时,对于细节特征等形状信息难以清晰表达。当影像数据主要提供的是光谱信息时,参数分类法得到了广泛的应用。
[0052]
神经网络分类法
[0053]
神经网络模拟人类大脑采用连通的神经元来处理接收到信号的思维过程,是一种具有学习、联想、记忆和模式识别等智能信息处理功能的人工系统。与基于统计模型的影像分类方法相比,神经网络算法不要求数据成正态分布,自适应性强,具有模拟特定拓扑结构复杂模型的能力,对不规则分布的复杂数据具有很强的处理能力,从而得到了广泛的应用,很多应用实例表明通过神经网络分类法得到的分类结果优于基于统计模型的参数分类法。神经网络提供的是隐式知识的表达,学习到的分类规则和解译规则都隐藏在隐含层的神经元的权重中,用户难以理解和进行调整,属于黑盒模型。随着问题复杂度的增加,神经网络分类法的学习时间也会大大增加。
[0054]
模糊分类法
[0055]
模糊分类法是基于现实世界不确定、异质的原则建立的,其理论基础是模糊集合论。模糊分类并不是将待分对象划分到确定的类别中,而是通过0与l之间的模糊值(即,表示待分对象属于某一类别的概率)来表示,即,表示该待分对象属于某一特定类别的程度。模糊分类法具有以下优点:特征值向模糊值的转化实际上是特征标准化和知识转化的过程;提供了明确的和可调整的特征描述;通过模糊运算和层次类型描述语义知识,结合特征之间的组合,可以进行复杂地物的特征描述,对于地表空间信息提取具有较强的实用意义。
[0056]
基于专家知识的信息提取方法
[0057]
专家知识库随着智能化系统的发展而逐步兴起。基于专家知识的信息提取方法依据某一领域的专家方法或经验,对地物的多种属性进行分析、判断,从而确定各地物的归属。专家系统需要建立利用计算机的规则和数据表示的专家领域知识库,在需要分类时,调用知识库中的专家知识,按照某种可信度进行不确定性推理,进而确定类别。相较其它分类方法,基于专家知识的信息提取方法对输入数据的分布没有任何假设,有能力处理高维数据,在知识规则完整的情况下,分类精度更高,而且知识规则易于被人们理解,已成为研究热点。
[0058]
地物类别信息的提取为了解大面积的区域概况提供了有效手段,但这些定性的信息不能满足区域规划对信息的需求,需要进一步对规划区进行定量的分析和研究,从而能够更加科学、详细地了解区域现状,分析区域内各地方的差别,分析区域内部自然、生态、环境等方面的空间分异情况。定量信息的提取方法可以包括定量遥感方法和地统计方法。
[0059]
定量遥感方法是指从对地观测电磁波信号中定量提取地表参数的方法,从而区别于仅依靠经验判读的定性识别地物的方法。遥感信息在电磁波的不同波段内可以反映出地表物质的定量的物理量和准确的空间位置,并且根据这些定量的遥感信息,可以通过实验模型或物理模型将遥感信息与地学参量联系起来,来定量地推导出特定的地学或生物学信息。
[0060]
随着定量遥感技术的发展及在自然、生态等领域的应用日益增多,出现了大量可以用来推导地表环境的模型与方法,运用这些模型与方法,可以从遥感影像及其它辅助数据中提取大量对区域规划有用的信息。下面以反映植被状况的植被指数和反映城镇化发展的不透水表面指数来说明定量遥感技术在提取自然环境因子中的应用。
[0061]
根据本发明的实施例,识别并提取自然环境因子的步骤可以包括利用定量遥感技术提取植被指数和/或利用定量遥感技术提取不透水表面。
[0062]
植被指数是遥感领域中用来表征地表植被覆盖和生长状况的简单、有效的度量参数。随着遥感技术的发展,植被指数在环境、生态、农业等领域有了广泛的应用。植被指数的建立是基于植被在红色和近红外波段反差较大的光谱特征。在综合考虑各有关的光谱信号的基础上,可以对多波段的反射率进行数学变换,以增强植被信息,并使非植被的信号最小化。植被指数是可以监测地表植被状况的定量指标。通过计算植被指数可以知道区域植被的空间分布状况和植被的长势,以及在不同时期上述两项指标的变化情况。表1中列举了几种植被指数模型,其中ir是像元在近红外区的反射值,r是像元在红光区的反射值。
[0063]
表1:植被指数计算模型
[0064][0065]
图2示出了根据本发明实施例的利用定量遥感技术提取植被指数ndvi的示例。图2示出了应用专题成像仪(thematic mapper,tm)多光谱影像计算的规划区的归一化植被指数(normalized vegetation index,ndvi)值。
[0066]
如图2所示,分析结果中,ndvi<0为水体;0<ndvi<0.5为无植被覆盖土地,基本为城镇建设用地;0.5<ndvi<0.7为植被覆盖率低的区域,以低覆盖的荒草地和农村居民点为主;0.7<ndvi<0.8为植被覆盖率中等区域,植被以耕地和草地为主;0.8<ndvi<0.85的区域植被覆盖率较高,多为灌木林和疏林地;ndvi>0.85的区域是植被高覆盖地区,以林地为主。
[0067]
对于ndvi的计算结果,可以结合实地调查进行更加详细的划分,找到覆盖度极高,长势好的林地,为生态环境保护规划和旅游规划提供参考。
[0068]
城市地区被认为是影响环境变化的区域,城市化的快速发展会使得不透水表面面积增长,增加地表径流,从而使城市地表污染物直接以径流的方式进入河流,加剧河流污染,降低水质,对流域地表水环境产生重要影响。当流域不透水表面面积大于25%时,会导致地表水环境的严重退化与毁坏。不透水表面指数是评价城市化带来的环境影响以及城市生态系统健康状况的重要指标,在城市生态环境以及气候变化效应评价方面具有重要意义。
[0069]
水文分析是数字高程模型(dem)数据应用的一个重要方面。利用dem生成的集水流域和水流网络,成为大多数地表水文分析模型的主要输入数据。表面水文分析模型应用于研究与地表水流有关的各种自然现象(例如,洪水水位及泛滥情况)或者划定受污染源影响的地区,以及预测当某一地区的地貌改变时对整个地区将造成的影响等。因此,可以应用在城市和区域规划、农业及森林、交通道路等许多领域,对地球表面形状的理解也具有十分重要的意义。
[0070]
基于dem的地表水文分析的主要内容是利用水文分析工具提取地表水流径流模型的水流方向、汇流累积量、水流长度、河流网络(包括河流网络的分级等)以及对研究区的流域进行分割等。通过对这些基本水文因子的提取和基本水文分析,可以在dem表面之上再现水流的流动过程,最终完成水文分析过程。
[0071]
根据本发明的实施例,可以利用地形数据实现文化生态因子的识别提取,从而通过计算水流方向、累积水流量、提取水网和模拟集水区域四个步骤实现小流域范围的划分。图3示出了青海黄南州热贡文化生态保护实验区的小流域范围的划分结果。
[0072]
土地利用模式和利用方式在一定程度上决定了一个地区经济、社会以及景观生态安全格局的发展方向,这些都是重要的文化生态因子。土地利用模式会对地区文化生态平衡产生重要的影响。文化生态保护区规划中,必须对影响地区土地利用的重大产业(项目)作出相关协调,维护地区文化生态的平衡和完整。对于影响景观生态安全的重大基础设施(例如,水电站、变电站、公路、铁路、水库)项目必须进行文化生态影响评估;对影响传统农业景观,特别是占用基本农田的项目,必须谨慎建设。
[0073]
图4是根据本发明实施例的对于土地利用相关的文化生态因子的识别提取与分析的示图。
[0074]
如图4所示,在严格保护热贡文化生态保护实验区的人文、自然生态安全的基础上,对可能会对保护产生影响的重大拟建项目提出了调整选线的建议方案。
[0075]
此外,地形分析应用等高线、高程点生成数字高程模型,在此基础上对区域的高程、坡度、坡向、起伏度的地形特征进行分析,以有助于了解规划区的地形条件特征,同时分析结果可以作为生态敏感性、用地适宜性等专项评价的因子。
[0076]
图5示出了应用1:50000等高线和高程点数据构建dem的示图,在此基础上对坡度、坡向等地形要素进行了识别提取和分析,可以为后续的水土流失风险评价和生态适宜性评价提供了数据源。
[0077]
根据本发明的实施例,所述文化生态因子的识别提取方法还可以包括:通过地统计学方法对提取到的文化生态因子进行统计,以获得定量的空间分布信息。
[0078]
地统计学是以具有空间分布特点的区域化变量理论为基础,研究自然现象的空间变异与空间结构的一门学科。由于最先在地学领域应用,故称为地统计学。地统计学的主要理论是法国统计学家马西森(g.matheron)创立的,经过不断完善和改进,目前已成为具有坚实理论基础和实用价值的数学工具。地统计学的应用范围十分广泛,不仅可以研究空间分布数据的结构性和随机性、空间相关性和依赖性、空间格局与变异,还可以对空间数据进行最优无偏内插,以及模拟空间数据的离散性及波动性。
[0079]
地统计分析的核心是通过对采样数据的分析以及对采样区地理特征的认识,选择合适的空间内插方法创建表面。按照实现插值方法的数学原理可以将插值方法分为两类:确定性插值方法,和地统计插值方法。确定性插值方法以研究区域内部的相似性(例如,反距离加权插值法),或者以平滑度为基础(例如,径向基函数插值法)由已知样点来创建表面。地统计插值方法利用已知样点的统计特性,不但能够量化已知点之间的空间自相关性,而且能够解释说明采样点在预测区域范围内的空间分布情况。
[0080]
地统计学由分析空间变异与结构的变异函数及其参数和空间局部估计的克里格插值法(kriging)两个主要部分组成。克里格插值法又称空间局部插值法,是目前应用最为
广泛的地统计差值方法,是以变异函数理论和结构分析为基础,在有限区域内对区域化变量进行无偏最优估计的一种方法。克里格插值法包括根据未知样点有限邻域内的若干已知样点数据,在考虑了已知样点的形状、大小和空间方位,与未知样点的相互空间位置关系,以及变异函数提供的结构信息之后,对未知样点进行线性无偏最优估计。
[0081]
在区域规划工作中,地统计学方法不仅可以对自然环境的定量特征进行提取和分析,还可以对社会、经济等数据进行分析,从中提取定量的空间分布信息。例如,可以制作人口密度图反映城市人口聚集情况,或根据污染源数据来分析城市污染的分布情况。因此,可以利用地统计学方法对提取到的各种文化生态因子进行统计,以获得定量的空间分布信息。
[0082]
下面,对利用基于大数据的自然语言处理与信息检索(nlpir)语义智能分析技术识别提取无形文化生态因子(例如,非物质人文环境因子、技术信息因子、区域人群与外部文化因子以及制度与政策因子)进行说明。
[0083]
对于自然语言的理解需要基于语义的分析。自然语言中,语义是指篇章中所有句意的综合,句子的语义由组成句子的单位词来确定。对词语的解析包括对词义的解析以及词与词之间关系的解析,这些是语义分析的基础,是执行信息抽取、机器翻译等操作的基础问题。对篇章级别的语义分析还包括提取文本的主题和类别,进而实现大规模文本的管理和挖掘。
[0084]
语义分析指的是,将给定的自然语言(包括篇章和句子)转化为反映其意义的特定形式化表示,即,将人类能够理解的自然语言转化为计算机能够理解的形式语言,从而做到人与机器的互相沟通。语义分析需要面向整个句子,不仅需要分析句子中主要谓词与其论元之间的语义关系,还需要分析非主要谓词包含的语义信息,例如,数量、属性和频率等。
[0085]
自然语言处理语义分析是自然语言处理技术走向深层应用的发展,包括两种主要的语义分析方法:基于统计的特征向量抽取方法和基于语义词典(例如,wordnet、hownet等)的语义相似度计算方法。
[0086]
语义分析不仅包括事物的本质,还包括事物之间的关系。语义分析是对事物本身及其逻辑关系进行描述,通过对文本中包含的信息及其关系进行识别,构建计算模型,从而使机器理解人类语言。
[0087]
在对于中文进行语义分析时有多个技术难点。中文的多样性给中文的分词带来了难度,中文的分词需要建立在完整的语义理解的基础上。对于中文并没有一个公认的能够用于计算机处理的语法规则,这也就给中文分析带来了困难。目前,中文的分词基于统计和词典的分词方法,因此,需要处理好分词精度和分词速度之间的关系。此外,中文词汇通常有多个含义,在进行语义分析的过程中,要尽可能降低歧义的出现。
[0088]
基于大数据的自然语言处理与信息检索(nlpir)语义智能分析技术能够满足大数据挖掘对语法、词法和语义的综合应用。nlpir大数据语义分析系统能够全方位多角度完成对大数据文本的处理需求,包括完整的大数据技术链条:网络抓取、正文提取、中英文分词、词性标注、实体抽取、词频统计、关键词提取、语义信息抽取、文本分类、情感分析、语义深度扩展、繁简编码转换、自动注音、文本聚类等。
[0089]
根据本发明的实施例,可以将基于大数据的语义分析技术应用于无形的文化生态因子(例如,非物质人文环境因子、技术信息因子、区域人群与外部文化因子以及制度与政
策等因子)的识别提取和分析,从而对海量文本信息进行有效的语义分析,通过自然语言处理、信息检索、信息分类、信息过滤、语义挖掘,对无形的文化生态因子进行科学的分析判断。基于大数据进行分析,可以避免个人意志带来的主观性、片面性和局限性,减少因缺少数据支撑而带来的偏差。通过大数据挖掘和分析技术,可以有针对性地解决文化生态保护与社会治理难题,针对不同社会细分人群,提供精细化的服务和管理。
[0090]
大数据分析的数据来源包括,但不限于,政府信息公开的文件,如政府年鉴、工作报告、统计公告等。此外,还可以结合互联网实时数据(例如,通讯大数据、地图大数据、文旅市场大数据、自媒体大数据、招聘大数据等),对非结构化长文本采用语义分析技术,增强数据的全面性、科学性。
[0091]
文本信息的提取基于信息抽取技术,例如,对于经济类文档,可以提取其中数值及对应含义,以构建经济数据库。后续可根据经济数据库,针对产业活跃度、区域经济关联度、社会消费热点、社会通胀通缩预期等进行分析预判。
[0092]
此外,根据本发明的实施例,可以通过基于语义分析的智能检索技术对各类互联网信息进行全面采集,收集网络上各类碎片化信息,对技术信息因子与外部文化因子进行分析,进行地域画像等地方特定主体分析;对制度与政策文件利用大数据语义智能处理,进行关键词提取、词频统计,以制作词云图,展示制度核心概念与政策主导方向;还可以通过挖掘新词来提取新理念、新观点,展示政策的新方向与新部署,以有利于对文化生态保护进行指导。
[0093]
根据本发明各实施例的文化生态因子的识别提取方法,能够科学地、定量地识别并提取各种文化生态因子,对文化生态系统的研究、监测与保护提供具体实际的数据,极大地促进了对于文化生态的保护。通过现代技术的应用,使影响文化生态保护区可持续发展的各项因子体系化、规律化,以便于在规划保护中应用并掌握。此外,在提高管理效率的同时,还可以将对文化生态的破坏控制到最小限度。
[0094]
图6是根据本发明实施例的文化生态因子的识别提取装置的示意性框图。
[0095]
如图6所示,本发明的实施例还提供一种文化生态因子的识别提取装置,包括:自然环境识别提取模块,用于识别并提取自然环境因子;人文环境识别提取模块,用于识别并提取人文环境因子;技术信息识别提取模块,用于识别并提取技术信息因子;人群与外部文化识别提取模块,用于识别并提取区域人群与外部文化因子;以及制度与政策识别提取模块,用于识别并提取制度与政策因子。
[0096]
根据本发明实施例的文化生态因子的识别提取装置可用于执行根据本发明实施例的文化生态因子的识别提取方法,其具体描述可参见关于文化生态因子的识别提取方法的前述各实施例的描述,在此不再赘述。
[0097]
本发明的实施例还提供一种电子装置,包括:一个或多个处理器;以及存储器,其上存储有一个或多个计算机程序,其中,当一个或多个计算机程序被一个或多个处理器执行,使得一个或多个处理器实现根据本发明各实施例的文化生态因子的识别提取方法。
[0098]
处理器为具有数据处理能力的器件,其包括(但不限于)中央处理器(cpu)等;存储器为具有数据存储能力的器件,其包括(但不限于)随机存取存储器(ram,更具体如sdram、ddr等)、只读存储器(rom)、带电可擦可编程只读存储器(eeprom)、闪存(flash)。
[0099]
本发明的实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算
机程序被处理器执行时,使得处理器实现根据本发明各实施例的文化生态因子的识别提取方法。
[0100]
根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例还提供一种计算机程序产品,其包括有形地包含在计算机可读存储介质上的计算机程序,计算机程序包含用于执行根据本发明各实施例的文化生态因子的识别提取方法的程序代码。在这样的实施例中,该计算机程序可以从网络上下载和安装,和/或从可拆卸存储介质安装。
[0101]
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器(如中央处理器、数字信号处理器或微处理器)执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读存储介质上,计算机可读存储介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd

rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
[0102]
尽管已经参照本发明的示例性实施例具体示出和描述了本发明,但是将理解,在不脱离如所附权利要求限定的本发明的精神和范围的情况下,可以在本文中做出形式和细节上的各种改变。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1