社区数据分析方法、装置、社区智能交互平台及存储介质

文档序号:25586599发布日期:2021-06-22 17:01阅读:410来源:国知局
社区数据分析方法、装置、社区智能交互平台及存储介质

本发明涉及一种社区数据分析方法、装置、社区智能交互平台及存储介质,属于数字治理和社区发展规划领域。



背景技术:

社区是社会治理的基石,促进社区“善治”是新时代对社区规划的顶层设计指引。完整社区的构建也被划入2020年国家住房和城乡建设部的工作重点,强调社区建设应在补足公共服务资源短板的基础上,进一步加强社区的治理属性,以更好地适配社区居民日益增长的美好生活需要。

针对完整社区与社区共建共治共享治理体系的构筑及推广,国内各地的城乡社区已陆续开展美好环境与幸福生活共同缔造活动,深入基层社区开展群众访谈、问卷调查、交流讨论会等具体活动,专家和学者也为共同缔造活动应如何开展与落实提供了许多有益的指引。然而,共同缔造活动由于财力、物力、人力不足,覆盖的社区仍十分有限,尚难以形成长效的运作机制。基层社区仍面临突出的管理困难问题,亟需补足社区设施、资源与治理能力短板,以智慧、高效、系统地提升基层社区的治理水平。

信息通信技术已深度渗透到国家治理的各个领域,基于信息通信技术的数字治理模式已然成为国家治理体系与治理能力现代化的基本特征,但在社区的层面,治理数字化、精细化与智能化的方法及机制仍有待进一步挖掘。



技术实现要素:

为了解决上述现有技术的不足之处,本发明提供了一种社区数据分析方法、装置、社区智能交互平台及存储介质,其运用大数据技术平台实现对海量社区数据资源的专业化收集、分析及处理,获得不同社区居民的基本行为模式,挖掘各类行为模式关联的居民社会经济属性,计算社区生活圈设施的可达性,分析各主体在社区治理网络中的作用,并进一步提供由政府、企业、专家学者、社区居民、社会组织等多元主体共同参与的信息交流与决策互动的社区智能交互平台。有助于提升国内基层社区治理的质量与效率,明晰社区治理的智慧方法及协同机制,深化推进完整社区与共建共治共享体系的构筑与完善。

本发明的第一个目的在于提供一种社区数据分析方法。

本发明的第二个目的在于提供一种社区数据分析装置。

本发明的第三个目的在于提供一种社区智能交互平台。

本发明的第四个目的在于提供一种存储介质。

本发明的第一个目的可以通过采取如下技术方案达到:

一种社区数据分析方法,所述方法包括:

获取社区居民的时空轨迹数据和个人信息数据,将时空轨迹数据和个人信息数据与基础地理区块数据绑定,并将社区居民各项活动标识为不同的类型;

通过不同的活动类型组成的序列对社区各个居民每天的活动进行记录;

对各社区的居民活动进行序列分析,获得不同社区居民的基本行为模式;

根据居民的个人信息数据,挖掘各类行为模式关联的居民社会经济属性。

进一步的,所述对各社区的居民活动进行序列分析,获得不同社区居民的基本行为模式,具体包括:

对社区各居民序列进行比对;

依据序列相似度进行归类,每个序列分类代表一种行为模式;

根据社区各居民序列进行比对结果,获得不同社区居民的基本行为模式。

进一步的,所述对社区各居民序列进行比对,具体包括:

构建赋值函数:若两序列对应的字符,匹配则赋值1分,错配则赋值0分;任一序列链出现gap,记作空位罚分d;

两序列比对:当两序列比对时,全局比对使用needleman-wunsch算法,局部比对使用smith-waterman算法,每次均通过两种算法进行比对,选择匹配结果最优的一种算法完成序列比对。

进一步的,所述依据序列相似度进行归类,每个序列分类代表一种行为模式,具体包括:

在全局比对中,hij的计算公式为:

在局部比对中,hij的计算公式为:

两序列比对的相似度得分记为s,计算公式为:

s=hijmax

依据s值,将两两比对得分最高的序列归为同一类,每个序列分类代表一种居民行为模式;其中,hij表示第i行第j列的矩阵单元的相似度,wij表示第i行第j列的相似度权重,d代表空位罚分。

进一步的,所述根据社区各居民序列进行比对结果,获得不同社区居民的基本行为模式,具体包括:

将多条序列进行多序列比对分析,将比对结果使用最大似然法建构进化树,提取进化树中各分支的典型序列进行分析,获得不同社区居民的基本行为模式。

进一步的,所述根据居民的个人信息数据,挖掘各类行为模式关联的居民社会经济属性,具体包括:

从居民个人信息数据中获取居民的社会经济属性,将居民的社会经济属性进行编码,挖掘各序列分类内部的居民社会经济属性频繁项,得到各种行为模式关联的高频居民社会经济属性。

进一步的,所述方法还包括:

根据各社区的居民行为模式,倒推出各社区居民常用的服务设施类型,计算社区生活圈设施的可达性。

进一步的,所述方法还包括:

获取多元主体在交互平台的社区交流论坛中的关注信息和评论信息,通过构建社区治理中多元主体的关系网络,分析各主体在社区治理网络中的作用;其中,所述构建社区治理中多元主体的关系网络,分析各主体在社区治理网络中的作用,具体包括:

构建社区治理中主体的关系网络,计算网络内部各节点的度中心度、接近中心度与中介中心度,分析多元主体在社区治理网络中的作用。

本发明的第二个目的可以通过采取如下技术方案达到:

一种社区数据分析装置,应用于云服务器,所述装置包括:

获取单元,用于获取社区居民的时空轨迹数据和个人信息数据,将时空轨迹数据和个人信息数据与基础地理区块数据绑定,并将社区居民各项活动标识为不同的类型;

序列单元,用于通过不同的活动类型组成的序列对社区各个居民每天的活动进行记录;

分析单元,用于对各社区的居民活动进行序列分析,获得不同社区居民的基本行为模式;

关联单元,用于根据居民的个人信息数据,挖掘各类行为模式关联的居民社会经济属性。

本发明的第三个目的可以通过采取如下技术方案达到:

一种社区智能交互平台,所述平台包括用户端、工作人员端和云服务器,所述用户端、工作人员端和云服务器分别两两连接,所述用户端、工作人员端和云服务器具体包括:

所述用户端,用于输入信息,并将输入的信息发送给工作人员端;

所述工作人员端,用于对用户端发送的信息进行审核以及信息登记和建档,并将审核后的信息返回给用户端,以及发送给云服务器;

所述云服务器,用于执行上述的社区数据分析方法。

本发明的第四个目的可以通过采取如下技术方案达到:

一种存储介质,存储有程序,所述程序被处理器执行时,实现上述的社区数据分析方法。

本发明相对于现有技术具有如下的有益效果:

通过获取社区居民的时空轨迹数据与个人信息数据,通过进行序列分析,获得不同社区居民的基本行为模式和社会经济属性,可用于辅助规划从业者进行社区公共服务设施的规划决策,以及为相关企业提供商业服务设施布局与定位的决策参考;通过各社区的居民行为模式,倒推出各社区居民常用的服务设施类型,使用累计机会法计算社区生活圈设施的可达性,可用于对各社区的设施总体可达性进行评价及设计;通过构建社区治理中多元主体的关系网络,可观察政府、企业、社会组织、专家学者、居民、业委会等利益攸关方在社区治理中的网络关系,通过计算可量化测度多元主体在治理网络中作用;社区智能平台实时采集各个网络平台关于各社区的新闻、评论和投诉信息,提取出有用信息,用于指导社区居住环境品质的改善与提升。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。

图1为本发明实施例1的社区智能交互平台的结构框图。

图2为本发明实施例1的社区数据分析方法的流程图。

图3为本发明实施例1的全局比对结果更优的全局比对算法的两条序列的比对结果图。

图4为本发明实施例1的全局比对结果更优的局部比对算法的两条序列的比对结果图。

图5为本发明实施例1的局部比对结果更优的全局比对算法的两条序列的比对结果图。

图6为本发明实施例1的局部比对结果更优的全局比对算法的两条序列的比对结果图。

图7为本发明实施例1的sk的fp树示意图。

图8为本发明实施例1的最终构成整体的fp树示意图。

图9为本发明实施例1的c3的fp子树示意图。

图10为本发明实施例1的b2的fp子树示意图。

图11为本发明实施例2的社区数据分析装置的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1:

本实施例提供了一种社区智能交互平台,如图1所示,该平台是基于微信小程序/app/网站、云服务器和多源异构数据搭建的,其包括用户端、工作人员端和云服务器,用户端与工作人员端连接,所述云服务器分别与用户端、工作人员端连接,用户端包括信息登记模块、社区服务模块和监管模块,工作人员端包括认证模块,云服务器包括社区服务模块、数据服务模块和监管模块,各个模块的具体说明如下:

一、信息登记模块

用户登录/注册界面是居民、企业与社会组织等进行信息登记的接口,居民需填写身份信息、受教育水平、收入水平、婚育状况等个人信息,企业(如物业管理公司)和社会组织(如养老服务站、职工之家、义工组织等)需登记公司/组织的各项信息及项目库、业务数据等。

二、认证模块

由工作人员在后台对登记注册的居民信息进行审核,对企业、社会组织及其从业人员进行资格审查以及信息登记、建档;工作人员主要是指就职于相关政府部门、街道办、居委会等人员。

三、社区服务模块

在平台中点选“社区服务”可跳转至此页面,主要包含社区信息展示、项目申请及管理、活动报名/服务申请、社区交流论坛、社区管理五个部分,且可继续内置其他板块。

(一)社区信息展示:包括社区的相关政策、规划文件,企业/社会组织资料,社区公共服务设施、公共开放空间等信息,包括其空间位置、使用及维护情况等。

(二)项目申请及管理:政府在此页面展示政府购买社会服务、以奖代补等政策标准、细则及预算,并开放由街道办、企业、社区组织、居民等提交相关社区项目申报的途径。项目申报的结果及项目的运营情况、财政收支、社会效益等信息均在此界面中展示/公示。

(三)活动报名/服务申请:在此页面展示各类社区活动及服务的内容介绍以及举办时间等信息,并开放居民申请参加活动/服务或担任志愿者的入口。社区类型涵盖社区微改造、社区农场、艺术活动、交流讨论会等,社区服务类型包括长者关怀、早教学堂等。

(四)社区交流论坛:用户登陆后可访问此页面。交流功能的实现采用网络论坛(bulletinboardsystem,bbs)及群组聊天的模式,具体包含社区业委会、居民内部的讨论群组,各方可在论坛上发帖或回复帖子;内置页面调查政府、企业、社会组织、居民对社区各项工作的满意度,并可进行社区事务选举投票等意见征集活动;此页面也开放投诉与举报的接口。

(五)社区管理:涵盖安保与物业管理两部分。安保板块包括闭路监控系统连网管理、停车位管理、消防管理、门禁值班人员信息展示等。物业管理板块包括物业、水、电、煤气等费用缴纳、维修申报、咨询投诉、邻里调解等。

此外,社区服务模块还可内置其他板块,如进行社区居民认知地图调查、社区设施及公共空间认管等,或可为社区微改造、共同缔造等重要社区活动设置专属板块。

四、数据服务模块

在平台中点选“数据服务”可跳转至此页面,数据服务模块主要包括数据采集与处理、数据共享及模型分析三部分。

(一)数据采集与处理

1、数据源主要包括:

(1)官方基础数据库:

接入各级政府、街道办、居委会、派出所、规划设计院等历年的基础数据库,包括地理信息库、法人库、项目库、人口库、社区规划文件、出租屋登记信息、监控布点信息、犯罪记录、就医记录、学籍登记信息、统计年鉴、统计公报数据、社区房屋属性等;

(2)网络开源数据库:

社区物质空间属性:接入网络地图数据。利用python的requests、pandas、json库以及相关代码,爬取开源网络地图(如百度地图、高德地图的api)中“商务住宅”等各类别下的poi与aoi信息,提取城乡社区及各类设施的兴趣点(pointofinterest,poi)及其矢量边界(areaofinterest,aoi)、道路、绿地、水系等数据。

居民时空轨迹:利用手机信令数据(如百度地图慧眼数据、联通智慧足迹)提取居民的轨迹数据。

社情民意:实时采集各个网络平台(如人民网、新华社、黑猫投诉、知乎、百度贴吧等)关于各社区的新闻、评论/投诉信息;

(3)交互平台数据:

居民社会经济属性:信息登记模块可采集到居民的身份信息、受教育水平、收入水平、婚育状况等个人信息。

企业(如物业及各种生活服务业)和社会组织(如养老服务站、职工之家、义工组织等)的基本信息以及项目库、业务数据等,同样经由信息登记模块采集。

各方满意度:通过交互平台获取政府、居民、企业/社会组织对社区各项工作开展的满意度。

由于采集到的数据结构各异,尤其是许多原始数据信息庞杂,需通过对各类数据、信息进行清洗、加工、处理,以充分挖掘数据价值。

2、数据处理的内容主要包括:

(1)社区物质空间属性

通过对网络地图爬取的poi和aoi数据去重及清除无效信息后,提取出各社区及各类设施(如餐饮、购物、公司企业、交通设施服务等类别)的名称、矢量边界、经纬度以及道路、水系、绿地的矢量边界。

(2)居民身份信息与轨迹数据

首先整合上述基础地理区块信息备用,然后对原始的手机信令数据进行处理,基于降噪校准技术还原用户真实驻留与出行信息。选择spark集群数据处理平台,将清洗过后的手机信令数据和基础地图信息存储其中,匹配基站小区和地理区块aoi的拓扑关系,将用户轨迹数据投射到地理实体。此外,手机信令数据由于绑定了居民的身份证信息,可根据姓名与信息等级模块中采集到的居民个人信息进行关联,获得居民的性别、年龄、受教育水平、收入水平等个人经济属性数据以及出行轨迹数据。

(3)社区相关企业和社会组织信息

将各社区的企业和社会组织及相关工作人员分门类进行登记,并将各个企业/社会组织与社区建设、管理相关的项目进行分类建档。

(4)新闻报道、评论、投诉等

由于当前缺乏官方的社区交流平台,社区业主/租户在微信群、黑猫投诉、知乎、百度贴吧、新浪微博等均有居民对社区的评论和投诉信息,人民网、新华社等各种网络媒体也有关于各社区的相关信息。通过网络爬虫手段,从上述网站采集社区的相关信息,通过python编程对文本进行检测,剔除涉黄、广告等垃圾文本,将剩余文本留存备用。

(5)涉及个人隐私信息和商业机密的数据信息

平台需特别对涉及个人隐私信息和商业机密的相关数据信息进行分级分类的加工处理,如对姓名、身份证号、家庭住址、收入等敏感信息需进行针对性保护,以提升数据信息安全防护能力。

(二)数据共享

面对不同的用户开放共享不同数据,且部分数据内容允许用户修改、增减。用户类型涵盖政府、技术支持方(如科研机构、规划设计院等)、社会组织、企业、社区居民等,其中涉及个人和商业机密的数据信息均需进行脱敏处理。此外也提供各类表格、规范文件下载,以及各类社区活动的工作手册和范例展示。

(三)模型分析

基础数据储存于云服务器,供后台分析人员进行模型运算分析。

如图2所示,本实施例提供了一种社区数据分析方法,该方法包括居民活动序列分析、社区生活圈设施可达性分析和社区治理网络分析,具体包括以下步骤:

s201、获取社区居民的时空轨迹数据和个人信息数据,将时空轨迹数据和个人信息数据与基础地理区块数据绑定,并将社区居民各项活动标识为不同的类型。

进一步地,该步骤s201具体包括:

s2011、整合基础地理区块信息。

通过对网络地图爬取的poi和aoi数据去重及清除无效信息后,提取出各社区及各类设施如餐饮、购物、公司企业、交通设施服务等类别的名称、矢量边界、经纬度以及道路、水系、绿地的矢量边界,并进行整合。

s2012、对原始的手机信令数据进行处理,基于降噪校准技术还原用户真实驻留与出行信息。

s2013、选择spark集群数据处理平台,将清洗过后的手机信令数据和基础地图区块信息存储其中,匹配基站小区和地理区块aoi的拓扑关系,将用户轨迹数据投射到地理实体。手机信令数据由于绑定了居民的身份证信息,可根据信息等级模块中采集到的居民个人信息进行关联,获得居民的性别、年龄、受教育水平、收入水平等个人经济属性数据以及出行轨迹数据。

s2014、基于居民的时空轨迹数据与采集到的个人信息数据,且该数据已绑定基础地理区块数据,据此可将居民各项活动识别为居家(a)、工作(b)、上学(c)、就医(d)、购物(e)、休闲锻炼(f)、观光旅游(g)、外出办事(银行、邮局、图书馆等)(h)、其他(i)九类。其中,居住地和工作/上学地的识别规则需添加以下两条:

(1)、在9:00到17:00内停留时间最长的记为工作/上学地,在21:00到次日8:00停留时间最长的记为居住地;

(2)、且须满足一个月内工作日天数超过10天的条件。

s202、通过不同的活动类型组成的序列对社区各个居民每天的活动进行记录。

将社区内部的居民的活动类型分别记为a-i,则各个居民每天的活动由英文字符组成的序列记录。如:a(居家)-b(工作)-h(外出办事)-a(居家)-f(休闲锻炼)。

s203、对各社区的居民活动进行序列分析,获得不同社区居民的基本行为模式。

进一步的,该步骤s203具体包括:

s2031、对社区各居民序列进行比对。

通过python编程,使用序列比对算法对各居民序列进行比对,具体包括:

(1)构建赋值函数

若两序列对应的字符,匹配则赋值1分;错配则赋值0分;任一序列链出现gap,记作空位罚分d,此处取-1分。上述匹配、错配以及空位罚分的实际取值,均可根据需求进行调整。设第i行第j列的相似度权重为wij,其公式为:

(2)两序列比对

hij表示第i行第j列的矩阵单元的相似度,d代表空位罚分。其中,全局比对使用needleman-wunsch(nw)算法,强调对居民全天活动匹配的识别;局部比对使用smith-waterman(sw)算法,强调对居民局部时段活动匹配的识别;由于不同的两条序列使用这两种方法可能会出现不同的效果,所以每次均通过两种算法进行比对,并选择匹配结果最优的一种完成序列比对。

在全局比对中,hij的计算公式为:

在局部比对中,hij的计算公式为:

a、全局比对结果更优的场景:

假设两条序列分别为adaf和abhaf,横轴为gap-a-d-a-f,纵轴为gap-a-b-h-a-f,第一行与第一列每一格的值分别为从0减去一个空位罚分(此例中则为1),其他每一个格子的值可以来源于三个方向,从上、从左、从左斜上方。如果该格子两个字母能够对应,则取左斜上方的值+1,若不对应则取左斜上方的值+0;从上方则取上方值减去一个空位罚分(此例中则是-1),从左方则同样取左方值-1。该格子的值取三个方向中数值最大的一个。使用局部比对方法时,若该最大值为负值,则取0;使用全局比对方法时,不论最大值是否为负值,均取其原值,不需要取0。

在这两条序列的比对中,找到最后一列的最大值,反推回去,沿路均取最大值,则找到最优比对路径。

若使用全局比对nw算法,这两条序列的比对结果如图3所示,有三组值能对应。

若使用局部比对sw算法,这两条序列的比对结果如图4所示,仅有两组值能对应,这两组序列使用全局匹配方法更为合适。

b、局部比对结果更优的场景:

假设两条序列分别为afac和ghaea,若使用全局比对nw算法,这两条序列的比对结果如图5所示,有一组值能对应;若使用局部比对sw算法,这两条序列的比对结果如图6所示,有两组值能对应。

这两组序列使用局部比对方法更为合适,局部比对方法更有益于捕捉两条序列中匹配度较高的部分。

s2032、依据序列相似度进行归类,每个序列分类代表一种行为模式。

依据序列相似度进行归类,相似度最大的序列自成一组;每个序列分类代表一种行为模式;

两序列比对的相似度得分记为s,计算公式为:

s=hijmax

依据s值,将两两比对,得分最高的序列归为同一类,每个序列分类代表一种居民行为模式。如“居住-工作-外出办事-工作-购物-居住”、“居住-休闲锻炼-就医-购物-居住”等。

s2033、根据社区各居民序列进行比对结果,获得不同社区居民的基本行为模式。

将多条序列导入mega软件中并进行多序列比对分析,使用clustalw比对序列,将分析结果导出为mega格式。重新将mega文件载入mega软件中,使用最大似然法建构进化树,提取进化树中各分支的典型序列进行分析,归纳总结出居民的主要行为模式类型;进一步地,使用此方法可了解不同社区居民的基本行为模式。

s204、根据居民的个人信息数据,挖掘各类行为模式关联的居民社会经济属性。

根据居民的个人信息数据,获取居民的社会经济属性数据并进行编码,通过python编程,使用fp-growth算法挖掘各序列分类内部的居民社会经济属性频繁项。

居民的社会经济属性分为二级编码,第一层包括性别(a)、年龄(b)、职业(c)、收入(d)、支出水平(e)、健康状况(f)等,第二层为第一层的各分类选项,比如性别分为男(1)、女(2)两类。按此规则,男性记为“a1”,女性记为“a2”。按照上一步的分类,分别挖掘各类居民行为模式中所属居民的社会经济属性。

第一,将每个居民的属性序列记为s1={a1,b2,c2,d1,e2,f2},s2={a2,b2,c1,d2,e3,f1}……,遍历所有序列中所有社会经济属性单项的数据集合,计算各项的支持度,即其出现的次数;第二,基于支持度降序对所有社会经济属性数值进行降序排序,如“c3:54次;a1:49次;a2:46次;b2:40次;d2:38次;e5:32次;f1:30次……”;第三,剔除居民社会经济属性的非频繁项,即出现次数小于一定次数的数值,在此例中,设置边界支持度为总样本量(居民数量)的10%;第四,逐条读取各条序列(s1、s2等),依序将各条序列中的各个字符插入fp树;排序靠前的字符记为祖先节点,靠后的记为子孙节点。比如序列sk={a1,b2,c3,d2,e5,f1},则fp树构造如图7所示。以此类推,读取其他序列,并插入fp树中,若有共同的祖先,则对应的共同祖先节点数目加1,最终构成整体的fp树,如图8所示,下图仅为示意图;第五,构建条件fp树,从最底层的节点字符依次向上探寻项头表项对应的条件模式基,递归挖掘得到频繁项集,并返回适用的频繁项集。比如c3的子树如图9所示,频繁项集为(c3:54)。而b2的子树为:频繁项集本身包含(b2:24),挖出(a1:17),(a2:7),(c3:24),加上b2的前缀变(b2a1:17),(b2a2:7),(b2c3:24),此结果还要结合其他子树得到最终形式,如图10所示。

上述各频繁项的提取可以通过python编程得到。以此,可得出各种行为模式关联的高频居民社会经济属性及其组合,即得以解答“什么居民会有什么时空间行为模式”。同样的,在每个社区应用此方法,结合上一步骤,可得知每个社区中居民的主要行为模式,居民的主要社会经济属性,可用于辅助规划从业者进行社区公共服务设施的规划决策,以及为相关企业提供商业服务设施布局与定位的决策参考。

s205、根据各社区的居民行为模式,倒推出各社区居民常用的服务设施类型,计算社区生活圈设施的可达性。

采用上述居民活动序列分析方法,得到各社区的居民行为模式,据此,可倒推出各社区居民常用的服务设施类型,记为设施集合f,集合内的各项设施记为fj,j=1,2,……,n,f={f1,f2,......,fn}。

累计机会法可计算出一定时间及空间距离内可达的设施数量,在此用于测度社区设施的可达性。依据国家《城市居住区规划设计标准》gb50180-2018,城市居住区可划分为三级生活圈,分别对应五、十、十五分钟可达,步行距离分别对应300、500及1000米,采用累计机会法可测算出各类设施在此三级生活圈内的可达性。

累计机会法的计算公式为:

aj=pjf(d)

其中,aj代表社区中设施j的累计机会可达性,pj为设施j的机会(数量或质量),f(d)是个二元变量,当社区到设施j的距离成本d小于设定阈值时,f(d)取值为1,否则为0。结合poi数据,逐次计算每个社区的设施集fj在不同的社区生活圈范围内(300、500、1000米)的累计机会可达性,若三个生活圈范围内的设施累积机会可达性均为0,则需参照《城市居住区规划设计标准》中对各级生活圈设施配置的规定进行相应的设施补足。在具体的设施建设方面,还可参照居民活动序列分析中的结果,依据包含该类设施的居民活动模式关联的高频居民社会经济属性,更有针对性地依据居民社会经济属性进行设施设计。

此外,累计机会法也可对社区中各类设施的可达性进行综合测度,对各社区的设施总体可达性进行评价,计算公式为:

s206、获取多元主体在交互平台的社区交流论坛中的关注和评论信息,通过构建社区治理中多元主体的关系网络,分析各主体在社区治理网络中的作用。

其中,多元主体包括政府、企业、社会组织、业委会、专家学者和居民。

通过python的networkx库构建社区治理中主体的关系网络,并计算网络内部各节点的度中心度、接近中心度与中介中心度。

进一步的,该步骤具体为:

s2061、构建社区治理中多元主体的关系网络。

将主体之间的关系分为对称和单向两种,其中对称关系指在交互平台的社区交流论坛中的互相关注、互相评论等;而单向关系指单方面的关注,对某个帖子进行评论等等。基于形成的社会网络,可观察政府、企业、社会组织、专家学者、居民、业委会等利益攸关方在社区治理中的网络关系。

s2062、通过对网络内各节点的度中心度、接近中心度和中介中心度的计算,可量化测度多元主体在治理网络中的作用。

(1)度中心度(degreecentrality)

节点的度中心度代表该节点与网络内其他节点连接线的总和,可代表该节点主体在社区治理网络中的凝聚力强度。由于连接是有方向的,度中心度可进一步分为入度(in-degree)和出度(out-degree)。入度表示该节点主体在社区治理网络中受到的关注程度,值较大则代表其具有较高的声望,更有可能引导社区治理网络的行动及交流;出度则代表该节点主体关注网络内其他主体的程度,值较大则表明该节点主体在网络中具有较强的交际性和积极性。在实践中可将入度值较高的主体识别为社区治理的主导者、引领者,而将出度值较高的主体识别为积极的参与者。

若一个网络中具有n个节点,则节点i的度中心度cdi的计算公式为:

其中,用于计算节点i与其他n-1个节点的联系数量。为消除网络规模本身对节点的度中心度值的影响,对其进行标准化,公式如下:

cd(i)′=cdi/(n-1)

(2)接近中心度(closenesscentrality)

接近中心度表示节点与网络内其他节点的近邻程度。由于社交网络各节点的连接具有方向性,据此可分为入接近中心度(in-closenesscentrality)和出接近中心度(out-closenesscentrality)。实际上,共同缔造等社区治理活动与实体空间具有强关联性,现阶段大部分社区治理活动在线下展开,也需要培育线下专业的社会组织及相关从业人员。因而,接近中心度指标可识别出在地理空间中具有较高接近中心度的社区治理主体及其所在社区,并可将更多重要的线下社区治理、规划活动(如社区微改造、共同缔造工作坊)布置在在此类社区,以扩大示范社区的影响力与辐射力。

具体地,提取出社交网络中的各主体的居住地作为该主体的节点位置。相对于其他节点j,节点i的接近中心度公式为:

(3)中介中心度(betweennesscentrality)

在某一社会网络中拥有最高度中心度的个体并不一定是最活跃的个体。中介中心度可量度跨群组节点连接不同群组网络的作用。如在实践中,一个居民同时是社区社会组织、业委会的成员,参加了不同的社区活动,回复或发布了多个帖子,则该居民存在于由不同主体所构成的多个社区治理网络中。以此可识别出部分关键的治理主体(如社会组织、业委会的干部、成员等)在不同治理网络中的作用,以及该主体在各个网络内部的成员联系中发挥的作用。

则节点β的中介中心度的计算公式为:

其中,σij(β)是从节点i到节点j经过节点β的最短路径数目,σij是从节点i到节点j的最短路径数目,cb(β)度量了节点β在连接节点i和节点j的重要性。

在实际情况中,节点i与j经过节点β的路径可被解释为,成员i经过成员β的推荐(类似名片推荐功能),与成员j成为好友,或成员i和j在成员β发布的帖子下互相评论,或同时加入成员β建立的群组等。

应当注意,尽管以特定顺序描述了上述实施例的方法操作,但是这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

此外,该方法还可基于社区照片等资料,识别社区的物质空间环境特征,构建相应的评价指标对社区的环境品质进行评分及监测,评价分析结果可用于指引社区微改造、老旧小区改造等规划实践的开展。

此外,模型分析模块还可内置其他分析功能。如运用轻量、快速的mobilenet卷积神经网络模型,并基于社区照片等资料,识别社区的物质空间环境特征,构建相应的评价指标对社区的环境品质进行评分及监测,评价分析结果可用于指引社区微改造、老旧小区改造等规划实践的开展。

五、监管模块

针对政府工作的监管指标包括办事效率、财政收支、组织协商会议及相关活动的次数、居民满意度等;针对企业/社会组织的监管指标包括项目进度、财政收支、社会效益、政府满意度、居民满意度等;针对居民参与度的监管指标主要包括居民在居委会、党组织、协管、第三方社区组织中的任职人数比例,以及居民的建议采纳率、投诉处理率、参加座谈会的次数等。具体在交互平台内置满意度调查、投诉以及举报页面,调查政府、居民及企业/社会组织对社区公共服务与设施、社会组织、物业管理公司等工作的满意度和投诉意见,满意度使用李克特五分量表进行测度,并依据上述监管指标定期在平台中公布各项社区工作的绩效及评分。

此外,社区智能系统会实时采集各个网络平台(如全国12315平台、人民网、新华社、黑猫投诉、知乎、百度贴吧等)关于各社区的新闻、评论/投诉信息。去除垃圾文本后,使用python编程对新闻报导、评论、帖子等文本内容进行感情色彩分析,并识别出带有积极(positive)/消极(negative)情绪的评论,由专员对这些评论进行审核及处理,提取出有用信息并用于指导社区居住环境品质的改善与提升。

本实施例基于用户端、工作人员端和云服务器构成的智能交互平台,用户端用于获取用户输入的信息,工作人员端对用户端发送的信息进行审核以及信息登记和建档并将信息数据返回给用户端,云服务器是后台采集、处理、储存、分析多源异构数据的平台,租用的云服务器未有特指,例如可租用腾讯云服务器。

用户端为了实现获取用户输入的信息数据,可以采用微信小程序、app、网页等方式,微信小程序/app/网站是用户访问的入口及信息展示的页面。且微信小程序、app、网页等界面将该用户的信息数据发送给云服务器,云服务器通过对数据的采集和处理,对各社区的居民活动进行序列分析,获得不同社区居民的基本行为模式和居民社会经济属性;并且根据各社区的居民行为模式,倒推出各社区居民常用的服务设施类型,计算出社区生活圈设施的可达性;通过获取多元主体在交互平台的社区交流论坛中的关注和评论信息,通过构建社区治理中多元主体的关系网络,进一步分析得到各主体在社区治理网络中的作用。

实施例2:

如图11所示,本实施例提供了一种社区数据分析装置,该装置应用于云服务器,包括获取单元1101、序列单元1102、分析单元1103和关联单元1104,各个单元的具体功能如下:

获取单元1101,用于获取社区居民的时空轨迹数据和个人信息数据,将时空轨迹数据和个人信息数据与基础地理区块数据绑定,并将社区居民各项活动标识为不同的类型;

序列单元1102,用于通过不同的活动类型组成的序列对社区各个居民每天的活动进行记录;

分析单元1103,用于对各社区的居民活动进行序列分析,获得不同社区居民的基本行为模式;

关联单元1104,用于根据居民的个人信息数据,挖掘各类行为模式关联的居民社会经济属性。

进一步地,该装置还包括:

计算单元1105,用于根据各社区的居民行为模式,倒推出各社区居民常用的服务设施类型,计算社区生活圈设施的可达性。

进一步地,该装置还包括:

第二分析单元1106,用于获取多元主体在交互平台的社区交流论坛中的关注信息和评论信息,通过构建社区治理中多元主体的关系网络,分析各主体在社区治理网络中的作用。

本实施例中各个单元的具体实现可以参见上述实施例1,在此不再一一赘述。需要说明的是,本实施例提供的装置仅以上述各功能单元的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能单元完成,即将内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。

可以理解,本实施例的装置中所使用的术语“第一”、“第二”等可用于描述各种单元,但这些单元不受这些术语限制。这些术语仅用于将第一个单元与另一个单元区分。举例来说,在不脱离本发明的范围的情况下,可以将第一提示单元称为第二提示单元,且类似地,可将第二提示单元称为第一提示单元,第一提示单元和第二提示单元两者都是提示单元,但其不是同一提示单元。

实施例3:

本实施例提供了一种存储介质,该存储介质为计算机可读存储介质,其存储有计算机程序,计算机程序被处理器执行时,实现上述实施例1的社区数据分析方法,如下:

获取社区居民的时空轨迹数据和个人信息数据,将时空轨迹数据和个人信息数据与基础地理区块数据绑定,并将社区居民各项活动标识为不同的类型;

将社区各个居民每天的活动由不同的活动类型组成的序列记录;

对各社区的居民活动进行序列分析,获得不同社区居民的基本行为模式;

根据居民的个人信息数据,挖掘各类行为模式关联的居民社会经济属性。

进一步的,所述方法还包括:根据各社区的居民行为模式,倒推出各社区居民常用的服务设施类型,计算社区生活圈设施的可达性。

进一步的,所述方法还包括:获取多元主体在交互平台的社区交流论坛中的关注信息和评论信息,通过构建社区治理中多元主体的关系网络,分析各主体在社区治理网络中的作用。

本实施例中的存储介质可以是磁盘、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、u盘、移动硬盘等介质。

综上所述,本发明通过获取社区居民的时空轨迹数据与用户信息数据,对各社区的居民活动进行序列分析,获得不同社区居民的基本行为模式,并挖掘各类行为模式关联的居民社会经济属性,可用于辅助规划从业者进行社区公共服务设施的规划决策,以及为相关企业提供商业服务设施布局与定位的决策参考;通过各社区的居民行为模式,倒推出各社区居民常用的服务设施类型,使用累计机会法计算社区生活圈设施的可达性,可用于对各社区的设施总体可达性进行评价及设计;通过构建社区治理中多元主体的关系网络,可观察政府、企业、社会组织、专家学者、居民、业委会等利益攸关方在社区治理中的网络关系,通过计算可量化测度多元主体在治理网络中作用。

以上所述,仅为本发明专利较佳的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方案及其发明专利构思加以等同替换或改变,都属于本发明专利的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1