本发明涉及一种面向用户社区管理的多维度场景感知系统与方法,属于软件。
背景技术:
1、智能终端近年来快速发展,产业界研发了多种多样的智能家居传感设备,如智能音箱、智能家电、智能门锁等,遍布在社区的各个角落,能够有效提升用户社区管理的效率及智能化程度。智能终端是最重要的物联网设备之一,这些设备可以将其用户与互联网连接,通过设备日志记录用户的日常行为,搜集并处理场景数据,用于提供各种场景感知的个性化服务。用户的设备日志数据可以用来发现行为规则,用于提供智能化的场景感知服务。通过分析终端设备用户的不同行为模式来设计基于规则的机器学习模型非常重要,因为它可以用于构建各种数据驱动的场景感知个性化系统,智能地帮助终端用户在环境感知计算环境中的日常活动。
2、在场景感知计算领域,文献(mehrotra, a., hendley, r., musolesi, m.,2016. prefminer: mining user’s preferences for intelligent mobilenotification management. in: proceedings of the international jointconference on pervasive and ubiquitous computing, heidelberg, germany, 12-16september. acm, new york, usa., pp. 1223–1234.)提出一种基于关联挖掘算法从环境信息中提取个人偏好的方法;文献(srinivasan, v., moghaddam, s., mukherji, a.,2014. mobileminer: mining your frequent patterns on your phone. in:proceedings of the international joint conference on pervasive and ubiquitouscomputing, seattle, wa, usa, 13-17 september. acm, new york, usa., pp. 389–400.)使用apriori算法从场景挖掘用户行为规则,建立基于用户偏好的场景感知推荐系统;文献(zhu, h., chen, e., xiong, h., yu, k., cao, h., tian, j., 2014. miningmobile user preferences for personalized context-aware recommendation. acmtrans. intell. syst. technol. (tist) 5 (4), 58.)根据用户在不同场景下的手机使用习惯,提出了挖掘手机用户偏好的方法。这些研究使用关联规则捕获用户行为用于各种目的,然而缺点是传统的关联规则挖掘方法,如在生成规则时没有考虑场景的影响或优先级,并且还产生了很大比例的冗余关联规则。这种冗余生成不仅使得规则集变得不必要的大,而且使得决策过程更加复杂,并且对于相关的场景感知服务来说是无效的。因此,对于决策代理来说,根据当前场景来确定最相关或最感兴趣的规则是非常困难的,这因此可能影响场景感知服务。因此,本文提出的研究问题是如何最小化这些问题并提供一组场景感知智能服务的用户行为规则。
技术实现思路
1、本发明的目的:在用户社区管理场景中,关联规则挖掘用于根据给定数据集发现用户特定约束偏好的规则。然而,关联规则通常会产生许多不感兴趣的场景关联,导致产生大量决策时冗余的无用规则,使得规则集变大且使场景感知决策过程变得复杂和无效。为了解决冗余场景感知规则的问题,提出了一种面向用户社区管理的多维度场景感知系统与方法。该方法能够有效地识别关联中的冗余,并通过考虑相关场景的优先级,从而为用户发现一组行为规则。。
2、本发明的原理:在规则发现方法中,首先按照自顶向下的方法,基于相关的多维场景设计关联生成树。在设计树的时候,考虑了场景的优先性,并且树被划分成由最相关的场景的值区分的行为活动类。关联生成树中的每个分支表示对特定场景值的场景感知测试,每个相应的节点(内部或叶)表示结果。为了做出基于规则的决策,识别并标记与先前生成的父节点相比是冗余的节点。一旦设计了完整的关联生成树,通过从根节点到每个决策节点遍历树来提取非冗余行为关联规则。
3、本发明技术解决方案:一种面向用户社区管理的多维度场景感知系统与方法,其特点在于实现步骤如下:
4、(1)搜集多维环境信息
5、设con = {con1,con2,…,conm}是对决策有影响的不同维度的一组语境,q = {q1,q2,…,qm}是这个集合与用户相关领域的行为活动。每个维度中的每个场景coni表示多维场景的一部分。每个记录r是一组对(coni,qi),其中每个场景coni ∈ con,为属性或场景特征;qi ∈ q,表示特定用户行为活动。本发明不仅考虑时间场景,也考虑空间和社会场景。基于这些多维场景,能够发现用户的行为关联规则。假设a表示用户相应的使用行为,基于多维场景的单个用户的行为关联规则表示为con->a。
6、(2)确定场景优先顺序
7、因为不同的场景,例如时间、空间或社会场景,可能对行为规则有不同的影响,所以基于优先级选择最相关的场景。为此,计算熵以衡量信息收益,从而将训练样本分成特定场景的目标行为类。
8、
9、
10、其中,h(s)代表集合s的熵,t表示通过属性a分割集合s而创建的子集,使得s =∪t∈t,p(t)是t中的元素数量与集合s中的元素数量的比例,h(t)表示子集t的熵。具有最多信息的场景,例如时间、空间、社会,为基于树的方法中特定条件下最高优先的场景。
11、(3)生成关联生成树
12、关联生成树包括根节点、多个分支和多个内部和叶节点。树的生成过程从根节点开始,并且树的每个分支表示对特定值的场景感知测试。每个节点(内部节点或叶节点)表示相应的结果,该结果包含具有该测试的确定置信度值的行为活动类别。采用自上而下的方法构建关联生成树,将该树划分为行为活动类,由最相关场景值来区分,这些值是根据前面部分中讨论的优先级来区分。一旦确定了树的根节点,就创建了子节点及其相应的由边表示的分支。此后,递归地将分支添加到树中,该树具有由主导行为确定的相关联的场景和相应的行为活动类别,即表示特定场景的最多出现,具有相应的置信度值。
13、(4)标记冗余节点
14、在创建节点时,根据用户的特定行为活动来考虑通用模式偏好的置信水平。然后,检查该节点是否包含与其父节点相比的冗余信息,如果找到则标记为“冗余”。如果子节点和其父节点包含相同的行为类别,并且满足个体的优选置信度阈值,则树中的节点被称为冗余节点。
15、(5)提取决策规则
16、通过考虑决策节点来遍历树以提取规则,首先从树中所有生成的节点中选择决策节点。如果一个节点满足个人的首选置信度阈值并且没有被标记为“冗余”,则该节点被视为决策节点。因此,决策节点包含行为活动类,并且满足用户首选阈值的相应置信度值。为了根据目标生成无冗余的行为关联规则,从根节点遍历到每个决策节点。
17、本发明与现有技术相比具有如下优点:
18、•有效地识别关联中的冗余,同时基于多维场景产生用户行为规则。
19、•提出了一种基于规则的机器学习方法,使用用户社区智能终端设备获取的日志数据来有效发现非冗余的行为关联规则。
20、•考虑场景数据,设计了关联生成树,规则根据用户的行为模式和偏好提取,用于提供场景感知的个性化服务。