一种具有高可扩展性的时间及位置感知的协同过滤技术的制作方法

文档序号：8299109阅读：402来源：国知局

一种具有高可扩展性的时间及位置感知的协同过滤技术的制作方法
【技术领域】
[0001] 本发明涉及一种计算机应用技术领域的方法，具体是一种具有高可扩展性的时间及位置感知的协同过滤技术及系统。
【背景技术】
[0002] 随着Web服务以及互联网技术的迅猛发展，越来越多具有相似功能的Web服务出现在网络中。这种现象一方面给了用户更多的选择，另一方面用户不得不花费大量的时间以及精力来寻找真正满足自己需求的Web服务。就算找到了满足用户功能需求的Web服务，但是该Web服务的非功能属性（QoS属性）也不一定满足，即便是Web提供者声明的非功能属性（QoS属性）满足用户需求，该用户感受到的Web服务的QoS属性值很可能与Web 服务提供者声明的QoS属性值不同。用户直接去调用Web服务观察到的QoS属性才是最正确的，但是该方法却完全行不同。由于网络中具有相同或类似的功能的Web服务实在太多，导致用户完全没有足够的时间和精力一个一个去尝试，即使有足够的时间或者精力也不一定能承受如此昂贵的花费。因此，如何从大量的具有相同或者类似功能的Web服务中选出真正满足用户需求的Web服务变得越来越重要。
[0003] 协同过滤技术的出现为上述问题提供了一个良好的技术途径。协同过滤技术利用一个NXM用户-Web服务矩阵Mu,s记录用户调用Web服务时观察到的该Web服务的QoS属性值。其中N代表该Web服务推荐系统中已经注册的用户数量，M代表该Web服务推荐系统中已经注册的Web服务数量。矩阵中的项# 0表示编号为Ui的用户调用过编号为s。_的 Web服务，并且用户七观察到的Web服务s」的QoS属性值记录在项^,S/.中。假如= 0 则表示用户IV没有调用过Web服务sp协同过滤技术通过找到和活动用户类似的用户，然后根据类似用户观察到的目标Web服务的QoS属性值来预测活动用户观察到的目标Web服务的QoS属性值。这样的预测值往往非常接近活动用户实际观察到的QoS属性值。协同过滤技术可以分成两大类：基于内存的协同过滤技术和基于模型的协同过滤技术。基于内存的协同过滤技术的特点是容易实现且预测精确度较高，但是可扩展性差。而基于模型的协同过滤技术的特点是具有较好的可扩展性，但是该类技术的预测准确度较低。
[0004] 由于Web服务以及互联网技术的迅猛发展，导致用户数量及Web服务的数量极其膨大，最终导致基于内存的协同过滤技术预测QoS属性值所需的时间和资源都超过了能容忍的地步。而基于模型的协同过滤技术的预测质量又较差。因此，现有的协同过滤技术很难既保证预测质量有保证预测速度。

【发明内容】

[0005] 本发明的目的在于克服现有技术中存在的不足，提供一种既能保证预测质量又能保证预测速度的协同过滤技术以及基于该技术的Web服务推荐系统，通过利用用户及Web 服务的IP地址所属的AS(Anautonomoussystem)对用户及Web服务进行分类，由于QoS 中的性能属性，例如反应时间，吞吐量与用户与Web服务之间的网络距离相关。因此，在寻找类似用户和类似Web服务的时候只在与活动用户和目标Web服务处于同一个AS中的用户和Web服务寻找。然后利用这些用户及Web服务来进行预测，不仅仅能提高算法的可扩展性，还能提高预测精确度。
[0006] 本发明的目的通过以下技术方案来实现：一种具有高可扩展性的时间及位置感知的协同过滤技术，包括以下步骤：
[0007] 步骤一，根据用户及Web服务的IP地址对用户及Web服务进行分类，得到用户群及Web服务群，利用用户-Web服务-时间张量记录QoS值；
[0008] 其中，所述用户群，是指IP地址属于同一个AS的用户构成的集合；所述Web服务群，是指IP地址属于同一个AS的Web服务构成的集合；所述用户-Web服务-时间张量，是指张量的项用于记录用户Ui在时间tk上观察到的Web服务sj的QoS属性值。
[0009] 步骤二，计算所有和目标Web服务处于同一个AS的Web服务与目标Web服务之间的平均类似度，然后选择k个平均类似度最高的Web服务形成topK类似Web服务集合；
[0010] 其中，所述目标Web服务，是指需要被预测QoS属性值的那个Web服务；所述所有和目标Web服务处于同一个AS的Web服务，是指Web服务的IP地址和目标Web服务的IP 地址属于同一个AS的所有Web服务构成的集合，其中目标Web服务也属于该集合；所述 topK类似Web服务集合N' (s)，是指与目标Web服务类似度最高的K个Web服务所组成的集合。
[0011] 所述平均类似度的计算公式如下
[0012]
【主权项】
1. 一种具有高可扩展性的时间及位置感知的协同过滤技术，其特征在于，包括以下步骤：步骤一，根据用户及Web服务的IP地址对用户及Web服务进行分类，得到用户群及Web 服务群，利用用户-Web服务-时间张量记录QoS值；步骤二，计算所有和目标Web服务处于同一个AS的Web服务与目标Web服务之间的平均类似度，然后选择k个平均类似度最高的Web服务形成topK类似Web服务集合；步骤三，计算所有和活动用户处于同一个AS的用户与活动用户之间的平均类似度，然后选择k个平均类似度最高的用户形成topK类似用户集合；步骤四，分别利用基于用户的协调过滤算法和基于项目的协调过滤算法来预测QoS属性值，然后将这两个值加权平均，既得到最终的预测值。
2. 根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术，其特征在于，所述步骤一中用户-Web服务-时间张量是指张量的项用于记录用户Ui 在时间tk上观察到的Web服务\的QoS属性值。
3. 根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术，其特征在于，所述步骤二中Web服务之间的平均类似度的计算公式如下：
，其中，&2A)表示web服务^和\在时间t k上的类似度。tD是时间区间集合。
4. 根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术，其特征在于，所述步骤三中用户之间的平均类似度的计算公式如下：
实中，u,2A)表示用户?^和\在时间 tk上的类似度。tD是时间区间集合。
5. 根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术，其特征在于，所述步骤四中利用基于用户的协调过滤算法预测的QoS属性值是指根据步骤三寻找到的topK类似用户集合N' (u)利用基于用户的协调过滤算法的预测公式计算获得的 QoS属性值。
6. 根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术，其特征在于，所述步骤四中利用基于项目的协调过滤算法预测的QoS属性值是指根据步骤二寻找到的topK类似Web服务集合N' (s)利用基于项目的协调过滤算法的预测公式计算获得的QoS属性值。
7. 根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术，其特征在于，所述步骤四中的加权平均是指利用基于用户的协调过滤算法获得的QoS属性值乘上权重inf u再加上利用基于项目的协调过滤算法预测的QoS属性值与权重inf 3的乘积。
8. 根据权利要求7所述的一种具有高可扩展性的时间及位置感知的协同过滤技术，其特征在于，所述权重infu，的计算公式如下： L1N丄丄A I八]J ，J、 H Z/Z
，其中N' (u)是指权利要求5中的topK类似用户集合，N' (s)是指权利要求6中的topK类似Web服务集合。
9.根据权利要求7所述的一种具有高可扩展性的时间及位置感知的协同过滤技术，其特征在于，所沭权重in己的计算公式如下：
，其中N' (u)是指权利要求5中的topK类似用户集合，N' (s)是指权利要求6中的topK类似Web服务集合。
【专利摘要】本发明公开了一种具有高可扩展性的时间及位置感知的协同过滤技术，通过利用用户及Web服务的IP地址所属的AS(An autonomous system)对用户及Web服务进行分类；在寻找类似用户和类似Web服务的时候只在与活动用户和目标Web服务处于同一个AS中的用户和Web服务中寻找。然后利用这些用户及Web服务来进行预测，提高了算法的可扩展性和预测精确度。
【IPC分类】G06F17-30
【公开号】CN104615683
【申请号】CN201510031278
【发明人】黄林鹏, 于程远
【申请人】上海交通大学
【公开日】2015年5月13日
【申请日】2015年1月21日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄林鹏;于程远;
技术所有人：上海交通大学;
我是此专利的发明人

上一篇：一种海量数据通信并发处理方法及系统的制作方法
上一篇：一种数据处理方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。