一种具有高可扩展性的时间及位置感知的协同过滤技术的制作方法
【技术领域】
[0001] 本发明涉及一种计算机应用技术领域的方法,具体是一种具有高可扩展性的时间 及位置感知的协同过滤技术及系统。
【背景技术】
[0002] 随着Web服务以及互联网技术的迅猛发展,越来越多具有相似功能的Web服务出 现在网络中。这种现象一方面给了用户更多的选择,另一方面用户不得不花费大量的时间 以及精力来寻找真正满足自己需求的Web服务。就算找到了满足用户功能需求的Web服 务,但是该Web服务的非功能属性(QoS属性)也不一定满足,即便是Web提供者声明的非 功能属性(QoS属性)满足用户需求,该用户感受到的Web服务的QoS属性值很可能与Web 服务提供者声明的QoS属性值不同。用户直接去调用Web服务观察到的QoS属性才是最正 确的,但是该方法却完全行不同。由于网络中具有相同或类似的功能的Web服务实在太多, 导致用户完全没有足够的时间和精力一个一个去尝试,即使有足够的时间或者精力也不一 定能承受如此昂贵的花费。因此,如何从大量的具有相同或者类似功能的Web服务中选出 真正满足用户需求的Web服务变得越来越重要。
[0003] 协同过滤技术的出现为上述问题提供了一个良好的技术途径。协同过滤技术利用 一个NXM用户-Web服务矩阵Mu,s记录用户调用Web服务时观察到的该Web服务的QoS属 性值。其中N代表该Web服务推荐系统中已经注册的用户数量,M代表该Web服务推荐系统 中已经注册的Web服务数量。矩阵中的项# 0表示编号为Ui的用户调用过编号为s。_的 Web服务,并且用户七观察到的Web服务s」的QoS属性值记录在项^,S/.中。假如= 0 则表示用户IV没有调用过Web服务sp协同过滤技术通过找到和活动用户类似的用户,然 后根据类似用户观察到的目标Web服务的QoS属性值来预测活动用户观察到的目标Web服 务的QoS属性值。这样的预测值往往非常接近活动用户实际观察到的QoS属性值。协同过 滤技术可以分成两大类:基于内存的协同过滤技术和基于模型的协同过滤技术。基于内存 的协同过滤技术的特点是容易实现且预测精确度较高,但是可扩展性差。而基于模型的协 同过滤技术的特点是具有较好的可扩展性,但是该类技术的预测准确度较低。
[0004] 由于Web服务以及互联网技术的迅猛发展,导致用户数量及Web服务的数量极其 膨大,最终导致基于内存的协同过滤技术预测QoS属性值所需的时间和资源都超过了能容 忍的地步。而基于模型的协同过滤技术的预测质量又较差。因此,现有的协同过滤技术很 难既保证预测质量有保证预测速度。
【发明内容】
[0005] 本发明的目的在于克服现有技术中存在的不足,提供一种既能保证预测质量又能 保证预测速度的协同过滤技术以及基于该技术的Web服务推荐系统,通过利用用户及Web 服务的IP地址所属的AS(Anautonomoussystem)对用户及Web服务进行分类,由于QoS 中的性能属性,例如反应时间,吞吐量与用户与Web服务之间的网络距离相关。因此,在寻 找类似用户和类似Web服务的时候只在与活动用户和目标Web服务处于同一个AS中的用 户和Web服务寻找。然后利用这些用户及Web服务来进行预测,不仅仅能提高算法的可扩 展性,还能提高预测精确度。
[0006] 本发明的目的通过以下技术方案来实现:一种具有高可扩展性的时间及位置感知 的协同过滤技术,包括以下步骤:
[0007] 步骤一,根据用户及Web服务的IP地址对用户及Web服务进行分类,得到用户群 及Web服务群,利用用户-Web服务-时间张量记录QoS值;
[0008] 其中,所述用户群,是指IP地址属于同一个AS的用户构成的集合;所述Web服务 群,是指IP地址属于同一个AS的Web服务构成的集合;所述用户-Web服务-时间张量,是 指张量的项用于记录用户Ui在时间tk上观察到的Web服务sj的QoS属性值。
[0009] 步骤二,计算所有和目标Web服务处于同一个AS的Web服务与目标Web服务之间 的平均类似度,然后选择k个平均类似度最高的Web服务形成topK类似Web服务集合;
[0010] 其中,所述目标Web服务,是指需要被预测QoS属性值的那个Web服务;所述所有 和目标Web服务处于同一个AS的Web服务,是指Web服务的IP地址和目标Web服务的IP 地址属于同一个AS的所有Web服务构成的集合,其中目标Web服务也属于该集合;所述 topK类似Web服务集合N' (s),是指与目标Web服务类似度最高的K个Web服务所组成的 集合。
[0011] 所述平均类似度的计算公式如下
[0012]
【主权项】
1. 一种具有高可扩展性的时间及位置感知的协同过滤技术,其特征在于,包括以下步 骤: 步骤一,根据用户及Web服务的IP地址对用户及Web服务进行分类,得到用户群及Web 服务群,利用用户-Web服务-时间张量记录QoS值; 步骤二,计算所有和目标Web服务处于同一个AS的Web服务与目标Web服务之间的平 均类似度,然后选择k个平均类似度最高的Web服务形成topK类似Web服务集合; 步骤三,计算所有和活动用户处于同一个AS的用户与活动用户之间的平均类似度,然 后选择k个平均类似度最高的用户形成topK类似用户集合; 步骤四,分别利用基于用户的协调过滤算法和基于项目的协调过滤算法来预测QoS属 性值,然后将这两个值加权平均,既得到最终的预测值。
2. 根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其 特征在于,所述步骤一中用户-Web服务-时间张量是指张量的项用于记录用户Ui 在时间tk上观察到的Web服务\的QoS属性值。
3. 根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其 特征在于,所述步骤二中Web服务之间的平均类似度的计算公式如下:
,其中,&2A)表示web服务^和\在时间t k上的类 似度。tD是时间区间集合。
4. 根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其 特征在于,所述步骤三中用户之间的平均类似度的计算公式如下:
实中,u,2A)表示用户?^和\在时间 tk上的类 似度。tD是时间区间集合。
5. 根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其 特征在于,所述步骤四中利用基于用户的协调过滤算法预测的QoS属性值是指根据步骤三 寻找到的topK类似用户集合N' (u)利用基于用户的协调过滤算法的预测公式计算获得的 QoS属性值。
6. 根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其 特征在于,所述步骤四中利用基于项目的协调过滤算法预测的QoS属性值是指根据步骤二 寻找到的topK类似Web服务集合N' (s)利用基于项目的协调过滤算法的预测公式计算获 得的QoS属性值。
7. 根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其 特征在于,所述步骤四中的加权平均是指利用基于用户的协调过滤算法获得的QoS属性值 乘上权重inf u再加上利用基于项目的协调过滤算法预测的QoS属性值与权重inf 3的乘积。
8. 根据权利要求7所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其 特征在于,所述权重infu,的计算公式如下: L1N丄丄A I八]J ,J、 H Z/Z
,其中N' (u)是指权利要求5中的topK类 似用户集合,N' (s)是指权利要求6中的topK类似Web服务集合。
9.根据权利要求7所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其 特征在于,所沭权重in己的计算公式如下:
,其中N' (u)是指权利要求5中的topK类 似用户集合,N' (s)是指权利要求6中的topK类似Web服务集合。
【专利摘要】本发明公开了一种具有高可扩展性的时间及位置感知的协同过滤技术,通过利用用户及Web服务的IP地址所属的AS(An autonomous system)对用户及Web服务进行分类;在寻找类似用户和类似Web服务的时候只在与活动用户和目标Web服务处于同一个AS中的用户和Web服务中寻找。然后利用这些用户及Web服务来进行预测,提高了算法的可扩展性和预测精确度。
【IPC分类】G06F17-30
【公开号】CN104615683
【申请号】CN201510031278
【发明人】黄林鹏, 于程远
【申请人】上海交通大学
【公开日】2015年5月13日
【申请日】2015年1月21日