一种基于随机游走的Web服务质量预测方法

文档序号:9396791阅读:498来源:国知局
一种基于随机游走的Web服务质量预测方法
【技术领域】
[0001] 本发明涉及Web服务质量预测技术,具体涉及一种用于Web服务选择或推荐的基 于随机游走的Web服务质量预测方法。
【背景技术】
[0002] Web服务是自描述、自包含的可用网络模块,用来帮助实现通过远程调用来完成不 同机器之间的交互操作,并成为了构造分布式系统、模块化应用程序和面向服务应用集成 的主要技术,如电子商务、车载系统、多媒体服务等。随着网络上Web服务数量的快速增长, 为用户推荐最优的服务变得更具有挑战性。为了能在大量的可供选择的功能相同的Web服 务集中找到最优的服务,Web服务的质量,即QoS(Quality of Service)被广泛用来描述和 评价Web服务的非功能属性。Web服务的QoS常常被定义为一系列用户感知的属性,典型的 有响应时间、吞吐量、可靠性等。由于QoS在成功建立面向服务的应用中的至关重要性,基 于QoS的Web服务选择和推荐方法成为近几年的一个研究热点。
[0003] 传统的基于QoS的Web服务选择的研究都有一个通用的假设,即所有Web服务的 QoS值都是可用且准确的。然而,在现实中,这个前提不一定是真实的,用户想要总能获取到 服务的QoS值是不切实际的。这是由于Web服务的QoS值容易受到不可预测的网络环境和 用户环境(例如:用户位置,用户网络条件等)的影响,从而使得不同的用户在相同的Web 服务上所观察到的QoS值不同。换而言之,用户在进行服务选择时,不能直接使用另一个用 户对服务的QoS评价值。并且,由于现实中Web服务的调用既耗时间又耗资源,因此用户想 要通过自己调用Web服务来评价所有候选服务以获取QoS信息是不实际的。此外由于服务 用户需要评价的候选服务过多,且还有一些合适的Web服务未被发现,使得服务的QoS信息 大量缺失。针对这些未知的QoS进行预测是基于QoS的Web服务选择和推荐的重要依据。
[0004] 现有技术中,最常用的预测QoS缺失值的方法存在以下缺陷:1)由于Web服务和 用户数量的剧增,存在数据稀疏性问题,使得协同过滤方法难以解决"冷启动"问题,即某用 户从未调用过任何服务,或某服务从未被任何用户调用过。2)有研究表明由于位置与服务 的QoS存在相关性,处于同一或邻近区域的用户在相同服务上会有相似的QoS体验。因此, 可以利用用户的位置来找到源用户的邻居,然后再根据这些邻居的历史QoS信息来进行推 荐,可以有效的解决QoS数据稀疏问题。然而,仅考虑用户位置来预测QoS可能降低预测精 度。

【发明内容】

[0005] 本发明要解决的技术问题是:针对现有技术的上述问题,提供一种能在覆盖率和 预测精度间得到显著好的平衡,预测成功率高、通用性好、可评估置信度和可解释性好的基 于随机游走的Web服务质量预测方法。
[0006] 为了解决上述技术问题,本发明采用的技术方案为:
[0007] -种基于随机游走的Web服务质量预测方法,步骤包括:
[0008] 1)根据Web服务QoS数据集中用户的位置信息计算用户和用户之间的物理距离;
[0009] 2)为每个用户选择物理距离最近的K个近邻用户作为该用户的邻域;
[0010] 3)为每个用户连接各自邻域的用户构建用户关系网络G ;
[0011] 4)针对用户关系网络G,计算用户和用户之间的相似度、服务和服务之间的相似 度;
[0012] 5)根据所述用户和用户之间的物理距离、用户和用户之间的相似度计算用户关系 网络G中每一条边的权重;
[0013] 6)针对源用户u。所请求的目标服务i,从源用户u。开始分别进行多次查找关于目 标服务i的随机游走,每一次随机游走中的每一跳基于用户关系网络G中每一条边的权重 确定下一跳的用户选择概率,并根据所述用户选择概率从当前跳的用户u的邻域NUu中随 机选择一个用户V作为本次随机游走的下一跳节点,最终在找到调用过目标服务i或相似 服务的用户后结束本次游走并返回一个QoS值;
[0014] 7)综合所有随机游走返回的QoS值计算源用户u。相对目标服务i的QoS预测值。
[0015] 优选地,所述步骤1)中具体是指根据式(1)计算用户和用户之间的物理距离;
[0017] 式(1)中,du,v为用户u和用户V之间的物理距离,为用户u的炜度、A u为用户 u的经度,乾为用户V的炜度、λ v为用户V的经度。
[0018] 优选地,所述步骤4)具体是指根据式(2)计算用户和用户之间的相似度、根据式 (4)计算服务和服务之间的相似度;;
[0020] 式(2)中,sim(u, V)为用户u和用户V之间的相似度,ICu,v是指用户u和用户V 共同调用过的Web服务集合,corr(u,V)为用户u和用户V之间的皮尔森相关系数,皮尔森 相关系数corr(u,v)的计算公式如式(3)所示;
[0022] 式(3)中,ICu,v为用户u和用户V共同调用过的Web服务集合,r Uil为用户u在 Web服务i上观察到的QoS值,ξ为用户u的QoS向量的平均值,6为用户V的QoS向量的 平均值;
[0024] 式⑷中,sim(i,j)为服务i和服务j之间的相似度,UCu是指共同调用过Web 服务i和j的用户集,c〇rr(i,j)为服务i和j之间的皮尔森相关系数,皮尔森相关系数 corr (i, j)的计算公式如式(5)所示,且服务i和j之间的皮尔森相关系数corr (i, j)仅仅 取正相关;
[0026] 式(5)中,UCli j为共同调用过Web服务i和j的用户集,r Uil为用户u在Web服务 i上观察到的QoS值,巧为服务i的QoS向量的平均值,C为服务j的QoS向量的平均值。
[0027] 优选地,所述步骤5)中具体是指根据式(6)计算用户关系网络G中每一条边的权 重;
[0029] 式(6)中,用户关系网络G中用户u和用户V之间的边的权重,du,v为用户 u和用户V之间的物理距离,sim(u,V)为用户u和用户V之间的相似度,λ为[0, 1]区间 内的可调参数。
[0030] 优选地,所述步骤6)中每一次随机游走的详细步骤包括:
[0031] 6. 1)从源用户u。开始进行查找有关目标服务i的随机游走,当本次游走随机过程 中的某一跳到达某个用户u时跳转执行步骤6. 2);
[0032] 6. 2)判断当前跳的用户u在目标服务i上是否有QoS值,如果有QoS值则将该QoS 值rUil作为本次随机游走的QoS值返回,本次随机游走结束;否则,跳转执行下一步;
[0033] 6. 3)判断源用户u。开始进行随机游走的跳数是否等于预设的最大游走深度 max-depth,如果不等于预设的最大游走深度max-depth,则跳转执行步骤6. 4),否则跳转 执行步骤6. 5);
[0034] 6.4)以指定的终止概率Civlik判断本次随机游走是否需要终止,如果不需要终 止,则基于用户关系网络G中每一条边的权重确定下一跳的用户选择概率,并根据所述用 户选择概率从当前跳的用户u的邻域NUu中选择一个用户V作为本次游走随机的下一跳节 点,跳转执行步骤6.2);如果需要终止,则跳转执行步骤6.5);
[0035] 6. 5)从当前跳的用户u调用过的服务集合RSu中以指定的服务选择概率选择一个 和目标服务i相似的服务j,将当前跳的用户u在目标服务j上的QoS值作为本次随机游走 的QoS值rUi j返回,本次随机游走结束。
[0036] 优选地,所述步骤6. 3)的详细步骤包括:
[0037] 6. 3. 1)判断是否满足式(7)所示的全局游走终止条件,如果满足全局游走终止条 件,则跳转执行步骤6.5);否则跳转执行步骤6.3.2);
[0038] |σ2, -σ"j < f (7)
[0039] 式(7)中,<表示前i次随机游走结果的方差,表示前i+1次随机游走结果的 方差,ε为预设的收敛常数,其中前i次随机游走结果的方差<的计算表达式如式(8)所 示;
[0041] 式(8)中,< 为前i次随机游走结果的方差,T为已返回QoS值的随机游走总次 数,F为T趟随机游走返回的QoS平均值,Γι为第i次随机游走返回的QoS值;
[0042] 6. 3. 2)判断源用户u。开始进行随机游走的跳数是否等于预设的最大游走深度 max-depth,如果不等于预设的最大游走深度max-depth,则跳转执行步骤6. 4),否则跳转 执行步骤6. 5)。
[0043] 优选地,所述步骤6. 4)中以指定的终止概率判断本次随机游走是否需要终止时, 所述终止概率ΦUilik的计算表达式如式(9)所示;
[0045] 式(9)中,(Km为针对目标服务i的游走随机过程中经过第k跳到达用户u时的 终止概率,RSu为当前跳的用户u调用过的服务集合,sim(i,j)为目标服务i和当前跳的用 户u调用过的服务集合RSu中的服务j之间的相似度,k为当前跳的用户u和源用户u。之 间的跳数。
[0046] 优选地,所述步骤6. 4)中具体是指根据式(10)确定下一跳的用户选择概率;
[0048] 式(10)中,,?+ι =ν|χ =?,足,)为从用户u的邻域NUu中选择一个用户V的 用户选择概率,尤。#+1为在寻找源用户u。对目标服务i的一个QoS预测值时随机游走在第 k跳找到用户V的随机变量,为在寻找源用户u。对目标服务i的一个QoS预测值时随 机游走在第k-Ι跳找到用户u的随机变量,見,.表示在第k-Ι步时所在节点用户u对目标服 务i没有QoS记录的前提条件;NUu为和源用户u。距离k跳的用户u的邻域,V为从用户u 的邻域NUu中选择的作为下一跳的用户,Φ ^,为针对目标服务i的游走随机过程中经过第 k跳到达用户u时的终止概率,tu,v为用户关系网络G中用户u和下一跳的用户V之间的边 的权重,tu,w为用户关系网络G中用户u、用户u的邻域NU u中用户w之间的边的权重。
[0049] 优选地,所述步骤6. 5)中以指定的服务选择概率选择一个和目标服务i相似的服 务j时,所述服务选择概率的计算表达式如式(11)所示;
[0050] CN 105117325 A 说明书 5/16 页
[0051] 式(11)中,Ρ(Υ^= j)为以指定的服务选择概率选择一个和目标服务i相似的服 务j时的服务选择概率,sim(i,j)为目标服务i和服务j之间的相似度,sim(i,1)为目标 服务i和当前跳的用户u调用过的服务集合RSu
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1