一种基于稳态过程的多重分形Web日志的逼真生成方法与流程

文档序号:11949940阅读:来源:国知局

技术特征:

1.一种基于稳态过程的多重分形Web日志的逼真生成方法,其特征在于,包括以下步骤:

步骤1:生成每个用户的属性并形成用户集合U={u1,u2,……,un},n表示用户数,un表示第n个用户;

步骤2:生成每个Web文件的属性并形成Web文件集合I={i1,i2,……,im},m表示Web文件数,um表示第m个Web文件;

步骤3:关联用户和Web文件形成原始请求序列R={r1,r2,……,rq},q表示原始请求序列中Web日志数量,rq表示第q条Web日志;

步骤4:采用alpha稳态过程拟合用户到达模型,计算用户的到达时间间隔∆T,作为改进的ON/OFF模型的被动OFF时间,到达时间间隔∆T表示两次用户到达时刻之间的时间间隔;

步骤5:将原始请求序列R变成由多个用户请求序列构成的用户集合R={R1,R2,…,Ru,…,Rn},其中n表示用户总数量,每个用户形成一个用户请求序列Ru={ru1,ru2,……,ruk},k表示集合Ru的总序列长度,ruk表示用户u访问的第k个文件,也即一个用户u对应k个文件,所述k个文件中可以存在重复文件;遍历每一个用户u,并记录遍历开始的时间currentTime,用于序列Ru的时间分配;

步骤6:判断遍历是否结束,是则本方法结束,否则转步骤7;

步骤7:判断用户请求序列Ru是否为空,是则转步骤8,否则返回步骤5;

步骤8:找到连续访问个数s=1;

步骤9:取出用户请求序列Ru中用户最感兴趣的前s个文件,组成连续访问序列Yu={ru1,ru2,…,rus};

步骤10:采用二项式b模型分离连续访问序列Yu为连续访问时间序列Yu’={yu1,yu2,…,yut},其中t表示Yu’的时间区间数量,yut表示t时间区间内用户u的连续访问序列,并以Yu’的每个元素的访问时间间隔∆t作为改进的ON/OFF模型的主动OFF时间,访问时间间隔∆t表示第i个文件和第i+1个文件在传输过程中的时间间隔;

步骤11:将连续访问时间序列Yu’加入到用户的新访问序列Ru’={Yu1’,Yu2’,…,Yul’}中,其中Yul’表示第l次加入的连续访问时间序列;

步骤12:从用户请求序列Ru中删除所述前s个文件。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1