一种基于稳态过程的多重分形Web日志的逼真生成方法与流程

文档序号：11949940阅读：来源：国知局

技术特征：

1.一种基于稳态过程的多重分形Web日志的逼真生成方法，其特征在于，包括以下步骤：

步骤1：生成每个用户的属性并形成用户集合U={u₁,u₂,……,u_n}，n表示用户数，u_n表示第n个用户；

步骤2：生成每个Web文件的属性并形成Web文件集合I={i₁,i₂,……,i_m}，m表示Web文件数，u_m表示第m个Web文件；

步骤3：关联用户和Web文件形成原始请求序列R={r₁,r₂,……,r_q}，q表示原始请求序列中Web日志数量，r_q表示第q条Web日志；

步骤4：采用alpha稳态过程拟合用户到达模型，计算用户的到达时间间隔∆T，作为改进的ON/OFF模型的被动OFF时间，到达时间间隔∆T表示两次用户到达时刻之间的时间间隔；

步骤5：将原始请求序列R变成由多个用户请求序列构成的用户集合R={R₁,R₂,…,R_u,…,R_n}，其中n表示用户总数量，每个用户形成一个用户请求序列R_u={r_u1,r_u2,……,r_uk}，k表示集合R_u的总序列长度，r_uk表示用户u访问的第k个文件，也即一个用户u对应k个文件，所述k个文件中可以存在重复文件；遍历每一个用户u，并记录遍历开始的时间currentTime，用于序列R_u的时间分配；

步骤6：判断遍历是否结束，是则本方法结束，否则转步骤7；

步骤7：判断用户请求序列R_u是否为空，是则转步骤8，否则返回步骤5；

步骤8：找到连续访问个数s=1；

步骤9：取出用户请求序列R_u中用户最感兴趣的前s个文件，组成连续访问序列Y_u={r_u1,r_u2,…,r_us}；

步骤10：采用二项式b模型分离连续访问序列Y_u为连续访问时间序列Y_u’={y_u1,y_u2,…,y_ut}，其中t表示Y_u’的时间区间数量，y_ut表示t时间区间内用户u的连续访问序列，并以Y_u’的每个元素的访问时间间隔∆t作为改进的ON/OFF模型的主动OFF时间，访问时间间隔∆t表示第i个文件和第i+1个文件在传输过程中的时间间隔；

步骤11：将连续访问时间序列Y_u’加入到用户的新访问序列R_u’={Y_u1’,Y_u2’,…,Y_ul’}中，其中Y_ul’表示第l次加入的连续访问时间序列；

步骤12：从用户请求序列R_u中删除所述前s个文件。

完整全部详细技术资料下载

当前第2页1 2 3