一种更新p2p网络用户主观行为分析模型参数的方法及系统的制作方法

文档序号:6487829阅读:286来源:国知局
一种更新p2p网络用户主观行为分析模型参数的方法及系统的制作方法
【专利摘要】本发明提供了一种更新P2P网络中的用户主观行为分析模型参数的方法及系统,该方法从构建P2P网络中基于计划行为理论的用户主观行为分析模型出发,根据P2P网络中当前的版权内容分布情况,量化信念指标,扩充样本数据,从而动态修正行为模型参数。本发明一方面面向对等网络版权内容分析,建立了包括喜好度、受欢迎程度、版权意识度、惩罚度各信念指标在内的基于计划行为理论的用户主观行为分析模型,对版权管控中用户主观行为分析提出了理论依据;另一方面,基于客观版权内容分布情况,提出了该用户主观行为分析模型中各信念指标的量化方法。本发明提出了用户主观行为分析模型的动态拟合方法。基于当前版权内容分布,动态修正用户主观行为分析模型参数。
【专利说明】—种更新P2P网络用户主观行为分析模型参数的方法及系统
【技术领域】
[0001]本发明涉及对等网络中基于版权内容分布的用户主观行为分析模型的动态拟合,具体涉及一种更新P2P网络用户主观行为分析模型参数的方法及系统。
【背景技术】
[0002]对等网络技术(P2P技术)已被广泛应用于集群计算、协同工作、搜索引擎和文件共享与交换等方面。由于P2P技术的核心是点对点的传播模式,因而相较于传统的客户-服务器的集中处理模式,网络内容传播的管理与控制更为复杂和困难。从目前状况来看,这主要体现在两个方面:对不良内容的传播控制更为复杂和对版权管理更为困难。以P2P文件共享与交换软件BT为例,它克服了传统下载方式的局限性,具有参与下载的人越多,文件下载速度越快的特点。BT软件自动将一个文件分割成若干块,当某一 PC节点在进行下载,它也作为一个对外提供服务的节点,向其他PC供应已经下载的文件块。最终,来自不同节点的文件块在一台PC上融合成了一个完整的文件。从上述P2P文件共享与交换的工作原理可以看出,一台PC在进行下载的同时,也自动进行着上传的行为,成为一台临时的服务器。因此,从版权角度来讲,鉴于P2P技术导致受侵害的用户和版权的数量、范围急剧增加的状况,对版权内容的传播分析与管控变得紧迫和必要。
[0003]目前版权内容的传播分析研究主要集中在内容检测和内容关系挖掘两个方面。内容检测主要是利用数字水印及DNA等技术来检测某个音/视频内容是否属于盗版内容。而内容关系挖掘又可以从主观和 客观两个方面进行,从而为传播分析与管控提供有效支持。其中,客观方面的内容关系挖掘旨在通过揭示内容之间的相似度关系来深入发掘P2P网络用户之间的文件共享关系,深刻反映P2P网络内容交互与分布的内部结构;主观方面的内容关系挖掘旨在分析P2P网络用户的主观行为意图,推测某一时刻、某一状态下用户是否会参与到盗版内容的传播。
[0004]其实,任何版权内容的传播都是由用户的主观行为决定的,用户的主观行为决定了用户是否会参与到相应版权内容的传播。因此,分析对等网络中用户的主观行为对版权内容的传播分析及管控至关重要。目前,版权内容管控大多数采用事后处理,即发现盗版内容传播后,通过采取“下载阻止”等技术来达到阻断盗版内容传播的目的。而通过分析用户主观行为则能够在盗版内容扩散传播之前发现其潜在的传播趋势,实现预警,从而先发制人的采取措施,能够有效地抑制盗版内容的传播。
[0005]已有的用户主观行为分析大多基于计划行为理论(Theory of PlannedBehavior, TPB)。TPB 认为行为(Behavior,简称 B)是行为意图(Behavior Intention,简称BI)的直接函数,而行为意图则由态度(Attitude,简称A),主观规范(SubjectiveNorm,简称SN)和知觉行为控制(Perceived Behavioral Control,简称PBC)构成。它们之间的关系可表述为:
[0006]BI=ClXA+c2XSN+c3XPBC(I)[0007]其中,态度是指个人对该项行为所抱持的正面或负面的感觉;主观规范是指个人对于是否采取某项特定行为所感受到的社会压力;知觉行为控制是反映个人过去的经验和预期的阻碍。所述态度、主观规范及知觉行为控制是抽象概念,是不可观测的变量,解决方法就是采用可直接观测的变量(即信念指标)来对态度、主观规范及知觉行为控制予以测量,如采用可直接测量的喜好度这一信念指标来测量态度。
[0008]现有的用户主观行为分析首先根据应用场景为不同的抽象概念选择合适的信念指标,建立用户主观行为分析模型。依据所选信念指标编制正式调查问卷,经模型拟合及模型评价并最终确立模型参数(即图1中的C11、C21、C31、Crc3),且现有技术虽然包含模型拟合,但这种模拟拟合过程不是动态的。由此可见,已有方法仅仅在模型建立之初确定模型参数,从而使得模型参数是静态的(即,现有技术建立初期是确定模型结构及模型参数的,且仅是在建立初期确立模型参数,之后参数保持不变,其中模型参数指模型中连线的权值,即图1中的cn、C21, C31^C1, C2及C3X而P2P网络中用户的主观行为受到多方面的因素影响,呈现动态变化的特点。因此最初的模型参数随着时间的推移可能并不再适用,现有技术的用户主观行为分析模型缺乏动态性。因此,本发明针对上述问题,从构建P2P网络中基于计划行为理论的用户主观行为分析模型出发,根据P2P网络中当前的版权内容分布情况,动态地修正用户主观行为分析模型的参数,从而达到实时动态的拟合用户主观行为的目标。

【发明内容】

[0009]本发明的目的在于,为克服现有技术仅仅在用户主观行为分析模型建立之初确定模型参数造成的随着时间的推移模型涉及的各参数并不再适用,从而造成用户主观行为分析模型缺乏动态性,最终导致的大大影响版权内容传播分析与管控等问题,从而提供一种更新P2P网络用户主观行为分析模型参数的方法及系统。
[0010]为了实现上述目的,本发明提供了一种更新P2P网络中的用户主观行为分析模型参数的方法,该方法基于动态拟合的方法动态实时调整用户主观行为分析模型的参数,所述方法包含:
[0011]步骤101)根据选取的信念指标设定用户主观行为分析模型,并采用调查问卷获得初始样本数据;
[0012]步骤102)依据初始样本数据获得各信念指标间的第一相关系数矩阵;
[0013]步骤103)根据第一相关系数矩阵及用户主观行为分析模型,采用统计算法生成一个基于该用户主观行为分析模型的最接近信念指标的相关系数矩阵的相关矩阵,即再生矩阵,并依据该再生矩阵确定用户主观行为分析模型各参数的初始值;
[0014]步骤104)通过多次迭代修正用户主观行为分析模型的各初始参数值直至该用户主观行为分析模型较好的拟合调查问卷获得的样本数据,获得初始的用户主观行为分析模型;
[0015]步骤105)基于P2P网络的版权内容分布信息得到基于版权内容分布的样本数据,将该样本数据与调查问卷获得的初始样本数据融合获得第二样本数据,并依据第二样本数据生成各信念指标间的第二相关系数矩阵;
[0016]步骤106)监控基于初始用户主观行为分析模型得到的再生矩阵和第二相关系数矩阵之间的拟合关系,当两者拟合度小于某设定阈值时,根据当前信念指标间的相关关系矩阵,重新构建再生矩阵以更新模型参数,由模型评价与模型拟合多次迭代后,得到拟合当前内容分布的用户主观行为分析模型的参数,依据该参数修正用户主观行为分析模型,从而获得实时动态的用户主观行为分析模型;
[0017]其中,所述的信念指标包含:喜好度、版权意识度、受欢迎程度和惩罚度;所述第二样本数据包含来源于调查问卷的样本数据和基于版权内容分布信息得到的样本数据,所述版权内容分布信息为P2P网络中的事件行为,包括用户拥有的具体内容、用户当前的上传或下载状态、上传或下载时间持续的时间以及上传或下载在持续时间内发生的次数。
[0018]上述技术方案中,所述调查问卷根据选取的信念指标进行编制;
[0019]采用结构方程模型验证用户主观行为分析模型与调查问卷样本数据的拟合度并修正用户主观行为分析模型的各参数。
[0020]上述技术方案中,所述喜好度采用如下策略获取;
[0021]步骤201)根据内容的相似度计算两个用户的相似度,当两用户分别为用户A与用
户B时的相似度表示为:
[0022]
【权利要求】
1.一种更新P2P网络中的用户主观行为分析模型参数的方法,该方法基于动态拟合的方法动态实时调整用户主观行为分析模型的参数,所述方法包含: 步骤101)根据选取的信念指标设定用户主观行为分析模型,并采用调查问卷获得初始样本数据; 步骤102)依据初始样本数据获得各信念指标间的第一相关系数矩阵; 步骤103)根据第一相关系数矩阵及用户主观行为分析模型,采用统计算法生成一个基于该用户主观行为分析模型的最接近信念指标的相关系数矩阵的相关矩阵,即再生矩阵,并依据该再生矩阵确定用户主观行为分析模型各参数的初始值;步骤104)通过多次迭代 修正用户主观行为分析模型的各初始参数值直至该用户主观行为分析模型较好的拟合调查问卷获得的样本数据,获得初始的用户主观行为分析模型;步骤105)基于P2P网络的版权内容分布信息得到基于版权内容分布的样本数据,将该样本数据与调查问卷获得的初始样本数据融合获得第二样本数据,并依据第二样本数据生成各信念指标间的第二相关系数矩阵; 步骤106)监控基于初始用户主观行为分析模型得到的再生矩阵和第二相关系数矩阵之间的拟合关系,当两者拟合度小于某设定阈值时,根据当前信念指标间的相关关系矩阵,重新构建再生矩阵以更新模型参数,由模型评价与模型拟合多次迭代后,得到拟合当前内容分布的用户主观行为分析模型的参数,依据该参数修正用户主观行为分析模型,从而获得实时动态的用户主观行为分析模型; 其中,所述的信念指标包含:喜好度、版权意识度、受欢迎程度和惩罚度;所述第二样本数据包含来源于调查问卷的样本数据和基于版权内容分布信息得到的样本数据,所述版权内容分布信息为P2P网络中的事件行为,包括用户拥有的具体内容、用户当前的上传或下载状态、上传或下载状态持续的时间以及上传或下载状态发生的次数。
2.根据权利要求1所述的更新P2P网络中的用户主观行为分析模型参数的方法,其特征在于,所述调查问卷根据选取的信念指标进行编制; 采用结构方程模型验证用户主观行为分析模型与调查问卷样本数据的拟合度并修正用户主观行为分析模型的各参数。
3.根据权利要求1所述的更新P2P网络中的用户主观行为分析模型参数的方法,其特征在于,所述喜好度采用如下策略获取; 步骤201)根据内容的相似度计算两个用户的相似度,当两用户分别为用户A与用户B时的相似度表示为:
4.根据权利要求1所述的更新P2P网络中的用户主观行为分析模型参数的方法,其特征在于,所述版权意识度采用如下策略获得: 步骤301)计算用户历史下载中正版内容所占比例值p,且P的取值范围为[0,1]:

j.e版内界数ja

下载内界总数 步骤302)依据量化规则将获得的比例值P量化为某个具体的版权意识度值;所述量化规则为依据P落在区间[0,1]中的具体位置将版权意识度量化为某些具体的整数值,其中P值越小表示用户下载的正版内容所占比例越小,从而表明该用户的版权意识较弱,反之则表明该用户的版权意识较强。
5.根据权利要求1所述的更新P2P网络中的用户主观行为分析模型参数的方法,其特征在于,所述惩罚度通过记录用户的下载时长获得,具体包含: 用户开始下载版权内容时开始记录,在完成下载后则终止计算其下载时长,且该下载时长记为Td ; 设置阈值Ts表示用户的下载时长忍受阈值,若Td>Ts,表示该用户被版权监管系统“下载阻止”并记录一次“下载阻止”,记录某段时间内用户被下载阻止的总次数; 依据下载阻止次数获得惩罚度的取值,所述惩罚度为若干整数值,该值越大表示用户被惩罚的次数越多,反之越少。
6.一种更新P2P网络中的用户主观行为分析模型参数的系统,该系统基于动态拟合的方法动态实时调整用户主观行为分析模型的参数,所述系统包含: 模型构建模块,用于依据选取的信念指标设定用户主观行为分析模型的结构; 材料收集模块,用于依据选取的信念指标编制调查问卷,并依据该调查问卷收集基于多个用户的第一样本数据; 样本库,用于存放用于统计分析的样本数据,当首次建立用户主观行为模型时仅存放由调查问卷获得的第一样本数据,当模型及参数初步确定后还存放基于版权内容分布信息得到的基于版权内容分布的样本数据; 统计分析模块,用于将所述样本库输入的数据进行统计分析处理,获得各信念指标间的相关系数矩阵,将该相关系数矩阵输入模型拟合模块;并接收监控模块的相关系数查询请求,然后向该监控模块返回基于样本库所有样本数据的当前的相关系数矩阵; 模型拟合模块,用于将统计分析处理后的相关系数矩阵与模型构建模块设定的用户主观行为分析模型进行模型拟合处理,得到再生矩阵; 模型评价模块,用于计算模型拟合模块输出的再生矩阵与相关系数矩阵的拟合度结果决定是否再次触发模型拟合模块,即当拟合度小于设定拟合度时再次返回模型拟合模块进行拟合,当拟合度大于设定拟合度时停止拟合过程,并根据最终的再生矩阵及用户主观行为分析模型的结构得到模型的参数,输出用户主观行为模型; 用户主观行为分析模型,用于将满足拟合度要求的参数值设置为用户主观行为模型的参数值得到最终用户主观行为分析模型,该模型还与监控模块连接,当用户主观行为分析模型的参数确定后就向监控模块输出再生矩阵,当模型更改后,才再次向监控模块输出再生矩阵; 版权内容分布情况记录模块,用于实时记录P2P网络的版权内容的变化情况; 预处理模块,对输入的版权内容的变化情况转换为统计分析模块适用的样本数据并存入样本库,该统计信息与调查问卷获得的样本数据为第二样本数据;和 监控模块,用于周期性的向所述统计分析模块请求相关系数矩阵和基于用户主观行为分析模型得到的再生矩阵进行拟合,当得到拟合度小于设定阈值时该监控模块驱动模型拟合模块再次进行模型拟合; 其中,所述的信念指标包含:喜好度、版权意识度、受欢迎程度和惩罚度;所述监控模块依据的相关系数矩阵基于调查问卷和版权内容分布信息获得的样本数据。
7.根据权利要求6所述的更新P2P网络中的用户主观行为分析模型参数的系统,其特征在于,所述调查问卷根据选取的信念指标进行编制; 采用结构方程模型验证用户主观行为分析模型与调查问卷样本数据的拟合度并修正用户主观行为分析模型的各参数。
8.根据权利要求6所述的更新P2P网络中的用户主观行为分析模型参数的系统,其特征在于,所述预处理模块进一步包含:喜好度量化模块、版权意识度量化模块、受欢迎度量化模块和惩罚度量化模块。
9.根据权利要求6所述的更新P2P网络中的用户主观行为分析模型参数的系统,其特征在于,所述喜好度量化模块进一步包含: 第一处理模块,用于根据内容的相似度推出两个用户的相似度,当两用户分别为用户A与用户B时的相似度表示为:

10.根据权利要求6所述的更新P2P网络中的用户主观行为分析模型参数的系统,其特征在于,所述版权意识度量化模块进一步包含: 第三处理模块,用于计算用户历史下载中正版内容所占比例值P,且P的取值范围为[0,1]:
【文档编号】G06F19/00GK103593543SQ201210288565
【公开日】2014年2月19日 申请日期:2012年8月14日 优先权日:2012年8月14日
【发明者】童恩栋, 牛温佳, 曲本科, 苗光胜, 谭红艳, 唐晖, 慈松 申请人:中国科学院声学研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1