一种在线视频节目分类方法及其装置的制造方法

文档序号:8946156阅读:503来源:国知局
一种在线视频节目分类方法及其装置的制造方法
【技术领域】
[0001] 本发明涉及在线视频节目分类技术,特别涉及一种在线视频节目分类方法及其装 置。
【背景技术】
[0002] 在研究在线视频服务的服务质量的时候我们发现,对于在线视频服务而言,同一 个网站存在大量不同的视频节目,又由于视频节目上线、热度等不同,使得每个视频节目的 服务质量不一定相同。然而,如果对每一个视频节目的服务质量都进行测量,测量周期会过 于漫长,对于单个视频节目而言,这样两次测量的间隔过长,服务质量估计滞后;如果要减 小测量间隔,则需要增加大量的测量节点部署,导致难以承受的成本增加;如果不对所有视 频节目进行测量,而是仅考察网站的服务质量,则忽略了不同视频节目的服务质量差异,降 低了测量的精度。因而,我们希望利用聚类方法对在线视频节目(由于每一个在线视频节 目都可以通过固定的统一资源定位符(UniformResourceLocator,简称URL)来访问,因 此可以用URL来代替在线视频节目)的服务质量进行聚类,将服务质量相似的URL分为一 类,并且对同类的URL进行统一的服务质量测量、估计和预测。

【发明内容】

[0003] 本发明的目的是为了提高URL的服务质量评价效率。
[0004] 为实现上述目的,一方面,本发明提供了 一种在线视频节目分类方法,该方法包括 以下步骤:针对在线视频节目的统一资源定位符URL进行测量;根据测量结果对所述URL 进行聚类;将聚类结果作为所述URL的分类标识;根据所述分类标识,以及所述在线视视频 节目的元数据获取分类模型。
[0005] 上述分类方法中,所述针对在线视频节目的统一资源定位符URL进行测量步骤包 括:测量所有待测视频网站中所述在线视频节目URL的服务质量参数,所述服务质量参数 包括带宽和/或时延;每一组服务质量参数与其对应的URL和测量时间共同组成一个测量 结果。
[0006] 上述分类方法中,所述根据测量结果对所述URL进行聚类步骤包括:对测量结果 进行数据清洗和去周期化,获取有效的URL测量结果;针对每条有效的URL测量结果都进行 抽样,针对抽样结果进行统计特征计算;将计算后的统计特征与所述URL组成一条聚类用 记录,所有聚类用记录组成聚类用数据集;利用聚类算法对所获得的聚类用数据集进行聚 类。
[0007] 上述分类方法中,所述根据测量结果对所述URL进行聚类,具体步骤为:对每个 URL的服务质量测量结果进行抽样,每次抽样无放回的抽取N个测量结果;计算所述N个抽 样结果的统计特征,生成一条聚类用数据;所述统计特征包括均值、方差、偏度和峰度中的 一种或多种。
[0008] 上述分类方法中,所述根据测量结果对所述URL进行聚类步骤还包括:聚类的终 止判定,所述聚类的终止判定以同一个URL聚类结果的聚类粒度恰当为条件,当同一个URL的测量结果抽样形成的记录的门限概率a属于同一类时,凝聚终止。
[0009] 上述分类方法中,所述将聚类结果作为所述URL的分类标识步骤包括:根据聚类 结果,对所有待测网站的在线视频节目URL进行标记分类;其中,对于不能播放的在线视频 节目URL单独分为一类。
[0010] 上述分类方法中,所述根据所述分类标识,以及所述在线视视频节目的元数据获 取分类模型步骤包括:对于每条有效URL,计算其各测量结果的统计特征,并记录其元数 据、所述URL,以及该URL的标记组成一条分类记录,其中所述元数据包括发行单位、导演、 上线年代和发行地区中的一种或多种;根据所述URL的标记,利用分类算法生成所述URL的 分类模型。
[0011] 上述分类方法中,根据所述分类模型对新的待测网站在线视频节目URL进行快速 分类。所述分类模型基于元数据及服务质量数据进行分类模型定期优化更新。
[0012] 另一方面,本发明提供了一种在线视频节目分类装置,包括:
[0013] 测量模块,用于针对在线视频节目的统一资源定位符URL进行测量;
[0014] 聚类模块,用于根据测量结果对所述URL进行聚类;
[0015] 分类模块,用于将聚类结果作为所述URL的分类标识;
[0016] 获取模块,用于根据所述分类标识,以及所述在线视视频节目的元数据获取分类 模型。
[0017] 本发明与现有技术相比,利用在线视频节目分类方法在几乎不降低精度的情况下 对在线视频节目URL的服务质量进行了分类,并且提高了URL的服务质量评价效率,
【附图说明】
[0018] 图1为本发明实施例提供的一种在线视频节目分类方法流程示意图;
[0019] 图2为本发明实施例提供的另一种在线视频节目分类方法流程图示意图;
[0020] 图3为本发明实施例提供的一种在线视频节目分类装置结构示意图。
【具体实施方式】
[0021] 以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书 所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实 施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离 本发明的精神下进行各种修饰或改变。
[0022] 本发明要求保护的是一种在线视频节目分类方法及其装置,应用于在线视频节目 服务质量的分类。
[0023] 图1为本发明实施例提供的一种在线视频节目分类方法流程示意图,具体包括以 下步骤:
[0024] 步骤SlOl :针对在线视频节目的统一资源定位符URL进行测量。
[0025] 步骤S102 :根据测量结果对所述URL进行聚类。
[0026] 步骤S103 :将聚类结果作为所述URL的分类标识。。
[0027] 步骤S104 :根据所述分类标识,以及所述在线视视频节目的元数据获取分类模 型。
[0028] 本发明实施例利用在线视频节目分类方法可以在几乎不降低精度的情况下提高 对视频网站在线视频节目服务质量的评价效率。
[0029] 图2为本发明实施例提供的另一种在线视频节目分类方法流程图示意图。如图2 所示,该方法包括步骤S201-208 :
[0030] 步骤S201,对在线视频网站的URL进行测量,测量所有待测视频网站中所述在线 视频节目URL的服务质量参数B1,如带宽、时延等,每一组服务质量参数与其对应的URL和 测量时间共同组成一个测量结果。对于每个URL,至少需获得N条测量结果。当某个URL多 次测量均无法获得测量结果时,将该URL视为不可播URL,直接并入不可播类。
[0031] 步骤S202,对测量结果进行数据清洗和去周期化。去除不完整数据和错误数据后; 根据已有知识,测量结果可能包含周期性变化,因此根据平均值计算周期规律参数,对测量 结果进行去周期化。一个有效的可用URL需要至少有N条有效的测量结果。
[0032] 步骤S203,从每条有效URL的有效测量结果中都进行m次抽样,每次抽样中,无放 回的从该URL的队条(N N)有效结果中抽取N条测量结果I Cg ),计算其均值、方差、峰 度、偏度等统计特征Cjk;将Cjk、URL、来源网站和测量节点IP等基础信息组成一条聚类用记 录。记有效URL数U,以全部UXm条聚类记录组成聚类用数据集。
[0033] 步骤S204,利用聚类算法(如改进的CLARA算法结合AGNES算法)对步骤S203所 获得
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1