一种面向内容中心网络中基于内容分类的类别流行度缓存替换方法

文档序号:7810859阅读:208来源:国知局
一种面向内容中心网络中基于内容分类的类别流行度缓存替换方法
【专利摘要】本发明涉及一种面向内容中心网络中基于内容分类的类别流行度缓存替换方法。本发明包括:先判断节点剩余的缓存空间是否能够容纳新的数据内容;如果有足够的缓存空间缓存新数据内容;根据指数加权移动平均计算标准计算节点中所有内容类别的流行度,选择流行度最小的内容类别;将流行度最小的内容类别中预定义时间内被请求次数最少的内容项移除节点缓存;提取新数据内容名字字符串特征并进行分类;将新到达的数据内容项存入节点中相应的内容类别中,更新类别热度表和日志。本发明按内容名字分类可以更好的管理CCN中节点的缓存,使网络在通信过程中从内容名入手对内容进行查找和替换,平衡节点缓存中内容的多样性,提高缓存替换的效率。
【专利说明】-种面向内容中心网络中基于内容分类的类别流行度缓存 替换方法

【技术领域】
[0001] 本发明涉及一种面向内容中心网络中基于内容分类的类别流行度缓存替换方法。

【背景技术】
[0002] 随着互联网的持续发展,人们对网络中内容的需求越来越大。当前基于TCP/IP的 网络架构在网络控制、资源分配等方面的问题日益突出,互联网的重心已经从主机与主机 之间的通信转移到怎样从互联网快速获取所要请求的内容。基于这个原因,国内外学者着 手研究新的下一代网络体系架构,并展开了多个相关项目课题的研究,推动了下一代网络 的发展,具有跨时代的意义。本发明主要研究的是一种新型的未来网络体系架构"内容中心 网络"。CCN抛弃了传统网络中以主机地址为核心的通信方式,而转为以命名的内容为中心 的网络思想,同时构建了新的体系结构和通信机制来适应未来网络的发展。文献《内容中 心网络CCN研究进展探析》综述了 CCN的相关研究,介绍了 CCN的工作机制,并调研了当前 CCN的研究热点问题及其挑战,分析了 CCN主要比较优势与存在的问题,最后通过实验测试 床验证了 CCN的工作模式。
[0003] 缓存替换策略是CCN研究的关键部分,它关系到网络的整体性能。在CCN中经常 使用的缓存替换策略有最近最少使用策略和最少使用频率策略及其它们的改进策略。文献 《Modeling data transfer in content-centric networking》提到的 LRU 缓存替换策略, 具有算法简单、易于实现、方便部署等特点,但是它们并没有充分考虑CCN动态性的特点, 因此具有很大程度的不适应性。
[0004] 本发明提出了一种基于内容名字分类的类别流行度缓存替换策略,该策略根据 CCN中内容的命名方式和名字唯一性的特点,提出了 all-gram和R-值相结合的方法对内容 名字字符串进行特征提取并分类,使得每个节点中的缓存首先以类别为单位来进行管理。 并且采用指数加权移动平均的思想来计算每个节点中类别的流行度,通过时间距离大小对 每个类别在规定的时间里被访问的次数赋予不同的权值来反映实时的流行度情况。在缓存 替换过程中,优先替换节点中流行度最低的内容类别中的内容项,然后根据分类判定方法 将新的内容存入节点中所属的相应类别中。


【发明内容】

[0005] 本发明目的在于提供通过内容分类和动态计算流行度的方式来实现缓存替换,能 够充分考虑网络内容最近的动态特性,提高网络内容分发效率,减少节点有限网络缓存浪 费的一种内容中心网络中基于内容分类的类别流行度缓存替换方法。
[0006] 本发明的目的是这样实现的:
[0007] (1)当有新的数据内容到达时,先判断节点剩余的缓存空间是否能够容纳新的数 据内容;如果有足够的缓存空间缓存新数据内容,则直接执行步骤(4);如果没有足够的缓 存空间缓存数据内容,则执行步骤(2),进行缓存替换;
[0008] (2)根据指数加权移动平均计算标准计算节点中所有内容类别的流行度,选择流 行度最小的内容类别;
[0009] (3)将流行度最小的内容类别中预定义时间内被请求次数最少的内容项移除节点 缓存;
[0010] (4)提取新数据内容名字字符串特征并进行分类;
[0011] (5)将新到达的数据内容项存入节点中相应的内容类别中,更新类别热度表和日 〇
[0012] 步骤(1)中,在判断节点剩余的缓存空间是否能够容纳新的数据内容之前,先检 查节点CS表,查看缓存中是否已缓存该新的数据内容。
[0013] 中包括根据alΙ-gram和R-值相结合的方法提取新数据内容名字字符串特征并对 内容进行分类:n-gram模型利用一个长度为η的滑动窗口来截取一系列的子字符串,滑动 窗口每次滑动一个长度单位,将经过n-gram模型处理后的内容名字序列,分割成连续的长 度都是η的子字符串。
[0014] 本发明具有的有益效果:
[0015] 本发明提出了一种基于内容分类的类别流行度的缓存替换算法,将内容分类有效 地避免了在计算流行度的时候对所有的内容单独去处理,只需要计算出每个内容类的流行 度。这样在需要执行缓存替换的时候,首先将节点中流行度最低的类别中的某一内容项替 换出缓存,然后将新到达的内容数据按名字归入到节点缓存中的已有类别中,从而完成缓 存替换过程。与传统的LRU替换方法不同,基于内容分类的类别流行度缓存替换方法,考虑 到了内容类别流行度,可使流行度高的内容相对来说可长时间存储于网络节点中。区别于 传统的选取最近最久未使用的内容块进行替换的LRU方法,本发明提出的方法在步骤2、3 中选取类别流行度最低的内容进行替换。并且,在步骤4中提出了根据all-gram和R-值 相结合的方法将内容进行分类的思想,按内容名字分类可以更好的管理CCN中节点的缓 存,使网络在通信过程中从内容名入手对内容进行查找和替换,平衡节点缓存中内容的多 样性,提高缓存替换的效率。仿真实验结果表明,本发明提出的基于内容名字分类的类别流 行度缓存替换策略相比于其它经典的替换策略在性能上具有一定的优势。

【专利附图】

【附图说明】
[0016] 图1是本发明的总流程图;
[0017] 图2是本发明的网络拓扑结构示意图;
[0018] 图3是本发明的实验仿真参数表示意图;
[0019] 图4是本发明的计算流行度示例示意图;
[0020] 图5是本发明的n-gram示例示意图;
[0021] 图6是本发明的all-gram计算r值提取特征组合方法流程图;
[0022] 图7是本发明的不同大小节点缓存空间下平均缓存命中率不意图;
[0023] 图8是本发明的不同数目存根域下的平均缓存命中率示意图;
[0024] 图9是本发明的缓存命中率的恢复能力示意图;
[0025] 图10是本发明的不同大小节点缓存下服务器平均负载示意图;
[0026] 图11是本发明的不同数目存根域下服务器平均负载示意图;
[0027] 图12是本发明的样本时间选择大小对缓存命中率和服务器负载的影响示意图。

【具体实施方式】
[0028] 下面结合附图举例对本发明做更详细地描述。
[0029] 1、一种面向内容中心网络中基于内容分类的类别流行度缓存替换方法,其特征在 于:
[0030] 步骤1 :当有新的数据内容到达时,先判断节点剩余的缓存空间是否能够容纳新 的内容;如果有足够的缓存空间缓存新数据,则直接进入步骤4 ;如果没有足够的缓存空间 缓存数据,则进入步骤2,进行缓存替换,以缓存新数据。
[0031] 步骤2 :根据指数加权移动平均(EWMA)计算标准计算节点中所有内容类别的流行 度,选择流行度最小的内容类别;
[0032] 步骤3 :将流行度最小的内容类别中预定义时间内被请求次数最少的内容项移除 节点缓存;
[0033] 步骤4 :根据all-gram和R-值相结合的方法提取新内容名字字符串特征并进行 分类;
[0034] 步骤5 :将新到达的内容项存入节点中相应的内容类别中,更新类别热度表和日 〇
[0035] 步骤1中,在判断是否有足够缓存空间缓存新数据之前,先检查节点CS表,查看缓 存中是否已缓存该数据。CS表中存储了经过该节点且未被被该节点缓存的所有内容。
[0036] 步骤2中包括,提取新内容名字字符串特征并将内容进行分类,以及计算内容类 别的流行度。
[0037] 根据alΙ-gram和R-值相结合的方法提取新内容名字字符串特征并对内容进行分 类:n-gram模型n-gram是利用一个长度为η的滑动窗口来截取一系列的子字符串,滑动窗 口每次滑动一个长度单位。当一个内容名字序列经过n-gram模型处理后,就会被分割成若 干个连续的长度都是η的子字符串。
[0038] 在分类过程中,分类的准确与否往往与η值的选择有很大的关系,n-gram算法中 对于η值的选择没有固定的方法,有时候可能是根据人为的经验去尝试然后再选出最终的 值。如果η值太小,可能会忽略字符串的结构和顺序,若η取值太大,则会降低字符串之间 的相似度,造成错误的分类结果。因此,本发明提出了一种all-gram的思想。不再使用某 一固定的η值对名字字符串进行分割,而是使用一系列的η值来分割,通过这样的方式会生 成不同长度的n-gram子串,一般的来讲这些子串肯定会囊括原字符串所包含的重要特征 和关键字。这样的话,经过all-gram思想分割最后形成的特征向量空间可以通过学习对训 练样本进行高效快速的分类,提高分类的准确性。
[0039] 本发明采用R-值的特征选择方法,这种方法可以根据计算出的R值来判断特征的 特点并把特征进行排名,选择对更容易进行分类的特征集合,从而为分类提供了比较理想 的标准。在这个方法中使用了一个r因子来平衡词频。如下公式所示:
[0040]

【权利要求】
1. 一种面向内容中心网络中基于内容分类的类别流行度缓存替换方法,其特征在于: (1) 当有新的数据内容到达时,先判断节点剩余的缓存空间是否能够容纳新的数据内 容;如果有足够的缓存空间缓存新数据内容,则直接执行步骤(4);如果没有足够的缓存空 间缓存数据内容,则执行步骤(2),进行缓存替换; (2) 根据指数加权移动平均计算标准计算节点中所有内容类别的流行度,选择流行度 最小的内容类别; (3) 将流行度最小的内容类别中预定义时间内被请求次数最少的内容项移除节点缓 存; (4) 提取新数据内容名字字符串特征并进行分类; (5) 将新到达的数据内容项存入节点中相应的内容类别中,更新类别热度表和日志。
2. 根据权利要求1所述的一种面向内容中心网络中基于内容分类的类别流行度缓存 替换方法,其特征在于:所述步骤(1)中,在判断节点剩余的缓存空间是否能够容纳新的数 据内容之前,先检查节点CS表,查看缓存中是否已缓存该新的数据内容。
3. 根据权利要求1所述的一种面向内容中心网络中基于内容分类的类别流行度缓存 替换方法,其特征在于:所述步骤(2)中包括根据all-gram和R-值相结合的方法提取新数 据内容名字字符串特征并对内容进行分类:n-gram模型利用一个长度为η的滑动窗口来截 取一系列的子字符串,滑动窗口每次滑动一个长度单位,将经过n-gram模型处理后的内容 名字序列,分割成连续的长度都是η的子字符串。
【文档编号】H04L29/08GK104253855SQ201410384637
【公开日】2014年12月31日 申请日期:2014年8月7日 优先权日:2014年8月7日
【发明者】张国印, 邢志静, 武俊鹏, 夏松竹, 李庆显, 唐滨, 徐林枫 申请人:哈尔滨工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1