息的更新时间,计算多媒体信息集 合的第一预测更新时间,并确定第一预测更新时间小于当前时间的指定多媒体信息集合; 之后,根据指定多媒体信息集合的地址信息,获取更新的多媒体信息,由于在每一轮的更新 过程中,基于历史多媒体信息对多媒体信息集合的更新时间进行预测,并根据预测得到的 更新时间对多媒体信息集合进行更新,可有效降低数据更新量和数据更新时间。
[0219] 本领域普通技术人员可W理解实现上述实施例的全部或部分步骤可W通过硬件 来完成,也可W通过程序来指令相关的硬件完成,的程序可W存储于一种计算机可读存储 介质中,上述提到的存储介质可W是只读存储器,磁盘或光盘等。
[0220] W上仅为本发明的较佳实施例,并不用W限制本发明,凡在本发明的精神和原则 之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种多媒体信息更新方法,其特征在于,所述方法包括: 对于每一个多媒体信息集合,当所述多媒体信息集合中包括历史多媒体信息时,判断 所述历史多媒体信息的更新时间是否满足更新时间规则; 当所述历史多媒体信息满足更新时间规则时,根据所述历史多媒体信息的更新时间, 计算所述多媒体信息集合的第一预测更新时间; 确定第一预测更新时间小于当前时间的指定多媒体信息集合; 根据所述指定多媒体信息集合的地址信息,获取更新的多媒体信息。2. 根据权利要求1所述的方法,其特征在于,所述第一预测更新时间包括预测更新日 期,所述根据所述历史多媒体信息的更新时间,计算所述多媒体信息集合的第一预测更新 时间,包括: 获取每一项历史多媒体信息的更新日期; 统计所述更新日期坐落在第一预设时长中每一天的比例; 计算有多媒体信息更新的天数; 根据所述比例和所述天数,计算所述多媒体信息集合的预测更新日期。3. 根据权利要求1所述的方法,其特征在于,所述第一预测更新时间包括第一预测更 新时刻,所述根据所述历史多媒体信息的更新时间,计算所述多媒体信息集合的第一预测 更新时间,包括: 获取每一项历史多媒体信息的更新时刻; 根据所述更新时刻,预测所述多媒体信息集合的第二预测更新时刻; 确定当前的更新时间修正值; 根据所述第二预测更新时刻和所述当前的更新时间修正值,计算所述第一预测更新时 刻。4. 根据权利要求1或3所述的方法,其特征在于,所述根据所述指定多媒体信息集合的 地址信息,获取更新的多媒体信息之后,所述方法还包括: 获取修正时间步长和当前的更新时间修正值; 当所述第一预测更新时刻小于指定更新时刻时,根据所述当前的更新时间修正值和所 述修正时间步长之和,重置所述当前的更新时间修正值的大小,得到新的更新时间修正值; 或, 当所述第一预测更新时刻等于所述指定更新时刻时,根据所述当前的更新时间修正值 和所述修正时间步长之差,重置所述当前的更新时间修正值的大小,得到新的更新时间修 正值; 其中,所述指定更新时刻为所述指定多媒体信息集合的实际更新时刻。5. 根据权利要求1所述的方法,其特征在于,所述判断所述历史多媒体信息的更新时 间是否满足更新时间规则,包括: 根据所述历史多媒体信息的更新时间,判断所述历史多媒体信息之间的更新时间间隔 是否大于预设时间阈值; 如果所述历史多媒体信息之间的更新时间间隔大于所述预设时间阈值,则判断所述历 史多媒体信息的更新时间满足更新时间规则。6. 根据权利要求1所述的方法,其特征在于,所述判断所述历史多媒体信息的更新时 间是否满足更新时间规则之后,所述方法还包括: 当所述历史多媒体信息的更新时间不满足更新时间规则时,每隔第二预设时长获取所 述多媒体信息集合的更新数据; 在数据更新时长达到第三预设时长后,根据所述第三预设时长内每一个指定多媒体信 息的更新时间,统计所述多媒体信息集合的第二预测更新时间; 根据所述第二预测更新时间,获取更新的多媒体信息。7. 根据权利要求1所述的方法,其特征在于,所述判断所述历史多媒体信息的更新时 间是否满足更新时间规则之前,所述方法还包括: 当所述多媒体信息集合中不包括历史多媒体信息时,每隔第二预设时长获取所述多媒 体信息集合的更新数据; 在数据更新时长达到第三预设时长后,根据所述第三预设时长内每一个指定多媒体信 息的更新时间,统计所述多媒体信息集合的第二预测更新时间; 根据所述第二预测更新时间,获取更新的多媒体信息。8. 根据权利要求1所述的方法,其特征在于,所述根据所述指定多媒体信息集合的地 址信息,获取更新的多媒体信息,包括: 控制爬虫程序根据所述指定多媒体信息集合的地址信息,抓取所述指定多媒体信息集 合对应的网页; 在所述网页中获取更新的多媒体信息。9. 根据权利要求1所述的方法,其特征在于,所述根据所述指定多媒体信息集合的地 址信息,获取更新的多媒体信息,包括: 当所述指定多媒体信息集合的多媒体信息来源于指定服务器时,根据所述指定多媒体 信息集合的地址信息,通过所述指定服务器的数据接口,抓取所述指定多媒体信息集合对 应的网页;在所述网页中获取更新的多媒体信息;或, 当所述指定多媒体信息集合的多媒体信息来源于除所述指定服务器之外的其他服务 器时,根据所述指定多媒体信息集合的地址信息,获取发布在所述其他服务器的站点上与 所述指定多媒体信息集合相关的网页;在所述网页中获取更新的多媒体信息,所述更新的 多媒体信息中包括信息的来源标识。10. -种多媒体信息更新装置,其特征在于,所述装置包括: 更新时间规则判断模块,用于对于每一个多媒体信息集合,当所述多媒体信息集合中 包括历史多媒体信息时,判断所述历史多媒体信息的更新时间是否满足更新时间规则; 预测更新时间计算模块,用于当所述历史多媒体信息满足更新时间规则时,根据所述 历史多媒体信息的更新时间,计算所述多媒体信息集合的第一预测更新时间; 多媒体信息集合确定模块,用于确定第一预测更新时间小于当前时间的指定多媒体信 息集合; 第一多媒体信息获取模块,用于根据所述指定多媒体信息集合的地址信息,获取更新 的多媒体信息。11. 根据权利要求10所述的装置,其特征在于,所述第一预测更新时间包括预测更新 日期,所述预测更新时间计算模块,用于获取每一项历史多媒体信息的更新日期;统计所述 更新日期坐落在第一预设时长中每一天的比例;计算有多媒体信息更新的天数;根据所述 比例和所述天数,计算所述多媒体信息集合的预测更新日期。12. 根据权利要求10所述的装置,其特征在于,所述第一预测更新时间包括第一预测 更新时刻,所述预测更新时间计算模块,用于获取每一项历史多媒体信息的更新时刻;根据 所述更新时刻,预测所述多媒体信息集合的第二预测更新时刻;确定当前的更新时间修正 值;根据所述第二预测更新时刻和所述当前的更新时间修正值,计算所述第一预测更新时 刻。13. 根据权利要求10或12所述的装置,其特征在于,所述装置还包括: 修正时间获取模块,用于获取修正时间步长和当前的更新时间修正值; 更新时间修正值重置模块,用于当所述第一预测更新时刻小于指定更新时刻时,根据 所述当前的更新时间修正值和所述修正时间步长之和,重置所述当前的更新时间修正值的 大小,得到新的更新时间修正值;或,当所述第一预测更新时刻等于所述指定更新时刻时, 根据所述当前的更新时间修正值和所述修正时间步长之差,重置所述当前的更新时间修正 值的大小,得到新的更新时间修正值; 其中,所述指定更新时刻为所述指定多媒体信息集合的实际更新时刻。14. 根据权利要求10所述的装置,其特征在于,所述更新时间规则判断模块,用于根据 所述历史多媒体信息的更新时间,判断所述历史多媒体信息之间的更新时间间隔是否大于 预设时间阈值;当所述历史多媒体信息之间的更新时间间隔大于所述预设时间阈值时,判 断所述历史多媒体信息的更新时间满足更新时间规则。15. 根据权利要求10所述的装置,其特征在于,所述装置还包括: 第二多媒体信息获取模块,用于当所述历史多媒体信息的更新时间不满足更新时间规 则时,每隔第二预设时长获取所述多媒体信息集合的更新数据; 预测更新时间统计模块,用于在数据更新时长达到第三预设时长后,根据所述第三预 设时长内每一个指定多媒体信息的更新时间,统计所述多媒体信息集合的第二预测更新时 间; 所述第二多媒体信息获取模块,还用于根据所述第二预测更新时间,获取更新的多媒 体信息。16. 根据权利要求10所述的装置,其特征在于,所述装置还包括: 第二多媒体信息获取模块,用于当所述多媒体信息集合中不包括历史多媒体信息时, 每隔第二预设时长获取所述多媒体信息集合的更新数据; 预测更新时间统计模块,用于在数据更新时长达到第三预设时长后,根据所述第三预 设时长内每一个指定多媒体信息的更新时间,统计所述多媒体信息集合的第二预测更新时 间; 所述第二多媒体信息获取模块,还用于根据所述第二预测更新时间,获取更新的多媒 体信息。17. 根据权利要求10所述的装置,其特征在于,所述多媒体信息获取模块,用于控制爬 虫程序根据所述指定多媒体信息集合的地址信息,抓取所述指定多媒体信息集合对应的网 页;在所述网页中获取更新的多媒体信息。18. 根据权利要求10所述的装置,其特征在于,所述第一多媒体信息获取模块,用于 当所述指定多媒体信息集合的多媒体信息来源于指定服务器时,根据所述指定多媒体信息 集合的地址信息,通过所述指定服务器的数据接口,抓取所述指定多媒体信息集合对应的 网页;在所述网页中获取更新的多媒体信息;或,当所述指定多媒体信息集合的多媒体信 息来源于除所述指定服务器之外的其他服务器时,根据所述指定多媒体信息集合的地址信 息,获取发布在所述其他服务器的站点上与所述指定多媒体信息集合相关的网页;在所述 网页中获取更新的多媒体信息,所述更新的多媒体信息中包括信息的来源标识。
【专利摘要】本发明公开了一种多媒体信息更新方法及装置,属于网络技术领域。所述方法包括:对于每一个多媒体信息集合,当所述多媒体信息集合中包括历史多媒体信息时,判断所述历史多媒体信息的更新时间是否满足更新时间规则;当所述历史多媒体信息满足更新时间规则时,根据所述历史多媒体信息的更新时间,计算所述多媒体信息集合的第一预测更新时间;确定第一预测更新时间小于当前时间的指定多媒体信息集合;根据所述指定多媒体信息集合的地址信息,获取更新的多媒体信息。由于在每一轮的更新过程中,基于历史多媒体信息对多媒体信息集合的更新时间进行预测,并根据预测得到的更新时间对多媒体信息集合进行更新,可有效降低数据更新量和数据更新时间。
【IPC分类】G06F17/30
【公开号】CN105528376
【申请号】CN201410566788
【发明人】陈宏武
【申请人】腾讯科技(深圳)有限公司
【公开日】2016年4月27日
【申请日】2014年10月22日