技术编号:18834277
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明涉及网络搜索技术领域,尤其涉及一种网页爬取的方法和装置。背景技术本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。随着互联网技术的发展,各种网络信息也越来越庞杂,为便于网页信息的收集、查询和检索,通常采用爬虫对网页进行自动爬取。现有技术下,通常需要针对各类网页进行人工分析,以定制网页爬取的爬虫规则,然而,当网页的页面结构发生改变时,就需要重新通过人工制定新的爬虫规则爬取网页,这会耗费大量的人力物力,降低了数据获取的效率。进一步地...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。