技术编号:8445391
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。在现有技术中,定向采集系统是网络蜘蛛的一种,它是网络数据获取系统的核心部分。它通过对互联网上已知信息(即网络链接,URLUniversal Resource Locator)的不断抓取海量网页内容,获取其中所有主题相关内容。目前,常见的网页采集方法有两种一种是设置起始的URL,采集系统就自动地按照网站结构的层次来设置URL的优先级,并按照这个级别进行网页的抓取。另外一种偏向于个性化采集,需要根据配置的抽取规则,来提取和主题相关的内容。对于第二种,网页定制化...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。