通用互联网信息采集系统的设计与初步实现
Design and Implementation of Internet Information Gather and Process System作者机构:中国科学院计算机网络信息中心管理服务中心北京100864
出 版 物:《计算机应用研究》 (Application Research of Computers)
年 卷 期:2005年第22卷第1期
页 面:187-189,210页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:通过建立网页资源库,结合Spider技术、内容分析技术、引入用户数据项和替换抽取指令编辑器等,提供和定制可视化通用性较强的互联网信息采集系统,能定期自动跟踪相关网站或网页,进行比较分析、抽取、规整入库、分类等,从互联网上获取所需信息。