信息抽取技术在LBS中的应用
Application of Information Extraction Technique in LBS作者机构:中国科学院测量与地球物理研究所湖北武汉430077
出 版 物:《四川大学学报(工程科学版)》 (Journal of Sichuan University (Engineering Science Edition))
年 卷 期:2005年第37卷第1期
页 面:116-120页
核心收录:
学科分类:070801[理学-固体地球物理学] 07[理学] 08[工学] 081203[工学-计算机应用技术] 0708[理学-地球物理学] 0816[工学-测绘科学与技术] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:由于LBS系统的终端设备处理能力较低,显示屏幕较小,再加上无线数据网络带宽不足,因此无法浏览整个Web网页。采用信息抽取技术可以将用户感兴趣的信息提取出来,再发送给用户终端,有效地解决上述问题,信息抽取技术将是LBS系统中的一项重要应用。提出了一种基于信息抽取的从HTML到WML的页面转换方法,首先标记少量的Web网页形成样本实例集,采用归纳算法生成信息抽取规则;其次应用抽取规则和模式匹配来处理结构和风格类似的Web页面;最后将抽取结果转换为WML页面。开发了原型系统,通过对实际数据源的抽取,验证了此方法的有效性。