网上表格数据到XML的自动转换
Automatic conversion of HTML tables into XML作者机构:武汉大学计算机学院武汉430072 新汶矿业集团职工大学山东莱芜271100
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2007年第43卷第2期
页 面:190-192页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
基 金:湖北省自然科学基金资助项目(2005ABA238) 国家自然科学基金资助项目(60273072)
摘 要:互联网上有大量信息采用HTML表格表示,由于HTML不描述数据的内容,机器不能理解和查询。论文利用HTML表格属性,在表格中插入冗余单元,使HTML表格规范化;对没有标志表头的HTML表格,采用格式化的信息的量化值识别网上表格的表头。在此基础上,提出了通过获取表格属性与值对应的语义层次,自动转换HTML表格数据为XML文挡的新方法。