咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >领域本体驱动的招投标网页解析方法 收藏

领域本体驱动的招投标网页解析方法

Domain ontology driven approach for bidding webpage parsing

作     者:马冬雪 宋设 谢振平 刘渊 MA Dongxue;SONG She;XIE Zhenping;LIU Yuan

作者机构:江南大学数字媒体学院江苏无锡214122 江苏省媒体设计与软件技术重点实验室(江南大学)江苏无锡214122 浪潮卓数大数据产业发展有限公司江苏无锡214125 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2020年第40卷第6期

页      面:1574-1579页

学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金资助项目(61872166) 江苏省科技计划项目(BE2018056)。 

主  题:招投标 领域本体 网页解析 元解析模型 知识图谱 

摘      要:针对正则表达式解析招投标网页效率低下的问题,提出了一种基于招投标领域本体的网页自动化解析新方法。首先,分析了招投标网页文本的结构特征;其次,构建了招投标本体的轻量级领域知识模型;最后,给出一种招投标网页元素语义匹配与抽取算法,实现招投标网页的自动化解析。实验结果表明,新方法通过自适应的解析,准确率、召回率分别可达到95.33%、88.29%,与正则表达式方法相比,分别提高了3.98个百分点和3.81个百分点。所提方法可实现自适应地对招投标网页中语义信息的结构化解析抽取,能够较好地满足实用性能要求。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分