基于语义模型的文档特征提取
Feature Extraction of Document Based on Semantic Model作者机构:扬州大学信息工程学院计算机科学与工程系扬州225009
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2005年第41卷第17期
页 面:173-176页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:江苏省高校自然科学基金项目(编号:02KJB520013)
摘 要:文档特征提取是文本检索领域研究的最重要的问题之一。论文提出了一种全新的文档特征表示方式—语义模型。使用WordNet分析语义,提取主题句向量组用以确保文档含义的准确表达,再综合成文本向量保证特征表示的相关性。采用这种方式对文档作特征提取能在一定程度上同时提高文本检索的查全、查准率。理论分析与实验结果均表明论文的基于语义模型的文档特征提取方法是可行且有效的。