咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于HTML文档结构的向量空间模型的改进 收藏

基于HTML文档结构的向量空间模型的改进

Vector Space Model Based on HTML Document Structure

作     者:胡健 陆一鸣 马范援 Hu Jian;Lu Yiming;Ma Fanyuan

作者机构:上海交通大学计算机科学与工程系上海200030 

出 版 物:《情报学报》 (Journal of the China Society for Scientific and Technical Information)

年 卷 期:2005年第24卷第4期

页      面:433-437页

核心收录:

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 081202[工学-计算机软件与理论] 

基  金:国家自然科学基金 

主  题:HTML文档结构 信息检索 向量空间模型链接文本TREC 向量空间模型 HTML文档 文档结构 向量模型 分布特征 检索性能 标签 

摘      要:根据HTML文档不同标签域的分布特征和对文档内容的代表能力不同,我们提出了一种改进的向量模型(PFTF),并通过trec12的查询实验,比较了传统向量模型与PFTF模型对单个标签域以及多个文档表示结果的结合的检索性能.实验结果表明,PFTF模型对于这两个方面都有提高.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分