咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于混合策略的查询串相似度计算方法 收藏
基于混合策略的查询串相似度计算方法

基于混合策略的查询串相似度计算方法

作     者:章成志 李斌 

作者单位:南京大学信息管理系 南京师范大学文学院 

会议名称:《全国第八届计算语言学联合学术会议(JSCL-2005)》

会议日期:2005年

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

关 键 词:查询串相似度 语义相似度 字面相似度 语用相似度 

摘      要:计算查询串之间的相似度是进行查询串自动分类和聚类的基础。针对信息检索中用户查询串特点,提出综合考虑查询串中词语的词形、语义、语用三个层面的信息计算查询串相似度的计算方法。首先利用字面相似度算法计算查询串在词形上的相似度,然后利用义类词典进行关键词在语义层面上的匹配,得到查询串在语义层面上的相似度,接着以搜索引擎作为语料库来源。将查询串提交给搜索引擎,通过对返回结果中重叠部分的统计分析,计算查询串在语用上的相似度,最后综合这三个相似度,完成相似度的计算。初步实验结果表明该算法是有效的,可适用于自动问答、信息推荐等应用领域。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分