基于树型结构和加权熵的中文高频词提取算法
Chinese high-frequency word extraction algorithm based on tree structure and weighted entropy作者机构:吉林大学计算机科学与技术学院长春130012 辽宁大学信息学院沈阳110036
出 版 物:《吉林大学学报(工学版)》 (Journal of Jilin University:Engineering and Technology Edition)
年 卷 期:2011年第41卷第1期
页 面:188-192页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(60973136 60703068) 中国高等学校博士学科点专项科研基金项目(20060183043)
主 题:计算机应用 中文高频词 提取算法 加权熵 前缀树 后缀树
摘 要:提出了一种基于树型结构和加权熵的中文高频词提取算法。简单介绍了中文的树型结构和加权信息熵,详细叙述了算法的原理和设计步骤,并给出了具体的算法描述。实验结果表明,该算法是可行和有效的。