基于机器学习的维吾尔文文本分类研究
Machine learning based Uyghur language text categorization作者机构:新疆大学现代教育技术中心乌鲁木齐830046 新疆大学信息科学与工程学院乌鲁木齐830046
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2012年第48卷第5期
页 面:110-112页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(No.61063026 60963018)
主 题:文本分类 朴素贝叶斯方法 k-最近邻方法(kNN) 维吾尔语 特征选择
摘 要:随着Internet上维吾尔文信息的迅速发展,维吾尔文文本分类成为处理和组织这些大量文本数据的关键技术。研究维吾尔文文本分类相关技术和方法,针对维吾尔文文本在向量空间模型(VSM)表示下的高维性,采用词干提取和IG相结合的方法对表示空间进行降维。采用基于机器学习的分类算法(kNN和Nave Bayes)对维吾尔文文本语料进行了分类实验并分析了实验结果。