维吾尔语情感分类算法
Research on sentiment classification of Uighur reviews作者机构:新疆大学软件学院乌鲁木齐830008 新疆大学网络中心乌鲁木齐830046
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2011年第47卷第36期
页 面:147-150页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(the National Natural Science Foundation of China under Grant No.60963017 No.60963018) 国家社科基金资助项目(No.10BTQ045)
摘 要:情感分类是一项具有实用价值的分类技术。目前英语和汉语的情感分类的研究比较多,而针对维吾尔语的研究较少。以n-gram模型作为不同的文本表示特征,以互信息、信息增益、CHI统计量和文档频率作为不同的特征选择方法,选择不同的特征数量,以NaǐveBayes、ME(最大熵)和SVM(支持向量机)作为不同的文本分类方法,分别进行了维吾尔语情感分类实验,并对实验结果进行了比较,结果表明:采用UniGrams特征表示方法、在5000个特征数量和合适的特征选择函数,ME和SVM对维吾尔语情感分类能取得较好的效果。