10.3778/j.issn.1002-8331.2011.36.041
维吾尔语情感分类算法
情感分类是一项具有实用价值的分类技术.目前英语和汉语的情感分类的研究比较多,而针对维吾尔语的研究较少.以n-gram模型作为不同的文本表示特征,以互信息、信息增益、CHI统计量和文档频率作为不同的特征选择方法,选择不同的特征数量,以Naive Bayes.ME(最大熵)和SVM(支持向量机)作为不同的文本分类方法,分别进行了维吾尔语情感分类实验,并对实验结果进行了比较,结果表明:采用UniGrams特征表示方法、在5 000个特征数量和合适的特征选择函数,ME和SVM对维吾尔语情感分类能取得较好的效果.
维吾尔语、情感分类、语言模型
47
TP391(计算技术、计算机技术)
国家自然科学基金the National Natural Science Foundation of China under Grant 60963017,60963018;国家社科基金资助项目10BTQ045
2012-03-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
147-150