10.3969/j.issn.1002-1965.2015.01.032
面向网络舆情的哈萨克语情感词汇自动获取
为提高网络舆情分析中哈萨克语情感词汇获取的效率,解决人工获取方式低效的不足,提出了情感词汇自动获取机制。根据哈萨克语文本语料特点,分析了情感词汇的特征规则,结合词频逆文档频率( TF-IDF),建立了哈萨克语情感词汇特征模板,在此基础上利用最大熵模型实现哈萨克语情感词汇的自动获取。实验表明,哈萨克语情感词汇自动获取正确率达到74.2%,该方法是有效的。
网络舆情、哈萨克语、情感词汇、最大熵模型
TP391.1(计算技术、计算机技术)
国家自然科学基金项目“基于网络社群的网络舆情演化分析及突发事件预警机制研究”71261025;新疆财经大学社会经济统计研究中心项目“新疆互联网舆情倾向性调查与分析研究”050313C08;新疆财经大学校级科研基金项目“基于统计方法的新疆民文网络舆情情感倾向性分析技术研究”2013XYB005;新疆财经大学社会经济统计研究中心项目“基于统计学方法的网络舆情发现与分析研究”050312B01阶段性成果。
2015-01-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
169-173