基于客户评论和语料库的在线酒店信誉维度挖掘
以携程网上消费者对酒店的文本评论为研究对象,通过对文本评论中的词语进行聚类,得到其中隐含的消费者最关注的酒店评价维度。为保证词语聚类的效果,引入语料库作为对比文档,通过分词、特征项表示、特征词编码标注、词义相似度计算以及基于DBSCAN的文本聚类过程,得到最后的评价维度,并以实例详细说明每个过程中所采用的方法及步骤。
信誉维度、词语聚类、文本评论、词义相似度、语料库
56
G203(信息与传播理论)
国家自然科学基金项目“基于文本挖掘的在线零售商信誉评价模型研究”70871048
2012-09-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
124-129