10.3772/j.issn.1000-0135.2014.03.011
产品评论特征及观点抽取研究
随着电子商务的飞速发展,电子商务网站上各种产品的评论数量也在飞速地增长.如何从Web中大量存在的产品评论中挖掘出对消费者和生产厂商都有价值的信息,已经成为一个非常重要的研究领域.产品特征及观点的抽取是产品评论挖掘中的基本工作,其质量的好坏直接决定着后续工作的效果.双向传播算法能有效地抽取产品评论中的特征及观点,但对中文产品评论仍存在一些不足.本文对双向传播算法做了进一步的改进,提高了在中文产品评论中特征及观点抽取的准确率和召回率.首先,增加了两种产品特征和观点的间接句法依存关系模式,并引入了动词产品特征以增加召回率;其次,将产品特征和观点之间的句法依存关系模式作为HUB节点,利用HITS算法对候选产品特征和观点排序,从而提高准确率;最后,提出了模式相关性对最终抽取的产品特征进行优化,进一步提高了产品特征抽取的准确率.实验结果表明,本文的算法在不同产品评论的特征及观点抽取中都取得了较好的效果.
产品评论挖掘、产品特征和观点抽取、双向传播、HITS算法、模式相关性
33
TP3;I20
国家自然科学基金资助项目61170039
2014-07-04(万方平台首次上网日期,不代表论文的发表时间)
共11页
326-336