10.3778/j.issn.1002-8331.1406-0071
一种基于维基百科的文本表示方法
文本表示是自然语言处理中的基础任务,通常的文本表示模型都是基于训练数据充分的情况下进行。而在训练数据缺乏时,无法完成自然语言处理任务。提出了一种基于维基百科的文本表示方法,引入维基百科词条之间的关系,通过PageRank传播模型,能够一定程度上解决训练数据缺乏时文本表示的问题。通过实验论证了基于维基百科的文本表示能够增强分类方法的准确率、召回率和F1-测度。
维基百科、隐含狄利克雷分布、文本表示、文本分类
TP391.1(计算技术、计算机技术)
文化部国家文化科技提升项目No.201201-02。
2015-08-06(万方平台首次上网日期,不代表论文的发表时间)
共4页
127-130