10.3772/j.issn.2095-915x.2018.05.004
基于知识图谱扩展的短文本分类方法
概念图谱是微软根据对用户搜索日志的统计分析构建的一个大型知识图谱.为了解决文本分类中短文本的数据稀疏、易受噪声影响和主题不明确等问题,本文提出了一种基于概念图谱的短文本语义扩展表示方法.首先,计算文本特征词与概念图谱中各概念的关联度,选取关联度高的概念构成当前文本的概念词典.然后,将概念词典加入特征词集合得到短文本的语义扩展表示.对来自Twitter的短文本进行了扩展前与扩展后的分类实验,实验涉及5种分类算法和6种关联度计算方法.结果显示,概念化语义扩展表示可以提高短文本的分类效果,且包含可以扩展的特征越多的文本,分类结果提升越显著.
短文本分类、语义扩展、知识图谱、知识推理
4
TP391;G35(计算技术、计算机技术)
北京市社会科学基金项目青年项目"社交电商中消费行为演化机制及引导措施研究"17GLC066;北京物资学院高级别培养项目GJB20162002
2018-12-10(万方平台首次上网日期,不代表论文的发表时间)
共9页
38-46