期刊专题

10.3772/j.issn.2095-915x.2018.05.004

基于知识图谱扩展的短文本分类方法

引用
概念图谱是微软根据对用户搜索日志的统计分析构建的一个大型知识图谱.为了解决文本分类中短文本的数据稀疏、易受噪声影响和主题不明确等问题,本文提出了一种基于概念图谱的短文本语义扩展表示方法.首先,计算文本特征词与概念图谱中各概念的关联度,选取关联度高的概念构成当前文本的概念词典.然后,将概念词典加入特征词集合得到短文本的语义扩展表示.对来自Twitter的短文本进行了扩展前与扩展后的分类实验,实验涉及5种分类算法和6种关联度计算方法.结果显示,概念化语义扩展表示可以提高短文本的分类效果,且包含可以扩展的特征越多的文本,分类结果提升越显著.

短文本分类、语义扩展、知识图谱、知识推理

4

TP391;G35(计算技术、计算机技术)

北京市社会科学基金项目青年项目"社交电商中消费行为演化机制及引导措施研究"17GLC066;北京物资学院高级别培养项目GJB20162002

2018-12-10(万方平台首次上网日期,不代表论文的发表时间)

共9页

38-46

暂无封面信息
查看本期封面目录

情报工程

2095-915X

10-1263/G3

4

2018,4(5)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn