10.3778/j.issn.1002-8331.2210-0446
多标签文本分类研究回顾与展望
文本分类(TC)是自然语言处理(NLP)领域的重要基础任务,多标签文本分类(MLTC)是TC的重要分支.为了对多标签文本分类领域进行深入了解,介绍了多标签文本分类的概念和流程.将近年来多标签文本分类方法划分为基于传统机器学习方法和基于深度学习方法,梳理了多标签文本分类领域常用的数据集和评价指标,分析了部分多标签文本分类模型的优势和存在问题.介绍了多标签文本分类的研究方向:标签相关性、特定标签特性、类别不平衡、标签丢失和标签压缩.对多标签文本分类的难点和未来的发展方向进行了总结展望.
多标签文本分类、深度学习、标签相关性、特定标签特性、类别不平衡
59
TP391(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;江苏省六大人才高峰高层次人才项目;苏州市科技计划项目
2023-09-28(万方平台首次上网日期,不代表论文的发表时间)
共21页
28-48