10.3969/j.issn.1006-2475.2020.09.004
多特征融合的教育资源标签生成算法
利用标签的形式简单有效地对教育资源进行准确描述,对互联网中杂乱、庞大的教育资源进行高效分类,能使用户便捷地浏览和获取教育资源信息并提高教育资源的利用率.自然语言处理中生成文本标签的方法有很多种,但特征描述不全面,因此需要研究多特征融合的标签生成方法.本文结合中文文本的特点,在TextRank算法基础上,加入TF-IDF权重和位置信息权重,考虑词语在语料库中的信息及在文章中的位置信息,生成包括语料库信息和位置信息的标签,形成多特征融合的标签生成算法.测试结果及分析表明,多特征融合后的标签生成算法最高F值为0.571,其平均值为0.34,优于常用的TextRank算法和TF-IDF算法,有效提高了教育资源标签质量,有利于教育资源更好的利用和管理.
教育资源标签、TextRank算法、TF-IDF算法、标签生成、算法改进
TP391(计算技术、计算机技术)
国家科技支撑计划课题;湖南省重点研发计划项目;湖南省教育厅科学研究项目;湖南省研究生科研创新项目;近地空间电磁环境监测与建模湖南省高校重点实验室开放基金资助项目
2020-11-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
19-24