10.3969/j.issn.1002-1965.2014.07.029
基于引文耦合分析方法的相关词识别
借鉴引文耦合分析方法,将词条定义中的实词比作词条的参考文献,根据词条定义中实词耦合强度实现相关词的识别。首先对词条定义进行分词和词性标注,并进行人工校对,然后抽取出动词和名词词性的实词,以词条定义中实词的耦合强度作为判定标准实现相关词的推荐,并用人工校对的方法,计算相关词识别的准确率、召回率和F值,论证该方法的有效性。该实验将新能源汽车领域汉语科技词系统中随机选择的500条词条及其定义作为测试集,发现该方法可以达到较高的准确率和召回率。
词条定义、引文耦合分析、实词耦合、耦合强度、可视化
TP391(计算技术、计算机技术)
国家自然科学基金项目“面向特定情报分析应用的知识组织系统快速构建关键问题研究”71203208;国家“十二五”科技支撑计划课题“面向外文科技文献信息的超级科技词表和本体建设”2011BAH10B01;中国科学技术信息研究所重点工作项目“汉语科技词系统建设与应用工程”ZD2012-3-2的研究成果之一。
2014-08-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
161-164,121