基于N-gram复合分词的领域概念自动获取方法研究
文章提出一种基于N-gram复合分词的领域概念自动获取方法,在中文分词的基础上进行N元复合切分,通过建立一系列过滤规则,提取候选领域概念;然后以改进的TF-IDF作为衡量领域相关性的统计特征值,计算候选概念的领域相关性;最后进行人工辅助判断与筛选.以航空发动机领域语料为样本进行了实践探索,实验结果表明该方法能有效抽取专业领域概念,具有较强的实用性.
概念、概念抽取、复合分词、领域相关性
37
国家社会科学基金重大项目“基于语义的馆藏资源深度聚合与可视化展示研究”11&ZD152;总装技术基础研究课题“领域知识获取方法及应用研究”项目G20121QB05的成果
2014-03-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
122-126