学术定义抽取系统实现及实验分析
设计了一种定义抽取系统,通过混合使用模式规则、语法规则和词频统计以达到定义抽取的目的。详细介绍了系统中的各项关键技术,包括分词技术、抽取规则导入技术、句子抽取技术和加权词处理技术。并选取《情报学报》2007-2008年的235篇论文全文作为实验数据,通过与人工抽取结果进行对比分析,测试了抽取系统_的抽全率与抽准率。
学术定义、知识抽取、自然语言处理、分析
34
G350(情报学、情报工作)
国家自然科学基金项目70803048
2012-04-21(万方平台首次上网日期,不代表论文的发表时间)
15-19