10.3772/j.issn.1673-2286.2010.09.003
基于条件随机场的专利摘要信息抽取研究
专利摘要是重要的情报分析数据来源,但其自然语言文本的特征,使得专利摘要的自动内容抽取具有较大难度.文章利用亚洲语言信息检索测评会议(NACSIS Test Collections for IR,NTCIR)提供的英文专利文摘测试语料,采用文本信息抽取统计方法中的条件随机场模型,通过提取并添加有效的特征,有针对性地抽取专利摘要中表示技术和功效内容的信息,为专利的技术功效矩阵分析提供可机器自动抽取的强大支持.
专利摘要、信息抽取、条件随机场
TP3;H12
国家科技部"十一五"科技支撑计划2006BAH03B03;中国科学技术信息研究所重点工作项目2009KP01-7-1;中国科学技术信息研究所2009年度预研基金项目项目YY-200906等项目的资助
2010-11-05(万方平台首次上网日期,不代表论文的发表时间)
共6页
7-12