10.3772/j.issn.1673-2286.2010.09.002
条件随机场与规则集成的专利摘要信息抽取
专利是一种重要的情报分析数据来源,由于专利使用的术语比论文更为抽象等原因,基于统计的信息抽取效果并不理想.文章利用文档结构的特点以及专利写作过程中的常用特色词汇,在利用条件随机场这种概率模型的基础上,提出了集成基于规则的专利摘要信息抽取方法.系统参加亚洲语言信息检索测评会议专利挖掘之技术趋势图谱子任务,取得较好的成绩,证实其系统的实用性与高效性.
信息抽取、条件随机场、规则
TP3;H12
国家科技部"十一五"科技支撑计划2006BAH03B03;中国科学技术信息研究所重点工作项目2009KP01-7-1;中国科学技术信息研究所2009年度预研基金项目项目YY-200906等项目的资助
2010-11-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
2-6