10.3772/j.issn.1000-0135.2015.04.006
多特征下的科研论文段落自动划分与构成要素识别研究1 &
本文为科研论文的结构化处理提供了一种有价值的方法。本文采用条件随机场模型,综合原始语料中科研论文的局部与整体特征,使用复杂特征模板对段落进行自动划分以及对构成要素进行自动识别。在开放测试中,F 值最高分别达88%和92%。同时本文对CRFs和 ME在段落自动划分与构成要素识别实验中进行了比较分析,认为CRFs在付出更大的时间复杂度的代价下,其处理效果明显优于ME。
条件随机场、CRFs、段落划分、要素识别、特征模板
TP3;TN9
1该研究是国家自然科学基金管理学部青年项目“基于CSSCI的句法级汉英平行语料库构建及知识挖掘研究项目编号71303120中的成果之一。
2015-10-30(万方平台首次上网日期,不代表论文的发表时间)
共10页
388-397