10.3969/j.issn.1006-2475.2015.12.004
基于句子权重和篇章结构的政府公文自动文摘算法
提高文摘自动生成的准确性,能够帮助人们快速有效地获取有价值的信息.本文根据政府公文结构性强的特点,提出一种基于句子权重和篇章结构的政府公文自动文摘算法,首先通过基于游标的截取字符分句算法,对文档中句子和词语信息进行精确统计,获得对文章内容和篇章结构的基本了解;在此基础上,提出基于篇章结构的词语权重和句子权重计算方法,并根据权重计算结果对句子进行权重排序;然后,根据生成摘要的规模,筛选出一定数量的候选文摘句子;最后,对候选文摘句子进行一定的后处理,输出文摘句.实验结果表明,与同类型自动文摘算法以及Word 2003提供的自动文摘工具相比,本文提出的自动文摘算法在准确率和召回率上都有较大提高.
政府公文、自动文摘、词语权重、句子权重、篇章结构
TP391.1(计算技术、计算机技术)
国家自然科学基金资助项目61502165;湖南省科技计划项目2014FJ6030;湖南省教育厅科研项目13C527;长沙市科技计划项目k1403042-11;湖南省重点学科建设项目湘教发[2011]76号;湖南师范大学学位与研究生教育教改课题14JG13;湖南师范大学教学改革项目处发2015-13-52
2016-03-02(万方平台首次上网日期,不代表论文的发表时间)
共6页
19-24