10.3321/j.issn:0469-5097.2005.z1.137
提取、索引和挖掘中文学术论文
随着论文数量的增多,如何有效地利用从各种渠道获取的大量论文是本研究的重点.相对于围绕英文论文的相关工作,目前针对中文学术论文的提取和挖掘工作比较缺乏.以2004年全国软件与应用学术会议(NASAC2004)的论文投稿为测试集,对提取、索引和挖掘的中文学术论文的方法进行研究.针对提取论文元数据的困难提出了解决方案,并提出了经过分字段索引后,面向具体问题利用各种分析方法获取问题答案(知识)的方法.实验表明,利用计算机辅助人们自动分析中文学术论文是有意义并可行的.
自动提取、搜索引擎、学术论文、文本挖掘
41
TP391.1(计算技术、计算机技术)
863高科技发展计划资助项目2004AA119030
2008-05-12(万方平台首次上网日期,不代表论文的发表时间)
共8页
845-852