10.3969/j.issn.1002-137X.2011.08.039
基于学术社区的学术搜索引擎设计
学术社区和学术搜索引擎在科研活动中日趋重要.给出了一个基于学术社区的学术搜索引擎的设计方案,指出了它应具备的功能,提出了应着重解决的关键问题,并对部分问题提出了实现思路.给出了系统的架构设计,并讨论了文献资料的整合算法,将分散在不同位置、提供不同内容的学术信息组合为一个整体,有效地解决了文献提取问题.针对普通中文分词组件在对姓名进行分词时准确率较低的问题,设计了一个专门针对姓名进行分词的高效的算法.在开源框架Nutch和HBase的基础上,实现了一个学术搜索引擎,并在实验中验证了设计的有效性.
学术社区、学术搜索引擎、文献整合算法、中文姓名分词
38
TP393(计算技术、计算机技术)
国家自然科学基金时态角色关系模型及协同感知技术研究60970044;广东自然科技计划项目面向学术信息服务领域的协同软件平台2010B010600031
2012-01-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
171-175