10.3969/j.issn.2095-3801.2012.05.017
基于盘古分词的新闻行业垂直搜索引擎
通过对新闻行业进行分析,针对新闻网站对信息要求的特征,研究相关的中文分词算法以及全文检索框架,并设计了一个能够多线程进行数据采集和检索的垂直搜索引擎,然后通过盘古分词组件与Lucene搭建了一个高效的检索系统.系统通过中小型新闻网站的测试运行能够达到搜索引擎对信息查询准确性以及高效响应速度的要求,有较强的处理,改善了用户体验.
新闻网站、盘古分词、检索系统、垂直搜索引擎
34
TP391.2(计算技术、计算机技术)
2013-01-09(万方平台首次上网日期,不代表论文的发表时间)
共4页
66-69