医学学术信息自动采集系统的设计与实现
[目的]针对高水平期刊文献的中文导读这类特定的新闻信息,构建一套自动汇聚医学网站新闻系统,实现关键词提取、分类及期刊导航等二次数据加工功能.[应用背景]为图书馆开展主动推送及学科服务提供国外学术研究信息源.[方法]利用HttpClient与HtmlParser构建主题网页采集器,实现新闻列表页及内容采集.利用IK Analyzer2012分词器及医学主题词表实现关键词提取及学科分类.[结果]系统实现指定网站新闻的自动采集、关键词提取、学科分类归属等功能.[结论]为图书馆员开展学术信息推送及学科化服务等提供一套行之有效的工具,为医学研究者纵览学术进展提供一站式访问.
信息采集、学术期刊、HttpClient、HtmlParser、信息推送
G354;TP391(情报学、情报工作)
2014-12-18(万方平台首次上网日期,不代表论文的发表时间)
73-78