期刊专题

10.16603/j.issn1002-1027.2017.06.004

机器学习在图书馆应用初探:以TensorFlow为例

引用
机器学习是人工智能的重要分支,TensorFlow是谷歌第二代开源人工智能机器学习平台.此文重点介绍机器学习(主要是深度神经网络)的基本原理和利用TensorFlow进行机器学习的基本方法,探讨在图书馆领域应用的可能和场景.以《全国报刊索引》的自动分类问题作为实验对象,利用两台图形工作站,建立了TensorFlow深度学习模型,通过设定参数和阈值、系统调优等工作,实践了应用TensorFlow的完整过程,论证了其可行性.实验通过对170万余条题录数据进行训练和测试,克服了报刊索引数据过于简单与中国图书馆分类法的类目过于细致之间的矛盾,实现了大类近80%和四级分类总体近70%的准确率(其中TP类达到91%),得出基本可代替人工分类流程的结论,为全国报刊索引的分类流程的半自动化提供有力工具,从而可望大大节省人力成本.下一步将继续利用TensorFlow的优化功能,结合更多的字段属性,进行系统调优,力争做到自动分类90 %以上的准确率.

智慧图书馆、人工智能、机器学习、TensorFlow、自动分类、神经网络

35

G250(图书馆学、图书馆事业)

国家社会科学基金重大项目“面向大数据的数字图书馆移动视觉搜索机制及应用研究”15ZDB126的研究成果之一

2018-01-12(万方平台首次上网日期,不代表论文的发表时间)

共10页

31-40

相关文献
评论
暂无封面信息
查看本期封面目录

大学图书馆学报

1002-1027

11-2952/G2

35

2017,35(6)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn