DOI：10.16603/j.issn1002-1027.2017.06.004

机器学习在图书馆应用初探:以TensorFlow为例

引用

摘要：

机器学习是人工智能的重要分支,TensorFlow是谷歌第二代开源人工智能机器学习平台.此文重点介绍机器学习(主要是深度神经网络)的基本原理和利用TensorFlow进行机器学习的基本方法,探讨在图书馆领域应用的可能和场景.以《全国报刊索引》的自动分类问题作为实验对象,利用两台图形工作站,建立了TensorFlow深度学习模型,通过设定参数和阈值、系统调优等工作,实践了应用TensorFlow的完整过程,论证了其可行性.实验通过对170万余条题录数据进行训练和测试,克服了报刊索引数据过于简单与中国图书馆分类法的类目过于细致之间的矛盾,实现了大类近80％和四级分类总体近70％的准确率(其中TP类达到91％),得出基本可代替人工分类流程的结论,为全国报刊索引的分类流程的半自动化提供有力工具,从而可望大大节省人力成本.下一步将继续利用TensorFlow的优化功能,结合更多的字段属性,进行系统调优,力争做到自动分类90 ％以上的准确率.

关键词：智慧图书馆、人工智能、机器学习、TensorFlow、自动分类、神经网络

所属期刊栏目：35

分类号：G250(图书馆学、图书馆事业)

资助基金：国家社会科学基金重大项目“面向大数据的数字图书馆移动视觉搜索机制及应用研究”15ZDB126的研究成果之一

在线出版日期：2018-01-12（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：31-40

英文信息展示

期刊专题