10.16791/j.cnki.sjg.2022.03.027
基于容器云的分布式深度学习实验平台构建
该文针对神经网络模型训练过慢、集群部署缺乏弹性问题,采用CPU+GPU混合架构,利用Docker和Kubernetes系统搭建底层容器云基础,以TensorFlow作为上层机器学习框架,构建了分布式深度学习实验平台,并详述了GPU镜像制作、计算节点GPU支持、Kubernetes集群搭建、TensorFlow集群部署等实验平台建设细节.两个图片识别实验表明,该实验平台具有良好的性能优势和可扩展性,达到了应用部署自动化、硬件资源弹性伸缩、提升模型训练速度的目标,为人工智能实验平台建设提供了有益的思路,并起到推广作用.
深度学习、分布式训练、TensorFlow、Kubernetes、Docker、GPU计算
39
G482;G642.0(学校建筑和设备的管理)
江苏省现代教育技术研究智慧校园专项课题;教育部全国职业教育教师企业实践基地产教融合专项课题研究项目;三江学院校级科研重大项目
2022-04-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
147-152