期刊专题

10.16511/j.cnki.qhdxxb.2017.26.041

基于Kinect辅助的机器人带噪语音识别

引用
音视频信息融合可以提升机器人在噪声环境下的语音识别性能.然而受说话者的头部旋转、唇部尺寸不一、距摄像头距离不固定以及光照等因素影响,唇部信息不能得到有效的全面表征.该文提出融合机器人与Kinect的多模态系统.该系统采用Kinect获取3-D数据和视觉信息,并使用3-D数据重构侧唇来补充音视频信息.一系列基于特征融合和决策融合方法的结果表明:该文提出的多模态系统优于基于音视频单流和双流的语音识别系统,能够辅助机器人在自身噪声环境下的语音识别.

仿人机器人、自身噪声、自动语音识别、Kinect、多模态系统

57

TP242;TN912.34(自动化技术及设备)

国家自然科学基金;国家自然科学基金;天津市自然科学基金

2018-07-30(万方平台首次上网日期,不代表论文的发表时间)

共5页

921-925

暂无封面信息
查看本期封面目录

清华大学学报(自然科学版)

1000-0054

11-2223/N

57

2017,57(9)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn