期刊专题

10.3969/j.issn.1672-2922.2006.04.025

言语识别中的时域及频域信息

引用
本文对言语识别中的声学要素从时域和频域的角度进行探讨,旨在为人工耳蜗编码策略的改善提供理论依据.声码器技术被用于一系列的实验以确定时域和频域信息对言语识别和汉语四声识别的相互作用.频域信息是由声码器中的频道数来决定,而时域信息则是由声码器的低通滤波器的截止频率来决定.听力正常成人参加了各项感知试验.结果 表明,时域和频域信息都对音素识别很重要.在安静环境下,辅音和元音识别率分别在8和12频道及16 Hz和4 Hz的低通截止频率时达到平台成绩.在噪声环境下,元音识别受益于增高的频道数.汉语四声的识别需要256 Hz的低通截止频率才达到平台成绩,这一频率比英语音素识别所需的时域信息高得多.声调识别率在本研究中最高频道数12时仍未见饱和.为了研究细微结构和时域包络对四声识别的相对重要性,我们用声嵌合技术将不同声调信号的时域包络和细微结构进行对换.感知实验结果表明,声调识别主要取决于细微结构,这一点与音乐感知的结果类似,而不象言语识别,后者主要依赖于时域包络信息.因此,增加人工耳蜗系统中有效的频道数将有助于尤其是噪声环境下的言语识别.将人工耳蜗刺激中提供更多的细微结构信息可能会提高患者声调识别的成绩.

人工耳蜗、言语识别、声调识别、时域信息、频域信息

4

R339.16;H018.4(人体生理学)

美国国立卫生研究院资助项目F32-DC00470,RO1-DC03808,R03-DC006161;俄亥俄大学研究基金

2007-03-05(万方平台首次上网日期,不代表论文的发表时间)

共8页

335-342

相关文献
评论
暂无封面信息
查看本期封面目录

中华耳科学杂志

1672-2922

11-4882/R

4

2006,4(4)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn