基于SELP的150b/s语音压缩编码算法
针对极低速率语音压缩编码中比特资源有限,量化精度严重不足的问题,该文提出了一种新的编码策略——减少量化传输的内容,提高重要内容的量化精度.语音经过低通滤波器将最不重要的3~4 kHz频谱滤掉,并相应的将采样率从8 kHz降低到6 kHz,同时保持每帧样点数不变.这样各个参数的联合帧数就减少为原来的3/4,在比特数不变的情况下,可以有效地提高量化精度.另外,对于线性预测系数(linear prediction coefficient,LPC)而言,由于语音谱从原来的0~4 kHz变为现在的0~3 kHz,LPC的预测阶数可以从10降低为8,参数维数降低,量化精度可以得到进一步提高.在此框架下,结合子带清浊音(band-pass voicing,BPVC)解码端恢复算法,实现了高质量极低速率150b/s语音压缩编码算法.与现有的两种150 b/s算法相比,客观平均意见得分(mean opinion score,MOS)分别提高了0.051和0.067,同时LPC参数的谱失真分别降低了0.09和0.16,改进了合成语音质量,提高了可懂度.
极低速率语音压缩编码、低通滤波、降采样、联合编码、线性预测系数
53
TN912.32
国家自然科学基金资助项目60572081
2013-11-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
967-971,976