背景噪声下的语音识别技术研究

研究了3种背景噪声下与说话人有关的孤立词语音识别方法。即语音前端声学处理法、正则相关分析的谱变换补偿方法和同模极点增加法。实验结果表明,这3种方法都有效地提高了噪声环境中语音识别率,其中较好的方法在强噪声环境中(信噪比为0dB)的语音识别率达到80%以上,为信噪比较低的噪声环境中自动语音识别展现了美好前景。

维普资讯 http://www.mianfeiwendang.com

陈伟红:背景噪声下的语音识别技术研究

背景噪声下的语音识别技术研究 陈伟红 (t电子科技大学 t林广西桂林 510 ) 4 04

摘要:究了 3种背景噪声下与说话人有关的孤立词语音识别方法。即语音前端声学处理法、则相关分析的谱变研正

换补偿方法和同模极点增加法。实验结果表明, 3种方法都有效地提高了噪声环境中语音识别率,中较好的方法在强这其 噪声环境中(噪比为 0d )信 B的语音识别率达到 8以上,信噪比较低的噪声环境中自动语音识别展现了美好前景。 O为 关键词:音前端声学处理;则相关分析的谱变换补偿;点增加;景噪声语正极背中圈分类号: N9 2 3 T 1. 4文献标识码: A文章编号:0 4—33 ( O 6 1 0 4— 2 10 7 X 2O )4— 4 0

Re e r h o iy S e c c g ii n Te h l g s a c n No s p e h Re o n to c no o y CHEN eh n W io g ( in Un v r i fE e to i Te h oo y G ul 5 1 0, i a Gu l ie st o lc r nc i y c n lg, in, 4 0 4 Chn ) i

A s r c: e e a e d fiu t s i o s p e h r c g i o e p ca l n lw in l O n ier t r if u t Th s p p r b t t Th r r i c li n n iy s e c e o n t n, s e i l i o sg a o s a i mo e d fi l a f e i y t o c . i a e d s rb s t r e me h d o p a e e c i e h e t o s f rs e k r—d p n e tn iy s e c e o n t n (s l t d wo d ) Th y a e a o s i f o te d p o e e d n os p e h rc g io i io a e r s . e r c u t r n n r— c c s i g, a o ia o r lt n b s d o o p n a in m e h d a d i c e s fp l sme h d Th x e i n a e u t h w h t e sn c n n c l r e a i a e n c m e s t t o, n n r a eo o e t o . ee p rm

e t l s lss o t a c o o r a l h h e e h i u s c n i r v o s p e h r c g iin e fc i e y a d t e b s o s p e h r c g i o a e i b v l t e t r e t c n q e a mp o e n iy s e c e o n t fe tv l, n h e tn i y s e c e o n t n r t s a o e o i

8 O

( e wh n SNR= 0 B) d . Ke wo d: c u tc fo te d p o e sn c n nc l o r l t n b s d o o y r s a o s i r n n r c s i g; a o i r ea i a e n c mp n a i n; c e s fp ls b c g o n o s a c o est o i ra eo oe; ak r u dn i n e

1引言 基于隐含马尔可夫模型 ( HMM)语音识别系统是目的 前该领域研究的主流,已达到一个比较成熟的阶段,并其

美倒谱系数和其一阶差分作为语音特征参量,使用仿真噪声,信噪比为 0d B时,识别率达 7以上。 5 第三种方法是对全极点模型的同模极点增加 (n I-

c aeo oe, )] r s f lsI法。使用 9阶 I C倒谱系数,噪比 e P P P信小于 1 B时, 0d极点个数提高 2倍,别率从 7提高到识 O 8以上。 O

对纯净语音的识别可以获得非常高的识别率,但是在噪声 环境下,于无处不在且变化多端的噪声带来了训练模型由

和识别特征之间的失配,语音识别系统的性能将会急剧下降,至远低于使用者所能允许的最低限度而无法使用,甚 因此抗噪声问题是语音识别系统达到真正实用所必须解决的课题。

2原理 2 A FEP法 .1

对带有噪声的语音信号进行前端声学处理,以减小噪 声对识别的影响。一种为非线性谱相减 ( o l er pc N n na e- i S ta u tat n, S法。 r l b rci NS ) S o X( f,,)一 ma ( ( f a f,) f,) b f,) x S f,)一 ( f N( f;N( f) () 1

本文阐述了 3种不同的研究方法。 第一种方法是语音前端声学处理 ( c ut rn A o s cF o t i E dPoes g A E

),里涉及 2种前级处理方法, n rcsi, F P法这 n

识别信号谱与噪声谱相减和信噪比规一化处理及他们的 联合使-。 1用 2阶美倒谱系数 ( l rq e c e s a Me—F euny C pt l r C ef i t, C )为语音特征参量,种前端处理联 ofc nsMF C作 ie两

式中 S f f表示带噪声的语音信号谱, f f由寂静 (, ) N(, )是

段估计的噪声信号谱。为使 2个谱相减值不至于过小或出现负值,噪声信号谱乘一固定因子 b或一个与频率和时间 有关的因子 a, f。另一种是信噪比归一化 ( N (,) S R N r ai t n方法。性滤波器组输出信号 X ()带有 om lai ) z o线 Kf掩蔽值 M f,为滤波器组的序号: () K ZK f一 X K f () ( )+ M K f () () 2

合使用时,在几种不同的行驶环境下, 3种不同的行驶汽车中,信噪比为 1 B时平均识别率达 8 。如果使用人 1d 8工仿真噪声则识别率大为提高。 第二种方法是正则相关分析的谱变换补偿 ( a o - C n n ia C reain B s d o o e s t n C C)。 1 cl o r lt ae n C mp n ai CB法 o o 2阶

掩蔽值 M f可作为瞬时信噪比值的函数计算,瞬 ()而 收稿日期:0 6一O O 20 4一 3 4 4

时信噪比值可以由语音信号 S ()和噪声信号 N ()的 f f

背景噪声下的语音识别技术研究

Word文档免费下载Word文档免费下载:背景噪声下的语音识别技术研究 (共1页,当前第1页)

背景噪声下的语音识别技术研究相关文档

最新文档

返回顶部