抗噪声语音识别技术研究

抗噪声的语音识别技术是语音识别系统进入实用化的一个关键性难题.本文首先介绍了影响语音识别系统的噪声因素,然后对传统的抗噪声语音识别技术进行了总结和概述,最后介绍了几种近年来出现的抗噪声语音识别新方法.

中国科技信息20年第 7 06期

C I ̄C NEADT卜c H A SI C N E N N E c

I OM T N^,o N R A I 2 F O∞

维普资讯 http://www.mianfeiwendang.com

- |

术、语音增强技术和模型补偿技术。 ●抗噪声的语音特征

受噪声的影响,带噪语音特征的分

抗噪声语音 识别技术研究 熊燕广东省教育学院计算机科学系 5 0 0 15 5 噪声、方言和口音、口语识别已经成为 抗噪声的语音识别技术是语音识别系统进入 实用化的一个关键性难题。本文首先介绍

布会与干净语音特征的分布有不同程度的筹别,使得训练好的语音模型无法准确地反应带噪语音特征之间的统计特性。 囚此通过寻找对噪声影响不敏感的语音特 征, 以减小噪声对识别系统的影响,

目前语音识别中三个主要的新难题。 自2 O世纪 9 0年代初开始,抗噪声语音识别技术就成为语音识别研究中的一个主攻方 r。众多研究者提出 _量提高口 J r大语音识别系统在噪声环境中识别率的方法, 取得了一定的进展,但在面对现实生活中复杂多变的环境噪声时,现有的技术还显

使训练好的语音模型仍能适应带噪语音的识圳。由丁这类方法无须现场估计环境噪声的特性或修改语音模型,因此在实 际中得到了广泛的应用。目前抗噪声语音特征的提取主要通过两种方法来实现, 种是模仿人类听觉系统的特性来设计语音特征,例如常用的 P P ( e cp tl L P re u al y 一

了影响语音识别系统的噪声因素,然后对

b sd i e r P e ito a e L n a r dcin)特征、子带特征等;另一种是采用信号处理的方法来去除噪声对语音特征的影响,包括常见的一阶和二阶差分特征、C M N ( e s r m Me n C p tu a No ma ia o、 r ls t n)

传统的抗噪声语音识别技术进行了总结和概 递。最舞介绍了几种近年采出现的抗噪声 语音识别新方法。

语音识别;鲁棒性; 噪声

得非常不足。本文首先介绍丁响语音识影别系统的噪声因素,然后对传统的抗噪声 语音识别技术进行了总结和概述,最后介绍了几种近年来出现的抗噪声语音识别新 方法。

R S A PP A T— L、基于自相关序列的语音特 征等。

●语音增强语音增强的主要目的是从带噪的语音信号中可能地恢复出干净的语音信号,

引言 让机器听懂人类的声音值足人仃的 J 理想。自2世纪 4年代未开始,人们就致 0 O力于语音识别技术的研究。经过多年的努力和发展,语音识别技术已经在许多方面取得了重大的突破,目前中小词汇量的孤立词和连接词语音识别问题已经得到了较好的解决,大词汇量的连续语音识别技术也得到了长足的发展,住安静的环境、正常的语速、比较标准的发音、较充足的自 适应数据等条件下,不少大词汇量连续语音识别系统的识别率都能达到 9%以上。 0 近年来市场上陆续推出了多种中小词汇量 的语音识别产品,一些大公司如 I M、微 B

1。传统的抗噪声语音识别方法 在实际应用中,语音识别系统工作的声学环境是多种多样的,各种噪声和失真对语音识别系统性能的影响也各不相同。 -

使声音更清晰悦耳。就这个目的来说, 语音增强与提高识别系统在噪声环境中的识别率是相一致的,因此可以把语音增强器结合到语音识别系统的前端来提高其抗噪声性能。但由于语音增强的最终接受对象是人类的听觉系统,因此某些算

般来说,影响语音识别系统的因素通常

法在设计上并不都适用于语音识别系统。 语音增强技术本身是语音信号处理中的一 个专题,许多研究者在这方面做了大量的工作,现在已经有一些较为系统的方法,如谱相减法、维纳滤波、M s E M ( n mu Me n q a e E r r、小 Mi i n a~S u r r o )波增强、基于语音生成模型的增强算法等等。 ●噪声环境的模型补偿

包含:1、背景噪声和麦克风失真。 ) ) 2、由背景噪声和情绪的波动等造成的 L mb r o ad效应和重音 3、如果语音信号需要经过 )信道传输后才A I~,达语音 l别系统的话, J L只 传输信道的加性和卷积噪声,接收端的加

软等也相继推出了自己的大词汇量连续语音识别的商用产品。 尽管如此,语音识别技术离真正全面进入人们的现实生活还有相当距离,其中鲁棒性是语音识别技术实用化过程中最迫切需要解决的关键问题之一。目前语音识别系统中普遍采用了基于统计模型的识别

性噪声等也会对语音识别系统产生不良的

影响。 对于基 1统计方法的语音识别系统,:

与抗噪声语音特征和语音增强技术相 比 .模型补偿技术不是通过减小噪声对

提高语音识别系统在噪声环境中的性能主 要可以通过两种途径来实现,一种是减

技术,其模型的有效性很大程度上取决于语音模型与输入语音特征的统计特性之间训练数据是否有足够的代表性,因此当使的差别,使得识别系统能直接使用带噪用环境与训练环境有差异时,如征存在背的语音特征进行识别。根据使用的方法景噪声、信逋传输噪声、说话人语速和发不同,传统的抗噪声语音识别技术主要音不标准等情况下,识别系统的性能往往可以分为三类:抗噪声语音特征提取技会显著下降,无法满足实用的要求。环境

少环境噪声对识别系统前端的影响,使输入语音特征的统计特性尽量接近训练时的语音特征的统计特性,另一种是减少

语音信号或语音特征的影响来提高识别系统在噪声环境中的识别率,而是通过修 改语音模型的参数,使其能更准确地描述噪声环境中语音信号的统计特性来提高识别系统的性能。这种方法在特定的环境中能取得很好的效果,但当工作环境发生变化时,通常需要重新计算语音模型。常用的模型补偿技术包括基于模型的预测补偿技术和模型自适应技术,前

http://www.mianfeiwendang.com

Word文档免费下载Word文档免费下载:抗噪声语音识别技术研究 (共1页,当前第1页)

你可能喜欢

  • 法语语音
  • 语音课
  • C语音
  • 语音技巧
  • 语音编码技术
  • 语音噪
  • hmm matlab语音语音识别

抗噪声语音识别技术研究相关文档

最新文档

返回顶部