噪音环境下的语音识别研究概述

噪音环境下的语音识别

噪音环境下的语音识别

摘要:语音信号数字处理技术在国民经济、日常生活和军事领域有着极为重要的应用价值和极其广阔的应用空间。本文介绍了语音信号处理在信息科学中的作用以及应用于科学领域的技术。

关键词:语音信号,识别,应用

众所周知,语音在人类社会中起了非常重要的作用。在现代信息社会中,小至人们的日常生活,大到国家大事、世界新闻、社会舆论和各种重要会议,都离不开语言和文字。近年来,普通电话、移动电话和互联网已经普及到家庭。在这些先进的工具中,语音信号处理中的语音编码和语音合成就有很大贡献。再进一步,可以预料到的口呼打字机(又称听写机,它能把语音转换为文字)、语音翻译机(例如输入为汉语,输出为英语,或者相反),已经不是梦想而是提到日程上的研究工作了。

计算机语音识别的最终目标是使计算机能够听懂人的语言。尽管语音识别的研究历史最早可以追溯到二十世纪50 年代初,但是直到60 年代中期以后才作为一个重要的课题展开工作,并且逐步取得实质性的进展。这有两方面的原因,一方面计算机产业的迅速发展提出了使用要求,同时软、硬件环境的改善为复杂算法的实现提供了好的环境;另一方面,数字信号处理的理论和算法已有相当基础。许多算法诸如快速傅里叶变换、倒谱计算、线性预测算法、数字滤波器等已经出现,语音信号特有的基音周期、共振峰等特征的提取算法也出现了。识别系统使用方式逐渐从特定人、孤立词、小词表方式发展到非特定人、连续语音、大词表方式。近十年来,语音识别的产品也逐渐多起来,例如Motorola 的语音拨号电话、IBM 的语音听写机等。但是,现有的语音识别系统都存在一个共同的问题,即性能不稳定。不同的用户、不同的信道、不同的背景噪音环境、不同的口音和发音方式都对识别性能有很大的影响。最近十多年来抗噪语音识别方法形成了高潮,因此,提高语音识别系统对噪音的鲁棒性,是今后语音识别研究的一个重点。

1 三种典型的去噪处理方法

我们可以将各种抗噪方法粗略可以分为信号级抗噪处理方法、特征参数级抗噪处理方法、模型级抗噪处理方法。后两种方法有些交叉。下面逐一进行讨论。

信号级抗噪处理

这种处理是从带噪语音信号中提取尽可能纯净的原始语音,在语音信号处理中称为语音增强。语音增强技术在语音通讯、语音识别中有都有应用。在实际应用推动下,早在60 年代语音增强这个课题就已引起了人们的注意,70 年代形成一个高潮,取得了一些基础性成果。由于噪声来源众多,并随应用场合而异,它们的特性也各不相同,因此,即便是在实验室仿真条件下,也难以找到一种通用的、能适用于各种噪声环境的语音增强算法。这就表明:必须针对不同噪声,采取不同的语音增强对策。文论述了如下一些语音增强方法:LPC 全极点模型增强算法、最大后验概率估计法、卡尔墁滤波法、维纳滤波法、谱减法及其改进形式、最小均方误差估计。则分别对噪音同化法、子波消噪算法、小波单阈值消噪算法、小波频带阈值消噪算法、使用心理声学准则的残余噪声抑制法进行了论述。在上述

Word文档免费下载Word文档免费下载:噪音环境下的语音识别研究概述 (共4页,当前第1页)

你可能喜欢

  • 语音识别系统
  • 语音增强
  • 检测装置
  • 语音识别芯片
  • 语音信号
  • 计算机基础知识培训
  • 语音识别算法
  • 小波变换

噪音环境下的语音识别研究概述相关文档

最新文档

返回顶部