语音识别技术与进展

语音识别技术与进展

摘要:本文首先介绍了语音识别技术的发展历史,再对它的基本原理做了简要概括,最后对语音识别技术时下的研究热点和相关问题做了介绍。

关键字:语音识别技术 基本原理 HMM

一、语音识别技术的发展历史

简要来讲,语音识别技术就是让机器通过识别和理解过程,把人类的语音信号转变为相应的文本或命令的技术,属于多维模式识别和智能计算机接口的范畴。其研究目标是让计算机听懂人类口述的语言。

语音识别起源于20世纪50年代贝尔实验室的Audry系统。它第一次实现了 10个英文数字的语音识别。这是语音识别研究工作的开端。

60年代,计算机的应用推动了语音识别的发展。其中,动态规划(DP)和线性预测分析技术(LP)等技术的提出和运用,对语音识别的发展产生了深远影响。 70年代,LP技术得到进一步发展,动态时间归正技术(DTW)基本成熟。特别是矢量量化(VQ)和隐马尔可夫模型(HMM)理论在实践上的运用,初步实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统

20世纪80年代,随着HMM模型和人工神经元网络(ANN)等技术在语音识别中的成功应用,人们终于在实验室突破了大词汇量、连续语音和非特定人这三大语音识别障碍。在声学识别层面,以多个说话人发音的大规模语音数据为基础,通过对连续语音中上下文发音变体的HMM建模,语音音素识别率有了长足的进步;在语言学层次,以大规模语料库为基础,通过统计两个邻词或三个邻词之间的相关性,可以有效地区分同音词和由于识别带来的近音词的模糊性。另外再结合高效、快捷的的搜索算法,就可以实现实时的连续语音识别系统。

进入90年代以后,人工神经网络技术的应用成为语音识别的一条新途径。 它具有自适应性、并行性、非线性、鲁棒性、容错性和学习特性,在结构和算法上都显示出了很大的潜力。而且还在细化模型的设计、参数提取和优化以及系统的自适应技术上取得了关键进展。语音识别技术进一步成熟,语音识别系统从实验室走向实用。

我国的语音识别研究工作一直紧跟国际水平,国家也很重视,并把大词汇量语音识别的研究列入“863”计划,由中科院声学所、自动化所及北京大学等单位

Word文档免费下载Word文档免费下载:语音识别技术与进展 (共6页,当前第1页)

语音识别技术与进展相关文档

最新文档

返回顶部