基于改进训练算法的HMM语音识别技术研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:skycliff520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术经过50多年的发展,已经在社会生活中得到了广泛的应用。在语音识别技术的发展历程上形成了各种理论和方法,如矢量量化、隐马尔科夫模型、神经网络等,隐马尔科夫模型的贡献让语音识别扩展到大词汇量、非特定人、连续语音识别。然而,隐马尔科夫模型训练算法存在容易陷入局部最优解的缺陷,随着智能算法的深入研究,智能语音识别技术成为当前研究的热点。语音信号的分析和处理是语音识别的前提和基础。本文首先论述了语音产生的机理、语音的特征、语音的数学模型,介绍了语音信号的预处理方法;总结了端点检测的常规方法和各种改进的方法;阐述了用于语音特征压缩和编码的矢量量化方法,给出了码本设计LBG算法的具体步骤。在此基础上,系统回顾了HMM的基本思想,HMM的前向后向算法、viterbi算法、BaumWelch算法。并结合现代人工智能算法的研究成果,融合克隆选择算法和基因克隆技术,提出了一种改进的BaumWelch算法,即基因克隆的BaumWelch算法(简称GCBW算法),该算法优化隐马尔科夫模型的参数B,以解决BaumWelch算法容易陷入局部最优解的问题。TIMIT语音库的实验表明:GCBW算法最终输出概率对数比BW算法平均提高3.67%,4状态和5状态测试集上的语音识别率平均提高1.49%和2.64%。本文还在Matlab实验平台上开发了语音识别原型系统,应用该系统的特定人在线语音识别实验,进一步验证了GCBW算法的可行性和有效性。该仿真系统为模型参数分析和算法改进设计提供了方便,也为以后的学习者提供了较好的实验平台。
其他文献
基于构件的软件开发是提高软件生产率、提高软件质量、解决软件危机的重要方法,是软件复用领域的研究热点;解决软件危机的另一方面是如何建立严格的数学方法,如何进行形式化
颅面复原是指在仅有颅骨信息的情况下,以相关领域知识为依据再现人脸面貌的过程,其在刑侦案件中尸骨身份辨认、考古领域古人物相貌重现和虚拟整形手术方面有着广泛的应用。本
洗车行为识别是复杂场景下人体行为识别的一个分支,目前简单场景下的人体简单动作的识别已基本得到解决,而复杂场景下的行为识别仍面临很多困难。洗车行中摄像头的特殊角度拍
电力是人们生活越来越不可缺少的一种能源,但是随着非线性负载在电力系统中的增加,使得电力系统受到的谐波污染日趋严重。电力谐波带来的危害,既影响电网中接连设备的寿命,也影响电网的自身安全。针对电力谐波进行研究,找到防治办法是非常重要的,防治的首要前提就是及时正确的获取谐波数据。本文针对要获取的电力谐波数据进行了分析,提出了基于USB的数据采集方案,并比较了基于传统总线的数据采集方式。随后,对USB的体
计算智能方法是受大自然智慧和人类智慧的启发而设计出的一类算法的统称。无论是在科学研究领域,还是工业生产领域,人们都避免不了遇到一些全局优化问题,然而随着时代的进步,
三维人脸重建和人脸动画合成画是当前计算机图形学、计算机视觉和图像处理领域中一个热点研究课题,在视频会议、影视制作、通讯等方面有着广泛的应用,具有很大的应用价值和商
电子地图具有对纸质地图的内容进行任意形式的要素方便组合、拼接成新地图的优势,可对电子地图进行任意比例尺、任意范围的绘图输出。本文通过对甘肃省庆阳市巴家咀水库的地
流形学习是近年来机器学习的热点问题之一,其目的是要发现嵌套在高维空间中的低维流形。本文针对流形学习研究中存在的几个不足,即:1)如何适合地度量流形问的距离;2)如何有效地
随着互联网和通信技术的发展,用户对于通信网络的要求越来越高,传统单一的无线网络技术已经不能支撑用户日益增长的需求。虽然不同无线网络的异构融合技术的出现在一定程度上
在现有的软件开发过程中,高层的设计概念和实现这些设计的程序设计语言成分之间常常缺乏直接的对应关系,导致很多设计概念湮没于琐碎的代码中。不能从代码中恢复出这些设计概念