维吾尔语语音识别中的子词建模方法研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:christian1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动语音识别任务在人工智能领域举足轻重,是人与智能设备沟通交流的桥梁,广泛适用于自动问答系统、无障碍自动语音翻译等多个领域。不同于世界上主流语言识别技术的快速发展,维吾尔语等少数民族使用语言在资源匮乏的情况下发展缓慢,现今5G时代对低资源语言的语音识别性能需求越来越高,维吾尔语是典型的黏着性语言,与哈萨克语、土耳其语类似,存在词汇爆炸问题。本文结合维吾尔语本身的语言特点,为提高语音识别的正确率进行了以下工作:维吾尔语因本身的语言特性,在一个语音识别系统中,发音词典通常很难覆盖所有的单词,容易出现集外词问题,为了缓解此问题,语音识别系统采用子词单元进行建模,使用基于统计的字节对编码(Byte Pair Encoding,BPE)算法来获取子词单元,并在此方面做了相关研究,研究了子词建模单元的数目可能对识别系统的影响。BPE算法因本身特点,具有一定的缺陷,机器翻译任务中修改BPE算法的解码过程,得到BPE-Dropout算法,提高了分割过程中的鲁棒性,却不适用于维吾尔语的语音识别任务,在此基础上,本文提出Improved_BPE-Dropout算法来构建更适合于子词建模的语言模型,综合了BPE算法和BPE-Dropout算法二者的优点,识别性能得到明显改善。针对维吾尔语的训练数据无法构建强壮的声学模型的情况,本文在原有数据上进行数据增广,使用音量扰动和速度扰动的方法增加数据量,采用目前工业界中使用广泛的链式(Chain)模型,结合子词单元建模方法,识别效果相对于传统DNN建模取得显著提升。使用Kaldi语音识别工具包和GStreamer工具包,以服务端-客户端的结构方式,结合HTML标签、CSS样式和Java Script脚本搭建在线的WEB页面版实时语音识别系统,构建人机交互的语音识别平台。此平台可提供维吾尔语、英语、汉语三种语言的在线语音识别,页面简单,功能实用。
其他文献
随着养殖业规模的迅速扩大,动物传染病频发,严重威胁我国畜牧业的发展,甚至影响公共卫生安全。目前,利用消毒剂对畜禽舍进行消毒仍是预防和控制疾病最常用的措施之一。因此,开发新型消毒剂并对其进行科学系统的评价显得尤为重要。本研究通过悬液定量杀菌实验方法,分别以大肠杆菌和金黄色葡萄球菌为指示菌,在评价浓度与时间、温度、pH值和有机物等单因素对复方癸甲氯铵消毒剂杀菌效果影响的基础上,选择猪舍和鸡舍进一步研究
随着机动车保有量的快速增加和道路交通的高速发展,如何保障行车安全,减少交通事故成为人们关心的问题,基于计算机视觉的交通目标识别与检测技术也因此具有重要研究价值。本文针对交通目标的识别与检测开展研究,主要研究工作如下:(1)针对传统机器学习方法存在交通标志识别精度低、鲁棒性差和经典卷积神经网络方法在交通标志图像上识别精度低的问题,本文设计了基于多阶段特征融合的卷积神经网络交通标志识别方法。提出了一种
多粘菌素被认为是治疗多药耐药革兰氏阴性菌感染的“最后一道防线”,然而质粒介导的可水平转移的多粘菌素耐药基因mcr-1的发现严重威胁该药的临床应用。多项研究表明,养殖动物肠道是mcr-1基因发生发展的重要场所和贮藏库,然而目前对该基因在动物肠道菌群中的分布特征和传播扩散模式却知之甚少。本研究以一头猪的肠道菌群为研究对象,开展多粘菌素耐药菌株分离鉴定工作,建立多粘菌素耐药菌株库。利用PCR技术进行mc
坎儿井是鄯善地区主要的地下水利灌溉系统,坎儿井孕育了鄯善绿洲,近年来,坎儿井数量逐渐变少,对坎儿井数量的变化以及该变化对鄯善绿洲产生影响进行研究,有助于更好地利用和维护坎儿井。本文以坎儿井及其影响下的绿洲为研究对象,运用古籍资料与现代遥感图像结合等方法,初步还原清末民初和20世纪50-60年代坎儿井及其影响下的绿洲变化情况;同时基于清末民初、20世纪50-60年代、近年来三个阶段对鄯善各个乡镇坎儿
马腺疫(Strangle)是由马腺疫链球菌(Streptococcus equi subspecies equi,S.equi)引起的急性高度接触性传染病,表现为发热、流脓性鼻液和头颈部淋巴结脓肿等症状,严重时可致动物死亡,该病在全球范围内流行,已给养马业造成了严重的经济损失。目前国内外的学者对S.equi的研究多集中在已发现的少数毒力因子上,以S.equi新疆地方流行株全基因组背景探索该菌进化关
本试验以蝉花基质为原料,分析查明一般营养成分、矿物质、维生素及氨基酸含量,并探讨饲粮添加蝉花基质对绵羊瘤胃发酵和消化率的影响。采用常规法和色谱法对蝉花基质的一般养分含量及氨基酸组成进行分析;以粗饲料和配合精料比例80:20(粗料型)和60:40(精料型)的两种日粮,其中配合精料部分以0%(对照)、5%、10%、15%和20%的比例替换为蝉花基质进行了体外发酵产气动力学研究;研究以20%比列的蝉花基
本研究以植物分类学、生态学和植物区系等相关理论为指导,通过查阅前人研究成果与咨询专家建议,利用AHP层次分析法,构建阿勒泰市、伊宁市公园绿化树种综合评价体系,在阿勒泰市、伊宁市公园绿化树种的实地调研的基础上,筛选出阿勒泰市、伊宁市地区公园绿化的适宜树种,同时为新疆相似气候区域的绿化树种应用选择提供了有力的理论依据。主要研究结果如下:(1)阿勒泰市公园绿化树种共78种,隶属23科41属,伊宁市公园绿
随着计算机视觉技术的不断进步,目标跟踪技术飞速进步,但在目标跟踪过程中,背景干扰、遮挡、低分辨率和目标形态变化等因素都会对跟踪结果带来严重影响,因此,对目标跟踪算法的研究具有重要现实意义。目前已经研究出许多基于卷积神经网络(CNN)的跟踪器,多域卷积神经网络(MDNet)是一种CNN架构的在线跟踪算法。但跟踪目标多为小目标,特征提取本就存在一定困难,在面对遮挡、低分辨率和快速移动挑战,MDNet无
鸡传染性支气管炎(Infectious bronchitis,IB)、禽流感(Avian influenza,AI)、新城疫(Newcastle disease,ND)、鸡传染性法氏囊病(Infectious bursal disease,IBD)和鸡痘(Fowl pox,FP)是禽常见的重要病毒病。由于IBV有着较大的抗原性差异以及国内广泛的应用针对IBV不同血清型的疫苗,所以分离当地流行毒株并
牛病毒性腹泻病毒(Bovine viral diarrhea virus,BVDV)主要感染牛、羊、猪、骆驼等多种动物,造成腹泻、黏膜糜烂、免疫抑制、繁殖障碍等症状,还会污染血清、冻精、胚胎等牛源生物制品,给养殖业及其他相关产业造成严重的经济损失。BVDV p7是由疏水氨基酸构成的一个小分子肽,在脂质双分子层膜上形成通道蛋白且具有离子通道的活性,属于病毒孔蛋白(Viroporin)家族。大量研究表