基于Transformer的多编码器端到端语音识别

来源 :电子科技 | 被引量 : 0次 | 上传用户:sqlservermaintenance
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前广泛使用的Transformer模型具有强大的全局依赖关系捕捉能力,但其在浅层时容易忽略局部特征信息。针对这一问题,文中提出了一种使用多个编码器来改善语音特征信息提取能力的方法。通过设计附加一个额外的卷积编码器分支来强化对局部特征信息的捕捉,弥补浅层Transformer对局部特征信息的忽视,以有效的方式实现音频特征序列的全局和局部依赖关系的融合,提出基于Transformer的多编码器模型。在开源的中文普通话数据集Aishell-1上的实验表明:在没有外部语言模型的情况下,文中提出的基于Transformer的多编码器模型相比于Transformer模型字符错误率相对降低了4.00%。在内部非公开的上海话方言数据集上,性能的提升更加明显,在测试集上的字符错误率从19.92%降低到10.31%,相对降低了48.24%。
其他文献
<正>本论文为使用纳米流体(石墨烯)/超声波雾化微量润滑于微铣削加工SKH-9高速工具钢。主要利用石墨烯特殊的性质如绝佳的导热特性,降低加工时产生的切削温度,并减少刀具的磨损并提升微铣削加工产品质量,并使用自行开发设计之超声波雾化系统有效改善纳米流体中纳米粒子团聚现象,增加纳米粒子润滑效益。试验采田口稳健设计,以L18(21×37)直交表寻找优化参数组合,控制因子设定纳米粒子石墨烯平均厚度、纳米粒
期刊
为提高激光粉末沉积(LPD)制备AlSi10Mg合金的致密度,利用田口方法进行了激光粉末沉积AlSi10Mg合金实验设计,研究了激光能量密度对AlSi10Mg合金致密度的影响,获得了LPD制备高致密度AlSi10Mg合金的能量密度阈值范围。采用扫描电子显微镜(SEM)分析了氧化对激光粉末沉积AlSi10Mg合金致密化的影响,并揭示了LPD制备AlSi10Mg合金的致密化机制。结果表明:激光能量密度
佛洞地遗址位于云南省临沧市耿马傣族佤族自治县勐简乡勐简村大军赛村民小组燕子洞,坐落于一处东南开口的二叠纪灰岩穿洞,南临南汀河。2016~2017年,临沧市文物管理所在公路考古调勘期间发现该遗址;为进一步认识滇西地区旧石器时代晚期文化,2017~2018年对该遗址开展考古发掘工作。发掘区域位于洞内第四台面到第五台面间,共发掘20 m~2,出土了包括石制品、动植物化石等在内的大量遗物。初步地层年代学分
在几何教学中涉及了符号观念、空间观念等核心素养。文章就是基于核心素养的初中数学几何作图教学策略研究,围绕核心素养,制定科学有效的教学目标,创新教学方法、改革教学评价。教师要注重在每一节数学课程中提升学生的核心素养。
弹性流体动力润滑(简称弹流润滑或EHL)是齿轮、轴承等零部件的主要润滑机制。目前弹流润滑的膜厚预测公式大多是针对接触副表面速度同向的工况。而在工程实际中,如准双曲面齿轮等零部件的接触副表面的速度不在同一个方向,前述膜厚预测公式并不适用。探究更普遍意义上的接触副表面速度非共线的润滑油膜的性质,对揭示此类零件的润滑机理,改善弧形锥齿轮等零部件的综合性能具有重要的意义。另一方面弹流润滑中各类油膜凹陷现象
<正>【裁判要旨】合同履约产生纠纷以致解除的情况下,双方合同纠纷发生原因、违约方的认定、何方享有合同解除权、合同解除权是否合法行使是实务审查的要点。在查明事实的基础上,应正确适用法律,对合同是否已解除、解除的法律依据作出实务认定。
期刊