子词相关论文
随着互联网和移动通讯技术的高速发展,语音数据大规模增长。语音关键词检索技术的诞生,使人们能够在大量语音数据中高效地检索出想......
维吾尔语是黏着语,词汇量较多,容易出现未登录词问题并且属于低资源语言,导致维吾尔语的端到端语音识别模型性能较低.针对上述问题......
近年来,互联网上有着大量的公开信息,有些信息有着巨大的应用价值。其中,特定科技领域(特别是国防科技领域)的专利、技术报告和新......
推行新疆地区的双语教学是国家推进民族交流的重要举措,对维语进行自动发音质量评估能够大大提高双语教学的效率.然而维吾尔语作为......
提出了一种基于子词链的中文新闻广播故事自动分割方法。利用中文同音异形字众多、词典开放、分词多样和组词灵活等特点,在新闻广......
【正】文游台 “国土无双秦少游,堂堂坡老醉黄州,高台几废文章在,果是江河万古流”。这是清代有名的诗人王士贞咏文游台的一首抒......
目前性能最优的译文质量估计系统使用神经机器翻译中的编码器-解码器模型作为特征提取器.该方法由于限制词表大小易导致数据稀疏问......
为了对句子有更全面的表示,增强翻译模型的能力,汉字利用子词特征,蒙古文端使用混合编码器。同时,为了缓解歧义问题,将篇章上下文......
针对语音关键词检索中的集外词问题,提出基于最大互信息-最小描述长度(MMI-MDL)的子词集构建算法。根据子词对的互信息挑选聚合对,通......
根据汉语语音的特点,提出了一种连续汉语语音中声韵母自动切分的新算法.根据音素单元结构确定HMM模型中的状态数,利用HMM模型进行......
提出了基于子词的双层CRFs(conditional random fields)中文分词方法,旨在解决中文分词中切分歧义与未登录词的问题.该方法是建立......
神经机器翻译为机器翻译提供了一种全新的方法,在多种语言对上的翻译效果已经超越了统计机器翻译,并逐渐成为当前机器翻译的主流方......
由于历史典籍术语存在普遍的多义性且缺少古汉语分词算法,使用基于双语平行语料的对齐方法来自动获取典籍术语翻译对困难重重。针......
随着自然语言处理技术的发展,人们越来越重视构建面向国防科技领域的知识图谱。而面向国防科技领域的技术和术语识别是构建该领域......