基于深度学习的中文分词方法研究

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:haiwei2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为中文自然语言处理中的基础任务中文分词,其分词的好坏直接影响之后的自然语言处理任务。当前中文分词大部分都是采用基于机器学习的方法,但是其需要人工构建大量特征。针对上述问题,论文提出一种基于深度学习的新分词模型,该模型基于BLSTM(双向长短期神经网络),CNN(卷积神经网络)和CRF(条件随机场),充分利用了BLSTM可以利用长距离信息和CNN提取局部信息的优点。并设计了实验,在三个数据集上验证论文提出的模型在中文分词上的正确性和优越性。
其他文献
如今随着新媒体的不断发展,电视新闻节目想要取得发展面临十分严峻的挑战。新媒体与短视频的发展让电视节目的受众市场越来越小,这就要求电视新闻节目不仅要拥有高质量的内容
贵金属铂(Pt)是工业领域中十分重要的一种催化剂,广泛应用于燃料电池阴极和阳极催化剂以及有机小分子催化反应。但是Pt来源稀少,价格昂贵并且在催化反应过程易CO中毒,这些缺
应用软件设计模式是构造高质量软件系统的重要途径。软件设计模式的选择与待开发软件系统的质量需求有着密切的关系。论文首先分析了软件质量需求的类型;针对SOA系统常涉及的
高校图书馆人文社科实验室的构建是一个新兴事物,从人文社科实验室建设所需遵循的原则出发,介绍了实验室构建的模式以及实验室的重要作用,从而揭示出人文社科实验室对高校建
中波广播覆盖距离远,是我国广播节目主要的覆盖方式之一。然而在广播发射机的运行中,往往会因为故障的发生而导致广播节目无法正常播出。因此,笔者将结合自身工作经验,对数字
发射机是电视广播传播的重要工具,在信号接收方面所起的作用至关重要。在电视发射机不断发展的过程中,数字电视发射机无线覆盖技术逐渐兴起,其具有画质清晰、信号传输稳定的
2008年欧美经济危机以来,我国外需放缓,投资面临过剩困境,中国经济步入“新常态”,结束了自1978年以来20年多年的10%的高速增长。中国经济增速会否持续下跌成为社会各界关注
Web2.0知识服务项目、信息共享空间、移动图书馆是图书馆在泛在知识环境下进行服务创新的大胆尝试,虽然其在图书馆的应用已引起了业界的广泛关注,但目前国内图书馆的知识服务
根据生态文明建设的信息需求和信息行为特点,提出了围绕生态精神文明建设的信息传播服务、面向生态经济文明建设的信息推送服务、嵌入生态科技文明建设的信息跟踪服务及针对
摘要:本文通过采用文献资料法、影像资料分析法和数理统计法的研究方法,对2018年世界羽毛球全英赛男单半决赛技战术进行分析研究,旨在总结石宇奇与孙完虎在比赛中的优势和不足,为中国教练员有针对性的训练提供数据和业余羽毛球爱好者提供理论指导。  关键詞:羽毛球比赛;男子单打;技战术分析  一、引言  2018年世界羽毛球全英赛中,石宇奇脱颖而出,拿到自己首个全英赛冠军,研究石宇奇突出的技战术为中国教练员