基于语义的单文档自动摘要研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zhoujhipanel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和搜索引擎技术的发展普及,人们对于如何在庞大的互联网上高效地获得有价值的信息日益关注。文档自动摘要技术作为人们挑战信息爆炸式增长与信息有效利用之间矛盾的重要武器,受到世界的广泛认可。目前国际上许多学校和企业都在进行文档自动摘要技术的研究,并取得一定成绩,也产生了各种各样的自动摘要应用系统。但在我国,文档自动摘要技术发展历史比较短。我国文本摘要技术的发展研究还处于初级阶段。国内主要研究基于统计的方法,例如向量空间模型的摘要系统Vector Space Model。而基于语义的研究较少,一是由于语义对于语言学的研究要求较高,还有各种语料库的建立,语义词典的开发相对国外比较落后,因此本文对于语义方面做单文档摘要进行研究。单文档自动摘要的目标是在原始的文本中通过摘取,提炼主要信息,提供一篇简洁全面的摘要。已有的方法大都是通过统计和机器学习的技术从文本中直接提取出句子。本文主要研究基于语义的单文档自动摘要。首先研究了基于语义的词语相似度计算和句子相似度计算。在此基础上,提出了改进型K-Medoids摘要系统和对称非负矩阵分解的摘要系统。通过两个系统与以往的系统进行试验比对,我们的方法提高了单文档摘要的质量。
其他文献
信息化建设初期,网络安全问题受到一定程度的重视,防火墙、防病毒网关、VPN、IDSIPS、身份认证、安全审计等设备被部署到企业网络中。然而,随着各项安全工作的深入开展,一个
多媒体技术和计算机网络的发展使人们更容易制作、存储和传输视频信息,如何有效地组织和管理视频信息,并能方便快捷地获取自己需要的信息,成了亟待解决的问题。基于内容的视
随着信息技术的进步,当今世界的现代海洋环境监测技术逐步向着高集成度、高时效、多平台、智能化和网络化方向发展,实时监测系统也应运而生。地球海洋学实时观测阵ARGOS是目
随着社会的发展,使用户对居住环境的安全度、舒适度和智能化程度的需求越来越高,使电网侧对于系统稳定性和电力质量要求不断提升,使社会对环境问题越来越关注,而智能家居的发
随着现代工业技术的快速发展,煤炭开采更加注重安全、高效。采煤机作为煤炭开采的关键设备,其安全、可靠、稳定的运行对煤炭开采作业有非常重要的意义。目前国内外主流采煤机
面对网络上日益增多的论文,如何快速有效地检索出符合使用者需要的论文成为论文检索所要面临的一个难题。目前常用的方法是基于关键词匹配的方法,该方法查询速度快,但是没有
互联网的普及和数字技术的广泛应用为人们的工作与生活带来方便的同时,也加剧了数字作品的版权侵犯,信息篡改等恶意行为。数字水印作为信息隐藏领域的重要技术,在版权保护及
随着人们生活水平的不断提高,糖尿病患者的数量也随之增长,给人类健康造成了极大的危害,而糖尿病患者临床治疗的主要目的是稳定血糖,假如能够提前预测出患者的未来血糖浓度,
随着Web数据量的不断增长,分布式数据的集成和共享变得越来越困难。本文提出了一种基于本体环境迁移(OCI)的分布式数据集成方法。同传统的集成方法相比,该方法能减少实现复杂
随着计算机技术的迅猛发展,计算机网络已经成为人们日常生活中的重要组成部分。而伴随而来的计算机安全问题也日益突出,传统的防火墙、身份验证等技术应经不能满足现阶段的技