信息对象重构系统的设计与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:jeff2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息对象泛指以信息化形式存在的,可感知或可想象到的任何事物,如人物、事件、建筑、工程、房屋等。描述信息对象的原始文本信息广泛存在于各种信息载体之中。随着互联网的高速发展,信息内容更是越发繁杂且信息量也已趋近海量。目前信息的表现形式呈现出孤立化、碎片化的特征,关于同一个信息对象的文本描述散落在多个网页、多篇文章或其他多种信息载体之中,这导致信息对象的发生、发展、结局等演进过程得不到直观、系统地展示,与之关联的其他信息对象的信息及它们之间的相互联系也无法被获取,所以信息组织形式的重新构建在当今时代有着重要的意义。因此,为了实现信息重构,本文主要进行了如下工作:(1)设计了信息重构模型,在这种数据模型下对原始文本进行信息抽取,将原始文本结构化并保留信息对象随时间的演进过程及外部关联。(2)提出了信息重构方法并设计了数据存储模型,搭建底层存储环境,构建信息对象的实体信息库与实体关联库。(3)实现了实体库内信息的检索机制,包括获取信息对象的演进过程与外部关联等多种检索功能。(4)设计并实现了一个可扩展、可复用的可视化信息重构平台,实现原始信息样本的重构功能、库内实体演进与关联的检索编辑功能与可视化服务等。本研究的创新点:(1)设计了一种信息对象的重构模型,模型中包含信息对象随时间演进的特征,同时也包含了不同但相关的信息对象之间的相互关联及相互作用。(2)提出了一种结合自然语言处理工具与人工编辑的信息重构方式,减少了人工重构的工作量,提高了重构效率。(3)建立了一套基于分布式存储的信息重构系统,利用大数据框架为抽取出实体信息提供有效而稳定的存储、高效而准确的检索及可视化展示。
其他文献
目的本实验在课题组前期研究工作的基础上,基于缺血性中风气血相关及肾精脑髓相关理论,建立局灶性脑缺血再灌注大鼠模型,应用新安王氏内科医家两种经验治法(益气活血通络法、
目的:通过构建出的急性酒精肝损伤模型,探究出乳源六肽PGPIPN在降低急性酒精性肝损伤方面的药理学作用。方法:1,构建小鼠急性酒精肝损伤的动物模型,健康的雄性昆明种小鼠60只,体重18-22g。动物预饲养一周,然后分成6组(对照,模型,PGPIPN I,PGPIPN II,PGPIPN III和GSH),每组10只小鼠。为了制作小鼠的急性酒精肝的动物模型,实验最后3天,PGPIPN低、中、高剂量组
“打”是现代汉语中最常用的多义词之一。关于“打”和其搭配“打+X”的研究源远流长。以往研究者们主要从语义学、句法学等角度研究其形式、语义,虽然成果颇多,但主要存在两
研究背景和目的结直肠癌是最常见的消化道肿瘤之一,具有较高的发病率和死亡率,严重威胁着人类的生命健康。多数癌患者在治疗前已经出现微转移,转移是造成结直肠癌病人死亡的
[目的]通过生物信息学筛选低氧处理前后胰腺癌细胞中具有表达差异并与预后相关的基因COL7A1、HIST1H2BD、MET和SDC1,实验验证这些基因在低氧处理和对照组人胰腺癌细胞中的表
近年来,信号处理领域的阵列信号处理技术发展迅速,其中波达角(direction of arrival,DOA)方向估计就是阵列信号处理技术的一个重要研究方向,而波达角估计中的超分辨算法因为其优越的性能,受到了学者的广泛关注。在超分辨算法中,以经典的多重信号分类(Multiple Signal Classification,MUSIC)算法为代表的空间谱搜索类算法,在实际工程应用中存在稳健性差、计算
基于素质教育以及新课程改革背景环境下,小学美术教学工作开展,要立足于学生的主体地位,促进学生更加全面地发展和进步。小学美术教育有助于提升学生的审美能力,使学生以"美"
目的(1)采用尿蛋白,血清学及病理学指标来评价利拉鲁肽对肥胖模型小鼠足细胞的疗效;(2)探讨利拉鲁肽对肥胖模型小鼠的肾小球足细胞的保护作用机制。方法(1)选取清洁级雄性小
背景和目的内质网应激(ER stress,ER stress)是内质网内环境平衡紊乱时的应激反应,是机体细胞对内质网内蛋白蓄积的一种适应性应答方式。UPR是研究较深入的信号通路。它是指
迁移学习是运用已有的知识(源域)对不同但相关领域(目标域)问题进行求解的一种新的机器学习方法,它只需要标记数据很少甚至没有的目标任务样本。最近的研究表明,利用深度神经网络的迁移学习方法可以学习到更多可迁移的特征表示,这些特征表示可以很好地被用于领域适应的新任务。然而,随着领域差异的增大,任务特定层(task-specific layers)中的特征可迁移性急剧下降。因此,主要的瓶颈在于如何有效匹配