一个面向主题的学术文献数据分析工具

来源 :第29届中国数据库学术会议 | 被引量 : 0次 | 上传用户:laoxu111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  学术文献数量的迅速增长给科研工作者的文献调研工作带来了巨大的负担,因此设计并实现了一个面向主题的学术文献分析工具,为科研工作者从海量学术文献中快速准确地发现学科研究特性、分析学科发展趋势提供支持。本工具使用Latent Dirichlet Allocation(LDA)主题模型对用户的学术文献集合进行主题挖掘,并将主题内容及主题对比进行图形化的展示;此外,本工具基于主题模型构建学术文献的语义索引,并以此为基础提供了面向主题的学术文献检索引擎。通过使用该工具,科研工作者可以直观地了解学术文献中蕴含的语义主题,同时快捷地定位感兴趣的文献,进而提高了海量文献调研工作的效率。
其他文献
云计算技术的快速发展为海量数据的存储和管理提供了可能。然而,由于存储模型的根本改变,传统关系数据库管理系统中成熟的索引技术既不能直接应用于海量数据的处理,也无法被简单地迁移到云计算环境中。通过分析对比辅助索引在云环境中的两种截然不同的基本逻辑结构,即集中式方案与分布式方案,在吸收两者的优势并规避其弱点的基础上,提出了具有良好可扩展性的分片位图索引机制,从而对云环境中海量数据的检索任务提供高效的支持
随着基于闪存的固态硬盘在个人计算机和企业服务器上的广泛应用,固态硬盘受到学术界和工业界越来越多的关注。除了具有闪存存储器的优良特性之外,固态硬盘内部还具有丰富的并行特性。传统数据库系统的物理操作表扫描和上层聚集操作是针对磁盘的机械特性和对称读写特性而设计的,并不能发挥固态硬盘内部并行特性的优势。文中首先将固态硬盘作为一个黑盒进行探测以了解其内部的并行特性。在此基础上,对传统数据库表扫描操作进行相应
聚类热度时间序列是揭示和建模网络热点话题形成与发展的重要过程.Leskovec等人在2010年提出面向话题时间序列的K_SC聚类算法,其精确度较高且能较好地刻画话题内在发展趋势特征.但K_SC算法具有对初始类矩阵中心高度敏感、高时间复杂度等特性,使其难以在实际高维大数据集上应用.文中结合小波变换技术,提出一个新的迭代式聚类算法WKSC,主要提出两个创新:(1)用Haar小波变换将原始时间序列进行压
随着移动互联网、地理定位技术和智能终端设备的迅速普及,产生了大量的位置信息和其对应的标签(tag)描述信息。路线搜索是人们出行时经常进行的活动,但面临多个任务需求时,寻找最佳路线是一项极为耗时的工作。此外空间对象本身的访问权限和用户指定的限制一定程度上制约了对象的访问次序。针对上述情况,文中提出了一种路网环境下访问序列受限的多标签路线(MTROC)查询,该查询的目标是找出一条从源点到目标点、经由与
针对Multi-Radio Multi-Channel传感器网络中链路服务质量和信道冲突等问题,提出并证明了基于缓存和信道切换的数据查询问题是一个NP完全问题。根据数据流守恒和链路-信道等约束条件,建立线性规划方程,得到该问题的最优解模型,并提出了一个多项式时间的近似算法——贪心新覆盖数据算法。该算法采用动态规划策略最小化缓存节点将单位数据包传输到查询节点所需要的路径时延,再贪心选择其具有最小路径
文中首先基于可能世界模型提出了不确定图的最可靠最大流问题和可靠性计算模型,这对于构建可靠性网络、可靠传输路径选择以及系统薄弱环节分析等一系列实际问题具有重要意义;然后基于简单路径组合思想提出了一种求解最可靠最大流的算法SPCA,通过简单路径流量的组合,在无需求得所有最大流分布的情况下获得最可靠最大流,并在组合过程中引入概率剪枝与约束剪枝策略,对无效组合进行过滤,从而显著地提高了算法效率;接着文中针
数字化地理数据的生产需耗费大量的财力和物力,却很容易被非法拷贝,因此地理数据的版权保护和盗版追踪显得至关重要。珞印地理数据水印工具利用地理数字水印技术,提供多种水印算法,在不破环数据本身使用价值的前提下,向地理数据中嵌入水印信息,保证被嵌入水印信息的地理数据在遭到多种水印攻击后,仍能从中正确检测出水印信息,从而维护了地理数据生产者和拥有者的合法权益,此外,用户可基于该工具提供的统一接口扩展新的水印
针对现在数据流查询与管理系统存在的不足,本文基于Aurora开发了支持CQL的数据流管理系统Conger,系统演示包括CQL示例查询的注册、解析和执行等。
基于XML数据的关键字查询处理是研究界关注的热点问题之一.最近几年,提出了各种算法来加速查询处理的执行过程.为了在同一平台直观比较各种算法的优劣和执行策略,本文提出一种自顶向下获取查询结果的求解策略,并在此基础上开发和实现了一个基于XML数据的关键字查询算法比较系统XKComp.XKComp集成了现有的各种查询处理算法,可以比较和以图形化方式展示不同方法在运行时间、根结点求解过程、以及子树构建过程
当前学术领域和应用领域逐渐进入“大数据”时代,数据种类和数据量不断增大的现实给研究和应用带来了新的挑战。面对这一趋势,设计实现一个原型系统,通过对多来源、多维度、大规模空天数据间的内在关联关系进行分析处理,形成对事物事件的多维视角和综合表达,提升了对多源空天信息的分析认知能力;介绍了原型系统体系结构、多源空天信息关联模型、关联构建方法、基于特征和内容的关联及检索等关键技术;展示了原型系统的功能和用