一种面向科技文献元数据增量数据规范的多模式匹配算法

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:yutou1888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】针对期刊文献元数据日增的小规模数据,设计一种基于Hash的多模式匹配算法,对其机构信息利用大规模的模式集进行规范化。【方法】使用Hash定位模式串,减少对系统内存的占用;抽取模式串的首个单词/字结合Word跳步匹配,减少匹配次数,加大跳转幅度,从而提升多模式匹配的效率。【结果】以CSCD机构库182万条数据作为模式集的实验中,该算法与Aho-Corasick(AC)算法对比,能够较为快速地构建模式集对应的字典;在字符集规模约为1万条时,有更优越的时间性能,尤其是英文语料下有9.39%时间性能的提升
其他文献
以欧盟特殊教育与全纳教育发展署输入—过程—结果模型为基础,结合生态学理论从宏观、中观和微观三个层次出发,可以建构一套全纳教育支持保障指标体系,该指标体系由29个一级
新发展阶段建立健全中小学应急治理体系,提高中小学校风险防范能力,既是推进国家治理体系和治理能力现代化的迫切要求,也是融入未来世界“生存教育”的重要内容.随着“治理”
眼动技术为聋人的认知机制研究提供了支持。通过对29篇聋人眼动研究文献的分析发现,文献数量呈上升趋势,但总体较少;研究人员以师范院校教师为主,缺乏跨学科多领域合作;实验对象以大学与中学学段聋生为主,实验材料以文字和静态图片为主,实验指标以测量和描述为主,缺乏对内在心理机制的探讨;研究内容集中在聋人阅读,且不够深入。未来的研究应扩大研究对象的范围;推动多领域跨学科合作;加强研究方法多样性;均衡聋人眼动研究内容。
法国是高等教育强国,高等教育主体是公立机构,其高校管理体制与我国相近,法国大学内部权力配置对于改善我国大学内部治理、提高治理效能具有重要的启示.法国大学校院两级在人
新经济、新农业、新农村、新生态要求我国高等农林教育必须自觉进行自我解构与重构,与科学研究和创新主体加强合作交流,协同推进高等农林教育的提质增效.建设新农科,育农林新
在概述听障人员普通话水平测试研究、回顾我国手语发展历程及介绍听障人员普通话水平测试替代要素调整背景前提下,比较“国家通用手语”与“中国手语”之异同,结合10份普通话水平测试样卷词汇部分进行差异分析,初步厘清了基于国家“通用手语”的听障人员普通话水平替代性测试使用词目的手语表达方式,找出了一些调整规律,提出了较为合理的应测建议,以便听障人员掌握并在普通话水平替代性测试中规范使用,为更广泛地开展听障人员普通话水平替代性测试提供理论依据和科学指导。
改革开放以来,我国义务教育管理体制之学术研究大致经历了三个阶段,核心议题分别是:探索地方负责、分级管理的新体制、在反思教育公平中呼吁加强政府的公共服务性建设、推进
南京特殊教育师范学院语言学院围绕培养高质量融合教育的语言类教师的人才培养目标,从融合教育教师的核心素养出发,以特殊儿童语言学习教科研项目为引领,探讨克服特殊儿童的语言困难的有效的教学方法;通过在专业课程中嵌入特殊儿童语言教学和心理教育课程模块,让师范生掌握从事融合教育语言教学的专业知识和技能,具备成为融合教育教师的核心素养;依托大学生创新创业项目,开展特殊儿童语言教学实践和科研创新活动,全力打造“语言教学+融合教育”的“研学教”一体化融合教育师资培养新模式。
【目的】为解决现有工作推荐存在的难以大规模应用、冷启动、缺乏新颖性和解释性等问题,提出基于人才知识图谱推理的强化学习可解释推荐方法。【方法】基于真实的简历数据集构建人才社会经历知识图谱,依据强化学习的理论在知识图谱上训练一个策略智能体,将一次推理过程分解为选择方向、选择节点两个子过程,使其能够在知识图谱上寻找潜在的优质推荐目标。【结果】相比于LR、BPR、JRL-int、JRL-rep及PGPR模型,基于人才知识图谱推理的强化学习可解释推荐模型在MRR@20(81.7%)、Hit@1(74.8%)、Hit
劳动素养既是核心素养的重要指标,也是促进人全面发展的关键要素,而科学有效的测评工具是提升大学生劳动素养的推进器.综合运用文献研究法、德尔菲法、问卷调查法、访谈法确