基于卷积神经网络及降噪自编码器的MALDI-TOF质谱分类鉴定研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:lijun1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微生物与人类的生命活动息息相关,微生物鉴定对于许多行业领域都显得至关重要。比如在医疗领域,准确快速的微生物鉴定能够帮助疾病诊断以及治疗。基质辅助激光解吸/电离飞行时间(MALDI-TOF)质谱技术是微生物鉴定领域中最重要的技术变革与突破。传统MALDI-TOF质谱的分类鉴定往往分为自动特征提取和分类两个步骤,而前者又过分依赖于专家先验知识,如峰高和峰面积等。本文研究旨在通过深度学习等技术,设计出鲁棒性高、自适应的MALDI-TOF质谱的分类鉴定方法。本文基于卷积神经网络(Convolutional Neural Network)构建了用于MALDI-TOF质谱分类鉴定的模型,并通过一系列对比实验确定了网络模型的超参数,实现了对MALDI-TOF质谱端到端的分类鉴定,并且将该模型作为特征提取器与支持向量机(Support Vector Machine)、k近邻算法(k-Nearest Neighbor)、随机森林(Random Forest)及朴素贝叶斯分类器(Na(?)ve Bayes Classifier)相结合进行MALDI-TOF质谱分类鉴定。其次,在上述工作的启发下,基于降噪自编码器(Denoising Autoencoder)构建了网络模型作为特征提取器与其他机器学习分类器结合进行质谱分类鉴定。最后本文使用k折交叉验证(k-Fold Cross-Validation)对上述分类鉴定方法在包含8大类菌种共计3355个的MALDI-TOF质谱样本数据集上进行了分类性能评估。实验结果表明基于卷积神经网络的端到端分类鉴定方法效果最优,其准确率、宏平均精准率、宏平均召回率、宏平均F1分数、加权平均召回率、加权平均精准率、加权平均F1分数均超过99%。最后本文基于上述工作设计并实现了 MALDI-TOF质谱分类鉴定软件。软件采用插件架构,提高了软件功能扩展性,也方便后期维护开发。
其他文献
乳腺癌是如今全世界女性当中很常见的一种癌症,严重影响女性生命健康。虽然随着近几年来人类在医疗方面的发展,目前对于乳腺癌的诊断和治疗手段有了很大的提高,但是由于乳腺癌具有高度的异质性和复杂性,其在临床表现、组织形态以及分子特征中仍然有着许多不同之处,对于其中的一些亚型,特别是三阴性乳腺癌的治疗效果仍然非常有限。过去的研究表明,转录激活和信号转导因子3(STAT3)在包括乳腺癌在内的许多癌症中都会被持
RIG-Ⅰ是先天性免疫系统中宿主模式识别受体(Pattern recognition receptors)中的重要一员。当外源性的病毒RNA侵入细胞时,RIG-Ⅰ识别病毒RNA,并从自抑制状态转变为激活状态,暴露出N端的CARDs结构域,进一步和下游分子相互作用。TRIM25是RIG-Ⅰ的重要调节分子,TRIM25的PRYSPRY结构域与暴露的CARDs结构域结合,其N端的RING结构域能将泛素转
目的:探究腹腔镜辅助下远端胃癌根治术治疗胃癌的近期和远期临床疗效。方法:回顾性分析我院胃肠肿瘤外科在2013年1月至2014年12月期间行远端胃癌根治术的121例病患的临床病例材料,其中行腹腔镜辅助远端胃癌根治术(LADG组)52例、行开腹远端胃癌根治术(ODG组)69例,对比两组围手术期临床病理指标,采用Kaplan-Meier方法进行两组术后生存率分析,并采用Cox比例风险模型进一步分析胃癌的
乳复合脂是乳脂球膜(MFGM)的生物活性成分,其在保护婴儿免受病原体侵害、调节免疫以及促进婴儿认知发育等方面均起着重要作用。这种作用一方面可能是通过补充婴儿体内神经节苷脂的含量,促进婴儿神经系统发育;另一方面乳脂球膜作为肠道菌群的代谢底物,促进特定肠道菌群的生长。而肠道菌群的变化与粪便代谢表达谱的变化存在相关关系,这是因为菌群在肠道中的功能不同,与宿主共同对不同的代谢底物加以利用并可能通过肠脑轴影
目的:构建劳力型热射病大鼠模型,检测肠黏膜屏障的相关指标,探讨高温高湿环境下运动对大鼠肠黏膜屏障功能的影响。方法:建立动物模型:经过跑步训练,挑选能够在跑步机上正确跑步运动的SD大鼠30只,随机分成正常对照组、常温常湿运动组、高温高湿运动组,每组各10只。高温高湿运动组在温度35±2℃、湿度80%±10%的条件下进行跑步运动,跑步机速度为28 m/min,直肠温度达标确认劳力型热射病大鼠模型建立成
阴离子交换膜(AEM)作为燃料电池重要组成结构,其性能可以在很大程度上决定了燃料电池的工作性能和使用寿命。然而,电导率低和耐碱性差是阻碍其发展和应用的两大问题。提高AEM的离子电导率可通过提高IEC和构建离子传输通道。通常过高的IEC会带来膜的溶胀以及离子浓度稀释的问题,因此离子传输通道的构建成为当前的研究热点之一。针对不含醚键及强吸电子基团的主链结构,在碱性条件下不易受到OH-进攻,化学稳定性好
目的 调查COVID-19疫情防控常态化下上海市疾病预防控制系统职工心理健康现状,分析相关影响因素。方法 采用分层整群抽样的方法,对上海市4所CDC共538名职工开展心理健康状况问卷调查。结果 调查对象抑郁、焦虑、人际孤独得分分别为10(3, 20)分、7(2, 15)分、4(0, 12)分。不同学历、婚姻状况、职业、有无基础性疾病、不同单位、不同工作班制组的抑郁得分比较,均存在统计学差异(均有P
跨年龄面部识别(AIFR)在许多应用场景中都非常必要.即使对于人类而言,要识别同一个人在不同年龄段的面孔也有一定的困难.因此,它对计算机视觉系统提出了独特的挑战.有许多成熟的深度学习方法可用于人脸识别,例如多任务级联卷积网络.然而在一些特殊的应用场景中基于深度学习算法的运算效率均比较低下,不能满足实际应用的需求.概率动态规划是一种使用状态递推的方法求解概率或期望的算法思想.类似于动态规划,概率动态
为了减少锂金属的使用和电池的安全隐患,在集流体上制备Li薄膜负极甚至“无Li”负极受到越来越多的关注。然而,集流体的疏锂性和固态电解质界面相(Solid-electrolyte interphase,SEI)的不均一性与不稳定性可以促进锂枝晶生长,并引起库伦效率低下等问题,成为制约锂薄膜/无锂负极发展的障碍之二。因此,为解决以上锂金属负极的应用挑战,应同时把握电极两侧的双重界面问题,在构建集流体亲
受阻路易斯酸碱对(FLP)的路易斯酸和路易斯碱由于空间位阻效应不能形成经典的加和物,而保留了各自的反应性,使其可应用于活化H2、CO2、NO、CS2等小分子,是目前常用的小分子活化的策略之一。芳香性是环状分子在空间和电子结构上的概念,因电子离域造成较同类非环状化合物增强的热力学稳定性,在化学反应中具有保持其结构特征的倾向性。虽然芳香性无法在实验上精确测量,但芳香性赋予化合物的特殊性质(如几何结构、