基于深度学习的视觉特征学习关键技术研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:tp20201892
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的飞速发展,以及嵌入式摄像头等各类数码设备的流行,网络和生活生产中无处不在的视觉数据呈现出井喷式增长,使得图像数据的精准检索、分类和检测等计算机视觉研究越来越活跃。与此同时,也让基于此运用的各种新兴视觉产业看到了曙光。深度学习凭借其在计算机视觉领域所展现的优秀数据建模能力,得到了研究者的广泛关注。深度学习在数据建模中的优势体现在视觉特征学习上,通过快速地获取高判别性特征学习能够满足不同的应用需求。因此,如何快速而准确地获取计算机视觉任务中的判别性特征是深度学习研究的重点、难点和热点。在计算机视觉任务中,对于基于深度学习的视觉特征学习,其关键问题在于如何保证特征表达的判别性、大规模图像视觉任务中模型算法的高效性和在噪声等场景下模型算法的泛化性,这些问题相互交叠,为优秀的视觉特征学习带来挑战。而优秀特征的快速提取又受到了样本挖掘、网络模型和损失函数的多重影响。基于上述问题,本文将利用深度学习模型,从样本挖掘、网络函数和损失函数优化这三个切入点出发,解决视觉特征学习存在的关键问题。现将该博士论文的主要创新点总结如下:1.针对目前流行的损失函数之一的深度度量学习框架,本文提出了基于结构分布熵排序的深度度量学习方法。该算法聚焦于损失函数优化过程中,由于忽略特征空间分布信息,而造成的特征表达判别性弱的问题。对于正样本,该算法为样本学习一个超平面,而不是让其空间距离无限接近,以保留其内部的相似性结构;对于负样本,通过提出分布熵排序学习的概念,引入了基于视觉特征空间的分布熵权重来保持负样本类间特征结构分布的一致性。该算法提高了深度视觉特征表达的判别性,与此同时,算法的有效性在地标类图像检索的计算机视觉任务中得到了有效验证。2.针对目前流行的样本挖掘和模型优化的深度度量学习框架,本文提出了基于优化一致性保持的深度度量学习算法,主要解决样本挖掘中,基于启发式观察的超参数调整造成的时间消耗问题,以及模型优化过程中因网络优化的方向与损失函数降低方向不一致而造成的算法效率低的问题。该算法包含了能够自动设置边界阈值的基于最近邻决策边界的前k个“错位”样本挖掘算法(Top-k Misplaced Samples,Top-k MS)。除此之外,还有基于特征空间和检索结果的全局优化算法(Feature Space and Retrieval Results,FSRR),保证了视觉特征学习的高效性,并在大规模遥感图像检索的计算机视觉任务中得的了有效验证。3.针对深度网络模型的改进,本文提出了两种算法,分别是基于残差关注分频卷积的集成模型算法和基于域自适应和增强特征的集成模型算法。其中基于残差关注分频卷积的集成模型算法聚焦于前景和背景不平衡的图像中,大量的低频信息造成的存储量增加和计算冗余问题,以及图像类别数目不平衡下的关注偏差问题。通过对不同频率空间信息重新整合,并关注高频信息,以降低网络的存储和计算量。与此同时,通过设计平衡损失函数来减少类别和类别数目不平衡的影响,实现了深度视觉特征学习的判别性和高效性;基于域自适应和增强特征的集成模型算法旨在噪声背景以及因季节和天气导致亮度变化的场景中,提高深度特征学习模型的泛化性。该算法通过构建具有噪声的数据集和设计基于亮度值差异的图像增强方法,减少噪声和亮度变化对特征学习的影响,提高算法的泛化性;通过将特征增强模块引入特征金字塔和分层增强网络中,提高小目标深度特征的判别性。两种算法的有效性在路面裂缝检测的计算机视觉任务中得到有效验证。
其他文献
TiNbTaZrO系列合金因其优异的力学性能、物理性能和生物兼容性而具有广阔的工业应用前景。尽管如此,TiNbTaZrO系列合金的无位错变形机制饱受争议,而且其冲击性能及冲击载荷作用下的变形机制仍缺乏研究。材料的冲击性能可以通过霍普金森杆压缩实验(split Hopkinson bar compression test,SHPB)和夏比摆锤冲击实验(Charpy impact test)表征:在霍
腔量子电动力学(QED)系统中光子/声子关联的研究及其对场的量子特性的刻画在量子精密测量、量子信息等现代量子科学中有非常重要的应用。20世纪60年代,Glauber提出光学相干性的量子理论,通过光子关联函数描述光场的特性,成功地解释了Hanbury Brown和Twiss实验中观察到的探测热光光子发射所出现的聚束现象。这一理论的提出,不仅刻画了光的本性,也奠定了量子光学的理论基础。Glauber的
全球新闻格局之巨变,带来新闻人才培养要求的转变。范敬宜作为我国优秀的新闻工作者和新闻教育家,其新闻思想凝结了他半个多世纪以来从事新闻实践和教育的经验和思考,具备极强的现实意义和理论价值,为新时代新闻人才培养指明了方向,是发展中国特色新闻学的重要理论资源。本研究以范敬宜新闻思想为主要研究对象,以史论结合、述而有评为方法原则,对范敬宜新闻思想展开了分析、归纳、提炼和评述。在政治上,范敬宜新闻思想以马克
随着化工行业对清洁水需求的不断增长以及近零排放概念的深入提出,废水的处置及资源化愈发重要。尤其在印染工业中,高排放量的印染废水已经严重危害人类健康和生态环境,成为化工行业最具挑战性的废水之一。然而由于废水成分的复杂性,实现印染废水的近零排放在技术及工艺方面存在巨大挑战。针对此,本课题提出“纳滤-正渗透-膜蒸馏(NF-FO-MD)”的全膜耦合工艺,通过新膜材料的构建与膜过程的合理组合,有效地实现了废
聚醚醚酮(PEEK)是一种半结晶性的热塑性高分子材料,由于其优异的力学性能、良好的耐热性、耐腐蚀性以及质轻等优点,逐渐取代金属材料被广泛应用于航空航天、武器装备和民用高技术等领域中。然而,PEEK的结晶性和化学惰性导致了PEEK及其复合材料的低表面能,使其作为结构性部件在进一步涂装修饰中存在涂料附着力较低的问题。环氧涂料常用来做航空材料表面的底漆,它在金属基材上具有优异的附着力,但在PEEK基材上
研究背景乳腺癌已成为全球第一大癌症,且其死亡人数也位于女性癌症死亡人数的首位。因此,虽然乳腺癌的综合治疗手段已得到了很大程度的发展和完善,但乳腺癌的复发、转移和耐药依然是全球女性健康的巨大杀手。雌激素受体阳性乳腺癌约占乳腺癌总数的70%,其治疗的主要阻碍是内分泌治疗的耐药,这一问题一直存在,亟待解决。MCM6(微染色体维持蛋白6,minichromosome maintenance 6)是MCM家
水系锂离子电池成本低、安全性高、离子电导率高,在1.8 V电压窗口能提供可观的容量,因此有望成为可再生能源的大型储备电源。二维(2D)层状正极材料由于其电荷离域的宏观性,更有利于Li+的脱嵌,是锂离子电池理想的正极材料。然而,包括LiCoO2在内的层状正极材料,在中性水系电解液中表现出很差的循环稳定性,严重阻碍了水系锂离子电池的实际应用。本论文以LiCoO2为研究对象,首先研究了其在不同p H值水
随着煤炭开采深度逐年增加,复杂的地质条件(高温、高地应力、高瓦斯、高水压)使得诱发冲击地压的因素复杂多变。所以在不同地质条件及采矿工程下,对冲击地压发生机理及监测和防治的研究已成为保障深部矿井安全高效开采的重要科学问题。因此本文以近年来在我国陕西彬长矿区、内蒙古鄂尔多斯矿区、山东巨野煤田等多个矿井开始出现顶板疏水后富水区边界冲击地压显现更为严重为工程背景,通过现场调研,理论分析及实验室和现场试验的
洪水灾害是与人类生产生活关系最为密切的自然灾害之一,具有危害范围广、成灾损失大、形成时间短、不可预测性强和周期性明显等特点。如长江流域2020年第5号洪水期间,长江上游流域在较短时间内汇集大量洪水,三峡水库入库洪峰流量达75000m~3/s,为三峡建库以来最大,给长江流域梯级水库系统带来巨大挑战。得益于对洪水过程的准确研判和梯级水库群的合理调度,三峡水库以最大出库流量49400m~3/s,削峰率3
辽宁煤炭存在着“供需错位”、“产需错位”的问题。“产需错位”造成的产能过剩,是由技术创新不足而导致的中低端过剩和高端不足的矛盾引起,是相对于有效需求不足的过剩。这种生产要素效率与质量的“双低”错配,在煤炭经济中以供需、产需不均衡的波动形式体现。辽宁在自产严重不足而供给相对过剩的的情况下,要从供给端发力破解增长困境,就必须遵循煤炭供需波动中的规律,了解煤炭生产供给、消费需求与经济波动间的冲击与响应关