混合稀疏正则化的多视角无监督特征选择

来源 :天津大学 | 被引量 : 0次 | 上传用户:richard_kai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是机器学习和数据挖掘中的高效且有效的数据预处理技术,通过去除数据中的不相关和冗余特征提高学习性能,同时揣摩维度和计算复杂度。特征选择提高了对学习模型的可理解性,互联网和物联网已经导致全球每天大量数据的大量积累,积累的原始数据维度很高,需要巨大的存储空间,高维度数据使得现有的某些机器学习算法无效,最优特征选择在大数据时代变得更加重要。数据可以来源于不同的背景和模态,并从多个视角进行描述。研究发现,在处理多视角数据的特征维数时,由于其固有的多视角和高维特性,在无监督学习任务中非常具有挑战性。实践证明多视角中的关系表示在处理多视角无监督特征选择时是特别困难的。本文针对这一问题展开研究提出了一种新的多视角无监督特征选择方法,该方法在多视角和独立特征中加入了稀疏性,考虑到各个视角的重要性,而不必在互补信息利用中引入事先没定的权重。本文采用了七个公开的数据集进行实验,每个数据集至少包含三个不同的视角作为基准进行比较。在参数设置方面,邻域k在所有数据集和所有对比算法上均设置为5。λ1和λ2的参数调整采用网格搜索策略,它保证了所涉及矩阵的稀疏性。特征维度的设置与之前实验相同,展示的实验结果为在不同维度上的结果平均值。在基准数据集上的实验表明,本文提出的混合稀疏正则化的多视角无监督特征选择算法(MSMFS)优于其他最先进的无监督特征选择算法。
其他文献
利率作为资金的价格,是现代经济和金融的核心,利率市场化改革是金融改革的重要组成部分。从1993年党的十四届三中全会提出利率市场化改革的基本设想至今,我国的利率市场化进
面对日益复杂的网络攻击,传统基于精准字符串的模式匹配不能胜任复杂多变的网络环境,正则表达式以其灵活,高效,表达能力强的特点迅速成为高速网络环境中匹配引擎用于描述规则
工商行政管理在我国是有历史渊源的,是社会经济发展的历史结果。伴随社会主义市场经济体制的逐步成熟,其职能由最初相对模糊的经济管理发展成为而今对市场的检查管理和行政执
随着互联网的普及以及大数据、物联网等技术的发展和成熟,人们对通信容量以及带宽的需求不断增长。现有通信调制、复用技术主要基于线动量来实现,随着频谱资源的进一步消耗,
伴随着我国社会主义市场经济的不断发展,“三农”问题逐步受到了党和国家的高度重视。金融,作为经济发展的核心动力,在社会主义新农村大发展的历程中,在解决“三农”问题中,
2-元代数的Rota-Baxter算子在数学、物理等众多领域有重要的应用.近几年来,n-元代数权为λ的Rota-Baxter算子被很多学者研究.受其启发,本文探讨了单的典型Nambu 3-李代数Ap=∑m∈Zzexp(mx)(?)∑m∈Z Fyexp(mx)的Rota-Baxter算子.主要讨论了权为1和权为0的kk-阶(k ∈ Z)齐性Rota-B axter算子R,其中R(Lm)=f(m+kk
光催化剂在有机和印染废水治理中受到高度重视,开发高效光响应特性光催化剂,成为国际研究热点问题。由于无毒、化学性质稳定、独特光学性能,氧化铋(Bi_2O_3)在电子陶瓷、光电器件、高温超导和催化剂等方面显示广阔应用前景。本文以五水硝酸铋和氢氧化钠为原料和沉淀剂,共沉淀法制备三种不同晶相Bi_2O_3材料,通过铋位掺杂、异质结复合进行光催化性能改性以及第一性原理计算能带结构和态密度。X射线衍射和扫描电
目的:近期研究发现间充质干细胞(MSCs)对治疗帕金森病的相关研究取得了一些成果,但是其作用机制未能完全明确。我们通过α-突触核蛋白处理人小胶质细胞系(HMC-3)与神经元细胞
随着社会的发展,工业生产的需要,人们对能源的需求越来越多。众所周知,传统的化石燃料不仅会对环境造成难以弥补的污染,而且是不可再生的。因此,新能源应运而生,目前主要的新
中国农作物生产中过施偏施化肥现象严重。甘蔗作为单位面积生物产量最高的大田作物,生育期长,需肥量大。中国主产蔗区多为丘陵红壤,受灾害性气候影响频繁,甘蔗耕层浅薄、易流