基于McDiarmid界的概念漂移数据流分类算法

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:dianquan999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流中的概念漂移会导致已有的分类模型性能显著下降。目前处理概念漂移的数据流分类算法大都只针对单一类型的概念漂移(如突变型、渐变型或重复型等),难以同时适应不同场景。为此,提出了一种新的适于多类型概念漂移的数据流分类算法。该算法通过双层窗口保存当前最新的分类结果,根据模糊集隶属度函数对窗口中数据分配权重并计算加权错误率,然后利用McDiarmid界分析当前窗口和过去窗口内错误率的差异δ,根据δ是否具有显著性检测概念漂移。检测到漂移后,使用半参数对数似然算法检验当前概念是否为过去概念的重现,进而决定是否复用
其他文献
针对传统的航空维修工具管理模式存在的弊端,运用射频识别(RFID)技术设计一个航空维修工具管理系统。根据当前机务维修工具管理模式和存在问题进行需求分析,对需求完成功能分解、业务流程设计和数据库构建;采用Python语言,利用PyQt模块开发管理信息系统界面,采用Flask框架构建后端服务器API;基于Android开发手持端,实现射频模块的调用采集、上传数据;选择轻量级SQLite进行数据存储。通
近年来深度学习的迅速发展为聚类研究提供了一个有力的工具,并衍生出了许多基于深度神经网络的聚类方法。在这些方法中,深度嵌入聚类(DEC)因其可对深度表示学习和聚类分配同时进行优化的优势而日益受到关注。但是,深度嵌入聚类的一个局限性在于其超参数λ的敏感性,而往往需要诉诸人工调节来解决。对此,提出一种基于集成学习的改进深度嵌入聚类(IDECEL)方法。相较于寻求单个最优超参数的常规做法,提出以多样化超参数λ构建一组具有差异性的基聚类,并结合熵理论对基聚类集合的簇不确定性进行评估与加权,进而在簇与样本之间构建一个
为了进一步提升水务企业工作效率,解决抄表数据审核工作量大、保证数据准确性等问题,在传统的XGBoost预测算法基础上提出一种基于MIC-XGBoost的混合预测模型。以某水务企业近两年的用户历史用水数据为基础,利用最大信息系数(MIC)得出不同影响因素与用户用水量之间变量的关联程度,构建不同单一影响因素下的用水量数据预测模型,采用实际用水数据调整算法参数,得到最终预测模型。实验结果表明,在预测精度
动态蛋白质网络的构建和复合物识别问题是生物信息学领域目前研究的热点。针对现有的算法在解决前述问题上的不足,提出了一种基于隐马尔科夫模型的蛋白质复合物识别算法(HMM-PC)。首先基于蛋白质的基因共表达特性构建初始蛋白质网络,然后利用蛋白质的共享功能注释、共享结构域和连接强度等信息来对网络进行加权,得到动态蛋白质网络。在此基础上,考虑前一时刻蛋白质网络拓扑结构信息对当前时刻蛋白质网络拓扑结构信息的影响,采用隐马尔科夫模型描述蛋白质复合物与网络个体间的相互关系,进而将动态蛋白质网络中的复合物识别问题建模为隐马
在分析前置仓模式特点和常用选址模型的基础上,以最小成本为目标,建立多重心法生鲜农产品前置仓选址模型。根据顾客需求量的分布,采用改进的DBSCAN聚类算法和K-means算法二次聚类确定区域内前置仓建设数量,采用以最小成本为目标的多重心法来实现生鲜农产品前置仓的选址,即对每个聚类区域,分别通过重心法求得选址坐标位置。通过Java语言、SPASS软件和MATLAB软件对某区域算例进行求解,验证算法和模
针对皮肤病变图像分割问题,提出一种自动适应目标形状的U型皮肤病变图像分割算法。对原始病变图片依次进行灰度化、归一化和限制对比度自适应直方图均衡化处理,提高前景与背景的对比度;将预处理后的图片输入到U型网络中进行训练,该网络将调制可变形卷积块融合到U-Net的编码器和解码器中,使其自动适应病变目标的比例和形状,让复杂的病变结构能被更好地检测到;通过Softmax分类器得到分割结果。在ISBI2016
场景图因其具有的表示视觉场景内容的语义和组织结构的特点,有助于视觉理解和可解释推理,成为计算机视觉研究热点之一。但由于现存的视觉场景中目标和目标之间关系标注的不平衡,导致现有的场景图生成方法受到数据集偏置影响。对场景图数据失衡问题进行研究,提出一种基于外部信息引导和残差置乱相结合的场景图生成方法(EGRES),缓解数据集偏置对场景图生成的负面影响。该方法利用外部知识库中无偏置的常识性知识规范场景图
演化算法作为解决大规模优化问题的重要方法,被广泛应用于机器学习、过程控制、工程优化、管理科学和社会科学等领域。然而在求解高维度、高计算密度问题时,程序性能很难得到保证。在高性能计算机上实现并行化是问题的一个热门解决方案。针对申威众核处理器的硬件特征,提出了采用二级并行策略的自适应邻域搜索的差分进化算法(SaNSDE)。第一级为进程并行,实现了合作协同进化模型和池模型,将大规模问题划分为多个低维子问题并分布在不同进程上;第二级为线程并行,使用从核加速了适应度的计算过程。实验结果表明,采用合作协同进化模型和池
为了提高油价的预测效果,提出一种基于EEMD分解、小波阈值去噪、fine-to-coarse法重构和LSTM神经网络的组合预测方法。EEMD对油价原始时间序列分解,利用小波阈值去噪法获取第一高频模态分量的有效信息;分解出的模态分量运用fine-to-coarse法重构,得到从高到低的重构分量;使用LSTM神经网络预测重构分量;对重构序列简单加和得到最终结果。实证结果表明,与其他基准模型比较,在水平
在工业能源结构改革中,配置混合储能系统(Hybrid Energy Storage System, HESS)能够有效促进工业园区用户侧清洁能源的消纳。提出一种基于工业需量管理HESS配置与运行的两阶段优化模型。采用经验模态分解法对用户净负荷功率分频,分别将高频、低频分量输入HESS的不同模块。以工业用户总成本为目标,充分考虑并网负荷的波动性,建立月度和日前两阶段优化模型,使用改进的混沌粒子群算法