基于循环进化网络的时序数据预测与关联挖掘模型

来源 :上海大学 | 被引量 : 0次 | 上传用户:YAOGUOCHUN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以往对时间序列数据的研究中,主要集中在对数据的预测分析、聚类分析和关联分析。在现有的研究方法中主要存在以下几个缺点:第一,现有的时间序列预测模型大多使用单网络模型对数据进行分析,忽略了不同数据具有不同特征,从而导致单网络模型不能适应所有数据而使得预测精度不高;第二,在现有的聚类算法中,多数使用数据间数学距离,使用不同规则进行聚类,从而导致聚类不能发现数据间天然存在的隐式关系;第三,现有的关联挖掘中通常使用数学方法计算数据之间的关联构建复杂网络进行挖掘分析,忽略了数据内部的隐式关系,导致数据分析角度较为单一。针对以上问题以往使用经典数学关系为依托对数据进行关系挖掘,本文主要提出循环进化网络预测与关联挖掘算法框架。该框架以机器学习分析数据间的关联为基础构建复杂网络进行数据挖掘和知识发现。同时该框架以循环进化网络为基础,进行数据的预测和聚类,以复杂网络为依托进行数据的关联挖掘。以金融股票市场和海洋大数据为背景,以板块股票价格和海洋水文动力学要素为对象,研究主要内容如下:第一、针对单模型不能精准预测问题,本文提出循环进化网络模型。该模型是多个单模型构成,每个模型都可以针对不同特征的数据进行预测分析,从而提高预测精确度。该模型是由单模型构成的链状结构,其中每个单模型中含有数值预测单元和误差预测单元,误差预测单元用于预测数值单元预测的数据误差,然后根据数据划分规则进行数据分流,再次进行数据训练,最终通过终止机制停止数据训练。在应用方面,该模型在对海洋表面温度数据进行测试,并与其它模型进行对比,验证该模型可以提高数据预测的准确率,并优于其它模型。第二、针对现有聚类方式是基于数据距离的聚类方式问题,本文提出基于不同策略的循环进化网络聚类,分别为基于误差均值的数据聚类方式和基于专家经验的数据聚类方式。这两种聚类方式均以循环进化网络预测为基础,以数据划分方式为核心的数据聚类。最后,将该模型运用于单点的海洋表面温度数据进行划分,可以看出聚类数据具有空间连续性,并且具有季节周期性特征,因此该种聚类方式是有意义的。第三、针对现有数学方式构建复杂网络进行关联分析的问题,本文提出利用机器学习的方式建立数据关系构建复杂网络。该模型通过使用循环进化网络的聚类结果计算数据之间的重合度,然后通过数据重合度构建复杂网络,再通过分析复杂网络的节点平均加权强度、平均路径长度、复杂网络模块度和特征向量中心进行数据的关联挖掘。在利用前期工作中的数学关系构建复杂网络对金融数据进行分析可以挖掘出股票数据的板块联动特征和板块漂移现象。在利用机器学习关系构建复杂网络对海洋动力学要素多点数据进行研究过程中,可以发现数据之间的遥相关特性。本文中基于循环进化网络的时间序列预测与关联挖掘框架,是一个以数据驱动构建多网络模型为基础,以数据划分规则为核心,以复杂网络分析为依托的预测分析与挖掘分析一体化模型。
其他文献
人工智能目前的发展状态是弱人工智能较强而强人工智能较弱,出现这一问题的主要原因是人们对人类智能的本质、组成和功能认识不清。对此罗钧旻科研团队通过对各种心理学流派的研究,发现唯识心理理学对此揭示得比较透彻,他们依据唯识心理学相关理论,提出了一个智能模型——AORBCO(Agent-Object-Rilaiionship Model Based on Consciousness-Only)。首先,本文
安全问题一直是阻碍无线传感器网络实用化、规模化的瓶颈。保障监测数据的安全是首先要考虑的问题,尤其是敏感性监测数据,因此必须对用户的访问行为进行严格的管理和控制。由
热力学定律是研究能量性质及其转换规律的基本物理定律。其中,热力学第一定律保证了能量在转移和转换过程中的总量保持不变;热力学第二定律则决定了材料在做功过程中一定有耗
随着无线通信、传感、微机电等技术的快速发展,具有低功耗、高度自主性等特征的无线传感器网络,已在环境监测和保护、医疗护理、军事、智能交通等领域得到了广泛应用,这些应
人体细胞结构变化(尤其细胞核大小的变化)可为癌症诊断提供重要依据。目前组织学分析和荧光显微镜检查仍然是细胞检测的首选方法。近年来,尽管细胞荧光显微技术取得了进步,但
癌症是人类生命和健康的主要威胁之一,是世界上最致命的疾病。近年来,通过微阵列质谱数据进行癌症预测,实现癌症早期发现,提高癌症病患的生存率,成为人们关注的焦点。本文首
行人重识别算法的任务是在没有公共视域的摄像头中搜索特定的行人目标,这可以被视为一个目标检索过程,结果可表示为一个行人样本相似度的排名列表。在实际的场景中,受光照明暗变化、视角变化、行人姿态、遮挡等因素的影响,同一行人目标在不同摄像头下呈现较大的差异,从而导致同一行人的图像很难排在相似度列表前列。通常来说,难以正确匹配的行人样本被称为难例样本,难例样本也是阻碍算法性能的最大障碍。本文将从行人重识别的
在Ⅰ-Ⅲ-Ⅵ族半导体中,黄铜矿CuGaSe2是一种前景可观的光伏材料。然而,许多研究大都局限于传统的Cu和Ga化学计量比为1:1的结构,相关晶体对称性也多局限于黄铜矿结构。结构稳
出口管制是一国为维护国家安全和发展利益建立的重要制度,各国为保持军事或经济竞争优势进行出口管制。但是,近些年来,一方面敏感物项和技术的出口呈现出更为复杂的态势,另一方面国际局势复杂变化,这些都大大增加了出口管制的难度。为了更好地进行出口管制,我国于2020年12月1日出台了《出口管制法》,该法通过提高立法层级完善了两用物项出口管制制度,这标志着我国在出口管制领域迈向了一个新台阶。但是近些年我国对两
学位
维基百科是现今使用最为广泛的网络百科全书,并以保持中立观点作为其基本原则。但一些研究显示维基百科文章包含情感色彩。然而,现有研究仅针对特定主题的文章进行分析,覆盖