K调和均值聚类分析原理及应用

来源 :山西医科大学 | 被引量 : 9次 | 上传用户:zhaoxiaoyan0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代社会中,随着计算机技术的不断发展,收集数据变得越来越方便。数据储存技术也在不断的提高,并且容量也愈来愈大。这样,数据的搜集与储存有了很大的发展,可是如何有效的对这些明显含有重要信息的数据进行处理,将其中有用的信息提取出来成为了现代课题研究的一大热点。在研究过程中,人们将统计、计算机技术和数据库技术结合在一起,发明一种称为数据挖据的技术。数据挖据技术涉及到许多领域的集合,如:人工智能、统计学、信息检索、数据库管理等。聚类分析是数据挖掘中重要的技术之一,被用来对未知的分类数据进行分析。其重要性愈来愈被人们肯定。现在社会在金融、医学、基因学这些学科内产生了大量维度很大的数据。许多在低维时有很好效能的聚类方法,在碰到维度非常高的数据时,往往得到的结果不是太好。在高维数据的聚类研究中,有一类聚类算法由于其具有快速性和简单性的特点已经被广泛的应用在许多领域,包括K均值聚类算法(K-means,KM)、模糊聚类算法(FCM)和K调和均值聚类算法(KHM)。其中,K调和均值聚类算法对初始值不敏感。本课题首先对聚类分析的算法、原理、准则函数以及聚类分析现在所面临的问题进行了介绍。针对聚类算法对初始值敏感的问题,本文对K-均值算法,FCM算法,KHM算法进行分析。从数理角度得出KHM算法对初始值不敏感。然后进行实例分析。以在遗传学调控开关研究中的一个经典例子酵母半乳糖通路(GAL)数据集为研究对象,分别取每一类别中每一属性的最大值,1/3大值,真实聚类中心,1/3小值,最小值为聚类中心,总共五组聚类中心用R软件进行K-means聚类分析。计算出其聚类结果,结果显示:最大值、最小值为聚类中心的组无法进行聚类,表明其对初始值敏感。本文采用Fortron语言实现K调和均值(KHM)的聚类分析,在聚类的结果显示,这种方法对初始值的选择是不敏感。对三种聚类方法在不同数据集中的聚类效果进行评价,采用癌症基因的十个数据集,分别进行K-means、FCM、KHM聚类分析,结果显示:在十个癌症基因的数据集中,其中第一号、五号、六号、七号、九号和十号,KHM算法获得了最小的错误率和最大的F度量,获得最好的综合评价,而仅有二号和三号,K-均值算法获得最好的综合评价,四号和八号位FCM算法获得最好的综合评价。对鸢尾花的数据进行分析,发现KHM是三种方法中,错误最少的方法。综上所述,KHM算法在这三种方法的对比中获得了较好的准确度,在不同类型的数据集中有较好的稳健性。
其他文献
陶瓷绘画艺术是一种艺术的创作方法。陶瓷艺术创作方法实际上就是美学观念与文化修养的组合;灵感的心态、诗画的意境、唯美的构图、优雅的造型、心灵的发泄。这些组合让欣赏
周国桢当今中国陶艺界一位史诗般的人物,是世界陶瓷史上最杰出的陶艺大师之一。国内外的知名人士对周国桢教授及其陶艺作品赞不绝口。王朝闻先生在看了他的瓷雕《猫头鹰》后,激
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
一种提高430铁素体不锈钢铸锭等轴晶率的熔炼方法专利号:ZL201310299510.9专利权人:宝山钢铁股份有限公司设计人:徐迎铁陈兆平本发明提供一种新的提高430不锈钢铸锭等轴晶率
绘童真童趣,展祥和之美!  刘清云 江西省工艺美术大师,政协委员。  作品从1986年至今,在轻工部、中国陶瓷协会、中国工艺美术协会举办的大奖赛中获金奖等40余项,作品《捉迷藏》被中国美术馆收藏,《闹花灯》被中国工艺美术馆收藏。
大学出版社充分利用信息技术,构建依托自身特色和优势的学术、教育和专业出版的知识服务模式,是体现大学出版的宗旨,实现传统出版和新媒体出版融合发展,解决我国中小型大学出
桥面铺装层作为桥梁行车体系的重要组成部分,其质量的好坏对于行车对桥面板的荷载冲击和满足行车的安全性与舒适性以及对桥梁结构的保护具有至关重要的影响。桥面铺装层应具有
电话:15079899737
期刊
开放型经济是一种对外开放新形势下产生的发展模式,这一模式的开展有利于加快生产要素在国际与区域间的自由流动速度,并有利于实现资源的优化配置。结合国内外理论研究,从开