数学建模暑期集训20:层次聚类法matlab+python
Posted Z|Star
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数学建模暑期集训20:层次聚类法matlab+python相关的知识,希望对你有一定的参考价值。
本专栏第二篇文章介绍过层次聚类法
数学建模学习笔记(二)层次聚类法
matlab代码如下:
clc;
clear;
Y=[0.080 0.143 2.000 0.250 0.500 0.286 0.143 2.000 2.000 inf];
Z=linkage(Y,'average')
dendrogram(Z)
然而,当数据量大于30个时,该方法仅能显示前30个的数据,后面的数据无法绘制出图像。
为了应对数据量大时的情况,可以用python进行层次聚类。
python代码:
import pandas as pd
import seaborn as sns # 用于绘制热图的工具包
from scipy.cluster import hierarchy # 用于进行层次聚类,话层次聚类图的工具包
from scipy import cluster
import matplotlib.pyplot as plt
from sklearn import decomposition as skldec # 用于主成分分析降维的包
from scipy.cluster.hierarchy import dendrogram, linkage, fcluster
from matplotlib import pyplot as plt
df = pd.read_excel("tempdata.xlsx", index_col=0, header=None) #index_col=0指定数据中第一列是类别名称,PS:计算机程序一般从整数0开始计数,所以0就代表第一列
# df = df.T #python默认每行是一个样本,如果数据每列是一个样本的话,转置一下即可
X = df.index
# print (X)
# method是指计算类间距离的方法,比较常用的有3种:
# single:最近邻,把类与类间距离最近的作为类间距
# average:平均距离,类与类间所有pairs距离的平均
# complete:最远邻,把类与类间距离最远的作为类间距
Z = linkage(X, 'average')
f = fcluster(Z, 4, 'distance')
fig = plt.figure()
dn = dendrogram(Z)
plt.show()
以上是关于数学建模暑期集训20:层次聚类法matlab+python的主要内容,如果未能解决你的问题,请参考以下文章