数学建模暑期集训20:层次聚类法matlab+python

Posted Z|Star

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数学建模暑期集训20:层次聚类法matlab+python相关的知识,希望对你有一定的参考价值。

本专栏第二篇文章介绍过层次聚类法
数学建模学习笔记(二)层次聚类法
matlab代码如下:

clc;
clear;
Y=[0.080 0.143 2.000 0.250 0.500 0.286 0.143 2.000 2.000 inf];
Z=linkage(Y,'average')
dendrogram(Z)

然而,当数据量大于30个时,该方法仅能显示前30个的数据,后面的数据无法绘制出图像。
为了应对数据量大时的情况,可以用python进行层次聚类。

python代码:

import pandas as pd
import seaborn as sns  # 用于绘制热图的工具包
from scipy.cluster import hierarchy  # 用于进行层次聚类,话层次聚类图的工具包
from scipy import cluster
import matplotlib.pyplot as plt
from sklearn import decomposition as skldec  # 用于主成分分析降维的包
from scipy.cluster.hierarchy import dendrogram, linkage, fcluster
from matplotlib import pyplot as plt
df = pd.read_excel("tempdata.xlsx", index_col=0, header=None)  #index_col=0指定数据中第一列是类别名称,PS:计算机程序一般从整数0开始计数,所以0就代表第一列
# df = df.T    #python默认每行是一个样本,如果数据每列是一个样本的话,转置一下即可
X = df.index
# print (X)
# method是指计算类间距离的方法,比较常用的有3种:
# single:最近邻,把类与类间距离最近的作为类间距
# average:平均距离,类与类间所有pairs距离的平均
# complete:最远邻,把类与类间距离最远的作为类间距
Z = linkage(X, 'average')
f = fcluster(Z, 4, 'distance')
fig = plt.figure()
dn = dendrogram(Z)
plt.show()

以上是关于数学建模暑期集训20:层次聚类法matlab+python的主要内容,如果未能解决你的问题,请参考以下文章

数学建模暑期集训15:matlab求解多目标规划模型

数学建模暑期集训5:matlab求解常微分方程/偏微分方程

数学建模暑期集训10:拟合/matlab工具箱Curve Fitting Tool的使用

数学建模暑期集训8:熵权法

数学建模暑期集训9:灰色关联分析

数学建模暑期集训6:用SPSS对数据进行多元线性回归分析