聚类分析又被称为群剖析,它是研究(试品或指标值)分类问题的一种数据分析方法,同时又是大数据挖掘的一个重要优化算法。聚类分析是由多个模式所组成的,一般,模式是一个衡量的空间向量,聚类分析以相似性为载体,在一个聚类里的模式中间比不在同一聚类里的模式中间具备更多相似性。
针对聚类优化算法,大部分用SPSS手机软件完成,一般导入数据,而且挑选聚类方式就可以实现,这节使用MATLAB手机软件,根据14种不同聚类分析方式,完成试品聚类。
(1)最多距离法
X=[16.21492 2000 -8.2 6.2;
15.7 970 2209 -20.6 1.9;
16.3 1260 2085 -17.3 2.8;
17.2 14221726 -9.5 4.6;
18.8 1874 1709 -4.9 8.0;
17.9 1698 1848 -4.5 7.5;
16.3 976 1239-4.6 5.6];
D=pdist(X,'euclid');
M=squareform(D);
Z=linkage(D,'complete');
H=dendrogram(Z);
xlabel('City');
ylabel('Scale');
C=cophenet(Z,D);
T=cluster(Z,3);
(2) 最短距离法
X=[16.21492 2000 -8.2 6.2;
15.7 970 2209 -20.6 1.9;
16.3 1260 2085 -17.3 2.8;
17.2 14221726 -9.5 4.6;
18.8 1874 1709 -4.9 8.0;
17.9 1698 1848 -4.5 7.5;
16.3 976 1239-4.6 5.6];
D=pdist(X,'euclid');
M=squareform(D);
Z=linkage(D,'single')
;H=dendrogram(Z);
xlabel('City');
ylabel('Scale');
C=cophenet(Z,D);
T=cluster(Z,'cutoff',0.8);
(3)综合性聚类程序段
X=[16.21492 2000 -8.2 6.2;
15.7 970 2209 -20.6 1.9;
16.3 1260 2085 -17.3 2.8;
17.2 14221726 -9.5 4.6;
18.8 1874 1709 -4.9 8.0;
17.9 1698 1848 -4.5 7.5;
16.3 976 1239-4.6 5.6];
T=clusterdata(X,0.8);
Re=find(T=5)
(4)重心法&规范欧式距离
S=['福冈';'合肥市';'武汉市';'威海';'桂林市';'温州市';'成都市'];
X=[16.21492 2000 -8.2 6.2;
15.7 970 2209 -20.6 1.9;
16.3 1260 2085 -17.3 2.8;
17.2 14221726 -9.5 4.6;
18.8 1874 1709 -4.9 8.0;
17.9 1698 1848 -4.5 7.5;
16.3 976 1239-4.6 5.6];
D=pdist(X,'seuclid');
M=squareform(D);
Z=linkage(D,'centroid');
H=dendrogram(Z,'labels',S);
xlabel('City');
ylabel('Scale');
C=cophenet(Z,D);
T=cluster(Z,3);
(5)重心法&欧式距离平方米
S=['福冈';'合肥市';'武汉市';'威海';'桂林市';'温州市';'成都市'];
X=[16.21492 2000 -8.2 6.2;
15.7 970 2209 -20.6 1.9;
16.3 1260 2085 -17.3 2.8;
17.2 14221726 -9.5 4.6;
18.8 1874 1709 -4.9 8.0;
17.9 1698 1848 -4.5 7.5;
16.3 976 1239-4.6 5.6];
D=pdist(X,'euclid');
D2=D.^2;
M=squareform(D2);
Z=linkage(D2,'centroid');
H=dendrogram(Z,'labels',S);
xlabel('City');
ylabel('Scale');
C=cophenet(Z,D2);
T=cluster(Z,3);
(6)重心法&精密度权重计算间距
S=['福冈';'合肥市';'武汉市';'威海';'桂林市';'温州市';'成都市'];
X=[16.21492 2000 -8.2 6.2;
15.7 970 2209 -20.6 1.9;
16.3 1260 2085 -17.3 2.8;
17.2 14221726 -9.5 4.6;
18.8 1874 1709 -4.9 8.0;
17.9 1698 1848 -4.5 7.5;
16.3 976 1239-4.6 5.6];
[n,m]=size(X);
stdx=std(X);
X2=Xhttp://www.yujujie.cn/shbk/stdx(ones(n,1),:);
D=pdist(X2,'euclid');
M=squareform(D);
Z=linkage(D,'centroid');
H=dendrogram(Z,'labels',S);
xlabel('City');
ylabel('Scale');
C=cophenet(Z,D);
T=cluster(Z,3);
(7)最短距离法&根据主成分标准的欧氏距离
S=['福冈';'合肥市';'武汉市';'威海';'桂林市';'温州市';'成都市'];
X=[16.21492 2000 -8.2 6.2;
15.7 970 2209 -20.6 1.9;
16.3 1260 2085 -17.3 2.8;
17.2 14221726 -9.5 4.6;
18.8 1874 1709 -4.9 8.0;
17.9 1698 1848 -4.5 7.5;
16.3 976 1239-4.6 5.6];
[E,score,eigen,T]=princomp(X);
D=pdist(score,'seuclid');
M=squareform(D);
{n}
{n}{t}Z=linkage(D,'single');
{n}
{n}{t}H=dendrogram(Z,'labels',S);
{n}
{n}{t}xlabel('City');
{n}
{n}{t}ylabel('Scale');
{n}
{n}{t}C=cophenet(Z,D);
{n}
{n}{t}T=cluster(Z,3);
{n}
{n}{t}{p}
{n}
{n}{t}{p}
{n}
{n}{t}(8)平均法&标准欧式距离
{n}
{n}{t}S=['福冈';'合肥';'武汉';'长沙';'桂林';'温州';'成都'];
{n}
{n}{t}X=[16.21492 2000 -8.2 6.2;
{n}
{n}{t}15.7 970 2209 -20.6
原创文章,作者:leping,如若转载,请注明出处:https://www.whrjcyxgs.com/biao-3763.html