haihongyuan.com
海量文库 文档专家
全站搜索:
您现在的位置:首页 > 小学教育 > 学科竞赛学科竞赛

提高班第三次作业

发布时间:2014-01-08 15:55:06  

【作业1】 数学建模提高班第三次作业

全国重点水泥企业经济效益综合评价例。

利用主成分综合评价全国重点水泥企业的经济效益。原始数据(数据来自1984年中国统计年鉴)见表5-10。

1.利用一般的Matlab命令将数据标准化;

2. 利用Matlab命令计算出相关矩阵的方差及特征值;

3.写出主成分的线性表达式;

4.利用统计工具箱中命令得到如上结果;

5.利用SPSS进行主成分分析;

6.对得到的结果作出解释。

解:

1.利用一般的Matlab命令将数据标准化

根据题意利用MATLAB编程如下:

load dsc.txt;

[n,p]=size(dsc);

MEAN=mean( dsc) ; %求各变量的均值

STD=std( dsc); %求各变量的标准差

MEAN=ones(n,p)*diag(MEAN);

STD=ones(n,p)*diag(STD);

x=(dsc-MEAN)./STD %原始数据标准化

求解得标准化后的数据为:

x =

-0.3767 -0.3579 -0.1136 -0.3667 -0.0388 -1.1777 -1.3633 -0.2771 0.0882 -0.2939 0.0508 -0.2873 0.3562 -1.1777 -0.4073 2.2531 -0.6046 -0.6229 0.0568 -0.5810 -0.4277 0.2944 1.6425 -0.7741 -1.8223 -1.7643 -1.6884 -1.7200 -1.1725 -0.1472 1.0792 -0.5482

1.5891 1.9944 1.2163 2.1414 1.2879 0.8833 -1.8658 0.6039

2.1248 0.9100 2.2981 1.1681 0.7553 -1.9138 -0.4190 1.6432 0.9641 0.5177 0.6216 0.5421 0.8587 0 0.2635 1.2591 -0.6277 -0.9322 -0.8054 -0.7824 -2.8714 1.9138 0.2565 -0.2771 0.1066 -0.1974 0.1210 -0.1911 0.3219 1.1777 1.0442 -0.0964 0.3083 0.3104 0.9802 0.4389 -0.0857 -0.1472 0.0975 -0.3223 -0.3660 -0.2021 -0.4453 -0.2843 0.1121 -0.7361 -1.0711 -0.7967 -0.5076 -0.2567 -0.9264 -0.4629 0.4385 -0.2944 -0.4471 -0.6160 -0.3998 -0.1222 -0.0164 -0.1454 -0.2095 0.8833 0.6795 -1.2711 0.4792 1.8441 -0.2316 1.4787 0.8449 0 -0.5452 -0.6838

-0.9556 -0.8270 -1.1177 -0.9481 -0.1698 0.4416 1.0559 -0.0964

2. 利用Matlab命令计算出相关矩阵的方差及特征值

根据题意利用MATLAB编程如下:

R=cov(x) %注释: 由于数据已经过标准化处理,故x的协方差矩阵等于其相关系数矩阵,即R=corrcoef(x).

[V,D]=eig(R); %注释: 函数eig的功能是对矩阵R进行正交对角化变换,矩阵D是以R的特征值为对角元的对角矩阵(对角元按从小到大的顺序排列),矩阵V是正交变换矩阵。 DD=[ ]; %将特征值对角矩阵D改写为列向量DD

for i=p:-1:1 %此处要注意eig函数的输出D中特征值的排列顺序

DD=[DD;D(i,i)];

end

OFFER=DD/sum(DD); %计算特征值的方差贡献率

cumOFFER=cumsum(DD)/sum(DD); %计算特征值的方差累计贡献率

OUTCOME=[DD,OFFER,cumOFFER] %综合输出计算结果

pri=1;

for i=1:p

if cumOFFER(i)<=0.85

pri=i+1; %取前几个特征值?累计方差贡献超过85%

end

end

PCACOV=V(:,end:-1:end-pri+1) %输出对应特征值的正交单位化的特征向量, 此处要注意eig函数的输出D中特征值的排列顺序和特征向量的排列顺序

PCASCORE=x*PCACOV; %主成份得分

Z=PCASCORE*OFFER([1:pri])/cumOFFER(pri);%综合评分

[ZZ,I]=sort(Z,'descend'); %样本排序 [Y,I] = SORT(X,DIM,MODE) also returns an index matrix I.

scatter(ZZ,I);

variance=var( dsc)

variance=var( x)

variance=var(D)

variance=var(V)

求解得:

R =

1.0000 0.8492 0.9230 0.9017 0.6513 -0.2650 -0.5018 0.5983 0.8492 1.0000 0.6904 0.9882 0.7229 -0.1034 -0.5951 0.2649 0.9230 0.6904 1.0000 0.7740 0.5445 -0.3168 -0.3444 0.5306 0.9017 0.9882 0.7740 1.0000 0.6883 -0.1057 -0.5920 0.3295 0.6513 0.7229 0.5445 0.6883 1.0000 -0.4436 -0.4329 0.3589 -0.2650 -0.1034 -0.3168 -0.1057 -0.4436 1.0000 0.3755 -0.4342 -0.5018 -0.5951 -0.3444 -0.5920 -0.4329 0.3755 1.0000 -0.2538 0.5983 0.2649 0.5306 0.3295 0.3589 -0.4342 -0.2538 1.0000

OUTCOME =

4.8528 0.6066 0.6066

1.2440 0.1555 0.7621

0.8702 0.1088 0.8709

0.5518 0.0690 0.9398

0.3570 0.0446 0.9845

0.1020 0.0127 0.9972

0.0207 0.0026 0.9998

0.0015 0.0002 1.0000

PCACOV =

0.4337 -0.0621 -0.2580

0.4088 -0.3413 0.1175

0.3895 0.0116 -0.3797

0.4211 -0.3176 0.0191

0.3586 0.0657 0.2220

-0.1835 -0.7250 -0.3187

-0.2944 -0.0355 -0.6354

0.2586 0.4975 -0.4696

variance =

1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

由以上结果可知:

原始数据矩阵的方差为

variance =

42.1972 159.8330 44.7903 101.5914 276.7234 46.1429 18.3044 0.1959 标准化后数据矩阵的方差为

variance =

1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 程序运行所得特征值矩阵的方差为:

variance =

0.0000 0.0001 0.0013 0.0159 0.0381 0.0947 0.1934 2.9437

程序运行所得特征向量矩阵的方差为:

variance =

0.3330 0.3301 0.2741 0.3355 0.2910 0.2440 0.3203 0.2119 标准化以后数据的协方差矩阵为

R =

1.0000 0.8492 0.9230 0.9017 0.6513 -0.2650 -0.5018 0.5983 0.8492 1.0000 0.6904 0.9882 0.7229 -0.1034 -0.5951 0.2649 0.9230 0.6904 1.0000 0.7740 0.5445 -0.3168 -0.3444 0.5306 0.9017 0.9882 0.7740 1.0000 0.6883 -0.1057 -0.5920 0.3295 0.6513 0.7229 0.5445 0.6883 1.0000 -0.4436 -0.4329 0.3589 -0.2650 -0.1034 -0.3168 -0.1057 -0.4436 1.0000 0.3755 -0.4342

-0.5018 -0.5951 -0.3444 -0.5920 -0.4329 0.3755 1.0000 -0.2538 0.5983 0.2649 0.5306 0.3295 0.3589 -0.4342 -0.2538 1.0000

特征值分别为:

4.8528

1.2440

0.8702

0.5518

0.3570

0.1020

0.0207

0.0015

3.写出主成分的线性表达式

由OUTCOME =

4.8528 0.6066 0.6066

1.2440 0.1555 0.7621

0.8702 0.1088 0.8709

0.5518 0.0690 0.9398

0.3570 0.0446 0.9845

0.1020 0.0127 0.9972

0.0207 0.0026 0.9998

0.0015 0.0002 1.0000

可知:当选取前三个作为主成分时,累计贡献率达到87.09%>85%,故应选取前三个作为主成分,此时对应的特征变量分别为:

PCACOV =

0.4337 -0.0621 -0.2580

0.4088 -0.3413 0.1175

0.3895 0.0116 -0.3797

0.4211 -0.3176 0.0191

0.3586 0.0657 0.2220

-0.1835 -0.7250 -0.3187

-0.2944 -0.0355 -0.6354

0.2586 0.4975 -0.4696

主成分的线性表达式为:

F1?0.4337x1?0.4088x2?0.3895x3?0.4211x4?0.3586x5?0.1835x6?0.2944x7?0.2586x8

F2??0.0621x1?0.3413x2?0.0116x3?0.3167x4?0.0657x5?0.725x6?0.0355x7?0.4975x8

F3??0.258x1?0.1175x2?0.3797x3?0.0191x4?0.222x5?0.3187x6?0.6354x7?0.4696x8

4.利用统计工具箱中命令得到如上结果;

根据题意利用MATLAB编程如下:

(1)利用原始数据进行主成分分析:

【参数说明】

x ——原始数据矩阵(样本点×变量)

PC ——主成分系数向量(列)

SCORE ——样本点的主成分得分

latent ——x的协方差矩阵的特征值

tsquare ——每一个样本点的HotellingT2统计量的值

PC=princomp(x)

[PC,SCORE,latent,tsquare]=princomp(x)

求解得:

PC =

0.4337 0.0621 -0.2580 0.0813 0.1283 0.0391 0.8450 0.0534 0.4088 0.3413 0.1175 -0.0650 -0.0930 -0.5009 -0.1143 -0.6525 0.3895 -0.0116 -0.3797 -0.0360 0.5678 0.4317 -0.4071 -0.1679 0.4211 0.3176 0.0191 0.0164 0.0104 -0.3338 -0.2676 0.7335 0.3586 -0.0657 0.2220 -0.6520 -0.4568 0.4278 -0.0012 0.0321 -0.1835 0.7250 -0.3187 0.2273 -0.3802 0.3741 -0.0351 -0.0426 -0.2944 0.0355 -0.6354 -0.6233 0.0265 -0.3424 0.0240 0.0366 0.2586 -0.4975 -0.4696 0.3498 -0.5463 -0.0978 -0.1837 -0.0324

PC =

0.4337 0.0621 -0.2580 0.0813 0.1283 0.0391 0.8450 0.0534 0.4088 0.3413 0.1175 -0.0650 -0.0930 -0.5009 -0.1143 -0.6525 0.3895 -0.0116 -0.3797 -0.0360 0.5678 0.4317 -0.4071 -0.1679 0.4211 0.3176 0.0191 0.0164 0.0104 -0.3338 -0.2676 0.7335 0.3586 -0.0657 0.2220 -0.6520 -0.4568 0.4278 -0.0012 0.0321 -0.1835 0.7250 -0.3187 0.2273 -0.3802 0.3741 -0.0351 -0.0426 -0.2944 0.0355 -0.6354 -0.6233 0.0265 -0.3424 0.0240 0.0366 0.2586 -0.4975 -0.4696 0.3498 -0.5463 -0.0978 -0.1837 -0.0324

SCORE =

0.0235 -1.0225 1.4543 0.5011 0.4974 0.2747 -0.0734 -0.0285 0.8633 -2.1992 -0.4269 0.5619 -0.8921 -0.1006 -0.2183 -0.0492 -1.6305 0.2496 -0.8188 -0.9690 0.5565 -0.0527 -0.1356 -0.0026 -3.7463 -0.9607 0.2294 -0.1343 -0.1265 -0.2148 -0.0574 0.1017

3.8851 1.6345 0.3099 0.7261 -0.5725 0.3345 -0.1416 0.0659

3.8507 -1.4825 -1.0193 -0.0415 0.9788 -0.1805 0.1979 0.0277

1.6561 -0.2719 -0.9816 -0.2524 -0.6390 0.0198 0.1314 0.0033 -2.8244 1.1268 -0.9369 2.0760 0.2830 -0.2173 0.1066 -0.0192 -0.5007 0.7948 -1.0224 -0.6127 -0.4157 0.4492 0.1155 -0.0245 0.7114 0.3158 -0.2896 -0.1743 0.8456 0.0396 -0.2247 -0.0112 -0.2500 -0.3595 1.5485 0.1433 0.3515 0.2069 0.1176 0.0001 -0.6972 -0.2071 1.2082 -0.2885 -0.3358 0.1541 0.2137 -0.0134 -1.0570 1.1980 -0.0706 -0.5572 0.4216 0.2195 -0.0593 -0.0237

1.7808 1.3968 1.0643 -0.4985 -0.2531 -0.8837 0.0042

-2.0647 -0.2130 -0.2485 -0.4800 -0.6998 -0.0487 0.0235

latent =

4.8528

1.2440

0.8702

0.5518

0.3570

0.1020

0.0207

0.0015

tsquare =

5.9552

11.0559

4.8569

11.2313

12.1755

11.4199

3.8362

12.9637

5.9442

4.8739

4.3432

4.8346

3.4653

12.2177

2.8265

由以上结果可知:利用统计工具箱中的命令得到的协方差矩阵特征值为: -0.0248 -0.0016

latent =

4.8528 1.2440 0.8702 0.5518 0.3570 0.1020 0.0207 0.0015

(2)利用原始标准化后的数据进行主成分分析: 【参数说明】

R ——原始数据相关系数矩阵(样本点×变量) PC ——主成分系数向量(列) latent ——相关矩阵R的特征值

explained ——每一个主成分的方差贡献率 PC=pcacov(R);

[PC, latent,explained]=pcacov(R) 求解得:

PC =

-0.4337 0.0621 -0.2580 0.0813 -0.1283 0.0391 -0.4088 0.3413 0.1175 -0.0650 0.0930 -0.5009 -0.3895 -0.0116 -0.3797 -0.0360 -0.5678 0.4317 -0.4211 0.3176 0.0191 0.0164 -0.0104 -0.3338 -0.3586 -0.0657 0.2220 -0.6520 0.4568 0.4278 0.1835 0.7250 -0.3187 0.2273 0.3802 0.3741 0.2944 0.0355 -0.6354 -0.6233 -0.0265 -0.3424 -0.2586 -0.4975 -0.4696 0.3498 0.5463 -0.0978

latent =

4.8528 1.2440 0.8702 0.5518 0.3570 0.1020 0.0207 0.0015

-0.8450 0.1143 0.4071 0.2676 0.0012 0.0351 -0.0240 0.1837 -0.0534 0.6525 0.1679 -0.7335 -0.0321 0.0426 -0.0366 0.0324

explained =

60.6596

15.5495

10.8777

6.8975

4.4630

1.2749

0.2589

0.0189

由以上结果可知:利用统计工具箱中的命令得到的相关矩阵R的特征值为:

latent =

4.8528

1.2440

0.8702

0.5518

0.3570

0.1020

0.0207

0.0015

主成分相关系数为:

PC =

-0.4337 0.0621 -0.2580 0.0813 -0.1283 0.0391 -0.8450 -0.0534 -0.4088 0.3413 0.1175 -0.0650 0.0930 -0.5009 0.1143 0.6525 -0.3895 -0.0116 -0.3797 -0.0360 -0.5678 0.4317 0.4071 0.1679 -0.4211 0.3176 0.0191 0.0164 -0.0104 -0.3338 0.2676 -0.7335 -0.3586 -0.0657 0.2220 -0.6520 0.4568 0.4278 0.0012 -0.0321 0.1835 0.7250 -0.3187 0.2273 0.3802 0.3741 0.0351 0.0426 0.2944 0.0355 -0.6354 -0.6233 -0.0265 -0.3424 -0.0240 -0.0366 -0.2586 -0.4975 -0.4696 0.3498 0.5463 -0.0978 0.1837 0.0324

根据第三问,取前三个主成分,可得主成分的线性表达式为:

F1?0.4337x1?0.4088x2?0.3895x3?0.4211x4?0.3586x5?0.1835x6?0.2944x7?0.2586x8F2??0.0621x1?0.3413x2?0.0116x3?0.3167x4?0.0657x5?0.725x6?0.0355x7?0.4975x8F3??0.258x1?0.1175x2?0.3797x3?0.0191x4?0.222x5?0.3187x6?0.6354x7?0.4696x8

5.利用SPSS进行主成分分析;

标准化后的原始数据进行主成分分析如下:

利用SPSS得出的主成分系数为标准主成分系数,将其化为主成分系数如下:

将Component Score Coefficient Matrix中的1-3列数字分别在SPSS中建立新的散列b1,b2,b3 输入b1*SQRT(4.853),b2*SQRT(1.244),b3*SQRT(0.87)

得到原始数据主成分系数为:

0 0.0669 0.2612

0.4186 0.3458 -0.1213

0.3965 -0.0112 0.3824

0.4186 0.3235 -0.0187

0.3525 -0.0669 -0.2239

-0.1762 0.7250 0.3171

-0.2864 0.0335 0.6343

0.2644 -0.5019 0.4664

故主成分的线性表达式为:

F1?0x1?0.4186x2?0.3965x3?0.4186x4?0.3525x5?0.1762x6?0.2864x7?0.2644x8 F2?0.0669x1?0.3458x2?0.0112x3?0.3235x4?0.0669x5?0.7250x6?0.0335x7?0.5019x8F3?0.2612x1?0.1213x2?0.3824x3?0.0187x4?0.2239x5?0.3171x6?0.6343x7?0.4664x8将各个主成分得分乘以相应的sqrt(λ)即特征根的二次方根可以将其还原为未经标准化的主成分

得分. 这里同样使用compute命令还原为主成分得分

pscore1=FAC1_1*SQRT(λ1),

所得pscore1,pscore2,pscore3数据分别为:

0.02 -1.03 -1.45

0.87 -2.20 0.43

-1.62 0.25 0.82

-3.74 -0.96 -0.23

3.89 1.63 -0.31

3.85 -1.48 1.02

1.66 -.27 0.98

-2.83 1.14 0.93

-0.50 0.80 1.02

0.71 0.31 0.29

-0.25 -0.36 -1.55

-0.70 -0.20 -1.21

-1.06 1.19 0.07

1.78 1.39 -1.06

-2.07 -0.22 0.25

综合评价:

重新进入Compute对话框,在Target Variable 栏中输入Z,在Numeric expression栏中输入表达式如下:

(0.60659*pscore1+0.15550*pscore2+0.10878*pscore3)/0.87087

点击OK得Z的值为:

-0.35

0.26

-0.99

-2.81

2.96

2.55

1.23

-1.65

-0.08

0.59

-0.43

-0.67

-0.52

1.36

-1.45

6.对得到的结果作出解释

(1)由MATLAB求解结果得主成分系数分别为:

PCACOV = 15

10 5

的贡献。抓住了这20(2)由-3-2-10123

(2)由SPSS进行综合评价如下:

由图可知分布在第一象限内的是琉璃河、邯郸、湘乡这三个企业,说明这三个企业的经济效益在全国来说是比较好的;分布在第四象限的哈尔滨、柳州、峨嵋,因为第四象限的主要特征是第一主成分,第一主成分占信息总量的比重最大,所以这三个企业的经济效益也算比较好。分布在第二象限和第三象限的地区可属同一类,经济效益较差。

【作业2】

文件pcaexe.xls是世界上55个国家和地区某年7个田径项目上的女子记录。要求

1.分别用matlab和spss做主成分分析,并解释第一主成分和第二主成分的意义。

2. 基于第一主成分对个国家和地区排序。

3.基于主成分综合评价排序。

解:1.用matlab做主成分分析,并解释第一主成分和第二主成分的意义。

用MATLAB做主成分分析编程如下:

(1)原始数据标准化:

load dec.txt

[n,p]=size(dec);

MEAN=mean(dec) ; %求各变量的均值

STD=std(dec); %求各变量的标准差

MEAN=ones(n,p)*diag(MEAN);

STD=ones(n,p)*diag(STD);

x=(dec-MEAN)./STD; %原始数据标准化

程序运行结果为:

x =

-0.0189 -0.6315 0.4085 0.6804 0.3145 0.4165 0.1685 -0.9256 -1.1625 -0.8684 -0.8904 -0.5880 -0.4436 -0.6920 -0.4169 -0.4965 -1.0401 -0.7980 -0.3172 -0.1286 -0.4617 -0.4612 -0.5415 -0.5249 -0.7056 -0.5579 -0.7828 -0.5117 -0.3506 -0.5325 -0.0395 0.7728 0.7657 0.4408 -0.1125 -0.6823 -0.4245 -0.2262 0.2184 0.4950 0.3923 -0.1530

1.1531 0.7456 0.5952 0.9576 0.3747 0.0773 0.5799 -1.3678 -1.2525 -1.2492 -0.7056 -0.7985 -0.7707 -0.7881 0.8435 0.7906 0.5579 -0.2436 -0.2871 -0.0923 -0.0664 0.7330 0.6916 0.5840 0.0336 0.0137 -0.1650 -0.1619 -0.0410 0.3225 -0.0544 0.3108 0.0738 0.0167 -0.2626

2.8338 3.1127 2.6114 2.0664 1.5479 2.0036 1.9686 0.7551 0.8626 1.8087 1.2348 1.0665 1.1919 -0.0526 -1.1688 -1.5045 -2.0221 -1.7220 -0.5579 -0.6375 -0.4788 -0.4391 -0.1095 0.0725 -0.4284 -0.4376 -0.8919 -0.7124 0.3791 0.3675 0.9872 1.5120 1.2470 0.5377 1.0031 -1.0804 -1.1265 -1.2193 -0.4284 -0.6782 -0.6375 -0.6308 -1.0361 -0.9465 -0.6257 -0.7056 -0.5579 -0.5648 -0.5966 -1.7880 -1.7386 -1.9586 -1.3524 -1.0994 -0.8434 -0.5173 -1.3457 -1.1265 -1.3650 -1.1676 -0.8888 -1.0373 -0.8184 -1.3678 -1.3605 -1.0999 -0.8904 -0.8888 -1.0009 -0.7792 0.3791 0.3945 0.5691 -0.0588 0.0738 0.5135 0.2896 0.4897 0.8086 1.0022 1.8816 1.6080 1.3252 1.3716 -0.3727 -0.5235 -0.7116 -0.6132 -0.5579 -0.5648 -0.5604 0.7330 0.5746 0.0725 0.2184 -0.0164 0.6467 0.4815 0.5118 0.5386 0.7222 1.3272 0.8560 0.6952 0.9175

-0.4169 -0.1185 -0.0619 -0.2436 -0.6481 -0.6738 -0.7904

-0.3727 -0.0645 0.5579 0.2184 -0.2270 -0.0923 -0.4251

-0.7265 -0.5775 -0.5212 -1.0752 -1.0392 -0.9888 -0.7101

0.2465 0.3225 0.1210 0.1260 0.0738 -0.2982 -0.7535

0.2465 0.2145 -0.2635 -0.7056 -0.5278 -0.2982 0.2518

0.7551 0.7636 0.8566 0.6804 0.2844 0.2106 -0.2879

1.3964 1.9246 -0.8236 -0.9828 -0.2270 -0.1165 0.1899

0.9099 1.1866 1.0059 -0.0588 0.1641 0.2348 0.0422

1.3521 0.5116 0.6288 1.0500 1.0966 1.2282 0.2886

0.3128 1.2946 1.7526 1.7892 1.3974 1.7613 2.8870

0.6003 -0.0195 0.1322 -0.3360 -0.2270 0.1742 -0.4893

-0.8150 -0.7485 -0.3830 -0.7980 -0.7985 -0.5284 -0.6884

-0.1516 -0.4605 -0.6742 -0.5208 -0.4376 -0.8313 -0.9187

-0.0852 -0.2985 -0.1067 -0.4284 -0.9489 -1.1100 -0.9187

1.3964 1.2856 1.3270 1.5120 1.5479 1.5069 1.9613

0.3128 -0.0915 0.4459 1.0500 0.8259 0.8648 0.8876

-1.0804 -1.2885 -1.5367 -1.1676 -1.0091 -0.5769 -0.1507

0.4234 0.5206 0.3339 0.1260 -0.4977 -0.7344 -0.7305

-0.3948 -0.1635 -0.8236 -1.4448 -1.0994 -1.1100 -0.2616

1.5069 1.2226 0.6251 0.4032 0.5852 0.5983 0.3084

0.4013 0.3045 0.0688 -0.2436 -0.5579 -0.5163 -0.3554

-1.0140 -0.7395 -0.6033 -0.5208 -0.6180 -0.7344 -0.6226

-0.3727 -0.2985 -0.1104 -0.5208 -0.7685 -0.8192 -0.6575

-0.8813 -0.9195 -0.3382 0.2184 0.1641 0.2227 0.1471

0.2907 0.7366 0.8939 1.1424 1.1869 1.0102 -0.1629

0.7993 0.7186 1.1366 0.6804 0.1340 -0.0802 0.9109

-1.8322 -1.6305 -1.0401 -1.0752 -1.1294 -1.1463 -1.0096

-1.2351 -1.3065 -1.5740 -1.7220 -1.3701 -1.2069 -0.7298

2.4799 1.9876 1.9879 2.3436 4.4658 4.3539 4.3636

(2)建立变量的协方差矩阵:

R=cov(x); %注释: 由于数据已经过标准化处理,故x的协方差矩阵等于其相关系数矩阵,即R=corrcoef(x).

程序运行结果为:

R =

1.0000 0.9528 0.8347 0.7277 0.7284 0.7415 0.6820

0.9528 1.0000 0.8570 0.7241 0.6984 0.7099 0.6802

0.8347 0.8570 1.0000 0.8984 0.7878 0.7776 0.6989

0.7277 0.7241 0.8984 1.0000 0.9016 0.8637 0.7747

0.7284 0.6984 0.7878 0.9016 1.0000 0.9689 0.8742

0.7415 0.7099 0.7776 0.8637 0.9689 1.0000 0.8980

0.6820 0.6802 0.6989 0.7747 0.8742 0.8980 1.0000

(3)求得特征值及相应的单位特征向量

[V,D]=eig(R); %注释: 函数eig的功能是对矩阵R进行正交对角化变换,矩阵D是以R的特征值为对角元的对角矩阵(对角元按从小到大的顺序排列),矩阵V是正交变换矩阵。 程序运行结果为:

V =

-0.0522 -0.6188 -0.2401 0.3154 0.2884 0.4880 0.3686

0.1103 0.7115 -0.0321 -0.0786 0.2340 0.5348 0.3655

-0.2100 -0.1972 0.5694 -0.3551 -0.5087 0.2494 0.3817

0.3148 0.0250 -0.6216 -0.0543 -0.5830 -0.1514 0.3848

-0.6896 0.2304 -0.0278 0.4365 -0.0236 -0.3576 0.3893

0.6006 -0.0187 0.4620 0.3648 0.1438 -0.3467 0.3892

-0.0746 -0.1334 -0.1282 -0.6646 0.4921 -0.3777 0.3657

D =

0.0226 0 0 0 0 0 0

0 0.0393 0 0 0 0 0

0 0 0.0538 0 0 0 0

0 0 0 0.1263 0 0 0

0 0 0 0 0.3031 0 0

0 0 0 0 0 0.6566 0

0 0 0 0 0 0 5.7983

(4)选取主成分:

DD=[ ]; %将特征值对角矩阵D改写为列向量DD

for i=p:-1:1 %此处要注意eig函数的输出D中特征值的排列顺序

DD=[DD;D(i,i)];

end

OFFER=DD/sum(DD); %计算特征值的方差贡献率

cumOFFER=cumsum(DD)/sum(DD); %计算特征值的方差累计贡献率

OUTCOME=[DD,OFFER,cumOFFER] %综合输出计算结果

pri=1;

for i=1:p

if cumOFFER(i)<=0.85

pri=i+1; %取前几个特征值?累计方差贡献超过85%

end

end

PCACOV=V(:,end:-1:end-pri+1) %输出对应特征值的正交单位化的特征向量, 此处要注意eig函数的输出D中特征值的排列顺序和特征向量的排列顺序

PCASCORE=x*PCACOV; %主成份得分

Z=PCASCORE*OFFER([1:pri])/cumOFFER(pri);%综合评分

[ZZ,I]=sort(Z,'descend'); %样本排序 [Y,I] = SORT(X,DIM,MODE) also returns an index matrix I.

scatter(ZZ,I);

程序运行结果为:

OUTCOME =

60

5.7983

0.6566 0.3031 50 0.1263 0.0538 40 0.0393 0.0226 30

PCACOV =

20

0.3686 0.3655 0.3817 10 0.3848 0.3893 0.3892 0-4-2024680.3657 -0.3777

由以上结果可知:前两个特征值的方差累计贡献率为92.21%>85%,因此用取前两个主成分即可。主成分系数为PCACOV =

0.3686 0.4880

0.3655 0.5348

0.3817 0.2494

0.3848 -0.1514

0.3893 -0.3576

0.3892 -0.3467

0.3657 -0.3777

故主成分的线性表达式为

F1?0.3686x1?0.3655x2?0.3817x3?0.3848x4?0.3893x5?0.3892x6?0.3657x7 F2?0.488x1?0.5348x2?0.2494x3?0.1514x4?0.3576x5?0.3467x6?0.3777x7

(5)对第一主成分和第二主成分的意义进行分析:

主成分系数为PCACOV =

0.3686 0.4880

0.3655 0.5348

0.3817 0.2494

0.3848 -0.1514

0.3893 -0.3576

0.3892 -0.3467

0.3657 -0.3777 由于第一主成分的线性组合中所有变量的系数相当,

所以第一主成分可看成是x1, x2, x3, x4, x5,

利用SPSS得出的主成分系数为标准主成分系数,将其化为主成分系数如下:

(1)将Component Score Coefficient Matrix中的1、2列数字分别在SPSS中建立新的散列b1,b2 输入b1*SQRT(5.798),b2*SQRT(0.657)

得到如下数据:

.368 .366 .383 .385 .390 .390 .366

.488 .535 .250 -.152 -.357 -.347 -.378

F1?0.368x1?0.366x2?0.383x3?0.385x4?0.39x5?0.39x6?0.366x7;

F2?0.488x1?0.535x2?0.25x3?0.152x4?0.357x5?0.347x6?0.378x7

(2)将各个主成分得分乘以相应的sqrt(λ)即特征根的二次方根可以将其还原为未经标准化的主成分得分. 这里同样使用compute命令还原为主成分得分

pscore1=FAC1_4*SQRT(λ1)

pscore1=FAC1_4*SQRT(λ2)

所得pscore1,pscore2数据分别为:

.53 -.67

-2.09 -.53

-1.38 -.28

-1.55 .13

.39 -.97

-.12 -.91

1.68 .59

-2.61 -.69

.55 1.17

.64 .98

.14 .16

6.08 1.39

2.62 .32

-3.06 -1.02

-1.12 .55

2.29 -.61

-2.18 -.67

-1.89 -.44

-3.51 -1.21

-2.93 -.44

-2.78 -.58

.81 .23

3.23 -.92

-1.48 .06

1.01 .25

2.11 -.38

-1.12 .52

-.14 .16

-2.14 .35

-.06 .67

-.43 .47

1.23 .82

.46 1.70

1.30 1.18

2.34 .00

4.23 -1.19

-.06 .57

-1.80 -.04

-1.51 .38

-1.48 .91

3.98 -.35

1.64 -.87

-2.58 -.81

-.22 1.26

-2.03 .61

1.97 .95

-.36 .93

-1.83 -.25

-1.35 .52

-.50 -1.23

1.95 -.13

1.61 .59

-3.34 -.68

-3.47 -.25

8.33 -2.34

(3)综合评价:

重新进入Compute对话框,在Target Variable 栏中输入Z,在Numeric expression栏中输入表达式如下:

(0.82832*pscore1+0.09379*pscore2)/0.92212

点击OK得Z的值为:

.40

-1.94

-1.27

-1.38

.25

-.20

1.57

-2.41

.61

.68

.14

5.60

2.39 -2.85 -.95 2.00 -2.03 -1.75 -3.27 -2.67 -2.56 .75

2.80 -1.32 .94

1.86 -.95 -.11 -1.89 .01 -.34

1.19 .59

1.29

2.10

3.68 .00 -1.62 -1.32 -1.24

3.54

1.38 -2.40 -.07 -1.76

1.87 -.23 -1.67 -1.16 -.58

1.74

1.50 -3.07 -3.14

7.24

(4)作图如下:

2. 基于第一主成分对个国家和地区排序。 国家和100m/地区 s 55 12.74 12 12.90 36 11.76 41 12.25 23 11.84 13 11.96 35 12.23 16 11.79 26 11.85 46 12.30 51 11.75 7 12.14 42 11.76 52 11.98 34 12.03 32 11.96 25 11.95 22 11.79 10 11.95 9 12.00 1 11.61 33 12.25 5 11.46 11 11.60 30 11.73 37 11.89 6 11.31 28 11.45 44

11.81 200m/s 400m/s

25.85 58.73 27.10 60.40 25.08 58.10 25.07 56.96 24.54 56.09 24.60 58.25 24.21 55.09 24.05 56.05 24.24 55.34 25.00 55.08 24.46 55.80 24.47 55.00 23.54 54.60 24.44 56.45 24.96 56.10 24.49 55.70 24.28 53.60 24.08 54.93 24.41 54.97 24.52 54.90 22.94 54.50 25.78 51.20 23.05 53.30 24.00

53.26

24.00 53.73 23.62 53.76 23.17 52.80 23.57 54.90 24.22 54.30

800m1500m//min min 2.33 5.81 2.30 4.84 2.27 4.79 2.24 4.84 2.28 4.86 2.21 4.68 2.19 4.69 2.24 4.74 2.22 4.61 2.12 4.52 2.20 4.72 2.18 4.45 2.19 4.60 2.15 4.37 2.07 4.38 2.15 4.42 2.10 4.32 2.07 4.35 2.08 4.33 2.05 4.23 2.15 4.43 1.97 4.25 2.16 4.58 2.11

4.35

2.09 4.35 2.04 4.25 2.10 4.49 2.10 4.25 2.09 4.16

3000m/马拉松min /min 13.04 306.00 11.10 233.22 10.90 261.13 10.69 233.00 10.54 215.08 10.43 171.80 10.46 182.17 9.89 203.88 10.02 201.28 9.94 182.77 10.28 168.45 9.51 191.02 10.16 200.37 9.38 201.08 9.64 174.68 9.62 164.65 9.98 188.03 9.87 182.20 9.31 168.48 9.37 171.38 9.79 178.52 9.35 179.17 9.81 169.98 9.46 165.42 9.20 150.50 9.59 158.53 9.77 168.75 9.37 160.48 8.84

151.20 第一主成分 8.33 6.08 4.23 3.98 3.23 2.62 2.34 2.29 2.11 1.97 1.95 1.68 1.64 1.61 1.30 1.23 1.01 0.81 0.64 0.55 0.53 0.46 0.39 0.14 -0.06 -0.06 -0.12 -0.14 -0.2

47 31 50 15 11.80 23.98 53.59 11.73 23.88 52.70 11.22 22.62 52.50 11.42 23.52 53.60 2.05 4.14 2.00 4.15 2.10 4.38 2.03 4.18 9.02 9.20 9.63 8.71 162.60 181.05 177.87 151.75 2 -0.36 -0.43 -0.50 -1.127 11.43 49 11.45 3 11.43 24 11.45 40 11.58 39 11.55 4 11.41 38 11.25 48 11.16 18 11.15 45 11.44 2 11.20 29 11.29 17 11.13 43 11.13 8 11.00 21

11.00 23.51 53.24 23.31 53.11 23.09 50.62 23.06 51.50 23.31 53.12 23.13 51.60 23.04 52.00 22.81 52.38 22.82 51.79 22.59 51.73 23.46 51.20 22.35 51.08 23.00 52.01 22.39 50.14 22.21 49.29 22.25 50.06 22.13 50.46

2.05 4.11 2.02 4.07 1.99 4.22 2.01 4.14 2.03 4.01 2.02 4.18 2.00 4.14 1.99 4.06 2.02 4.12 2.00 4.14 1.92 3.96 1.98 4.13 1.96 3.98 2.03 4.10 1.95 3.99 2.00 4.06 1.98 4.03

8.89 149.38 8.77 153.42 9.34 159.37 8.98 156.37 8.53 145.48 8.76 145.48 8.80 157.85 9.01 152.48 8.84 154.48 8.98 155.27 8.53 165.45 9.08 152.37 8.63 151.82 8.92 154.23 8.97 168.82 8.81 149.45 8.62

149.72

2 -1.12 -1.35 -1.38 -1.48 -1.48 -1.51 -1.55 -1.80 -1.83 -1.89 -2.03 -2.09 -2.14 -2.18 -2.58 -2.61 -2.78

20 11.01 22.39 49.75 1.95 4.03 8.59 148.53 -2.9

3

14 11.09 21.97 47.99 1.89 4.14 8.92 158.85 -3.0

6

53 10.79 21.83 50.62 1.96 3.95 8.50 142.72 -3.3

4

54 11.06 22.19 49.19 1.89 3.87 8.45 151.22 -3.4

7

19 10.81 21.71 48.16 1.93 3.96 8.75 157.68 -3.5

1

3.基于主成分综合评价排序

国家和100m/800m/1500m/3000m/马拉松地区 s 200m/s 400m/s min min min /min 19 10.81 21.71 48.16 1.93 3.96 8.75 157.68 7 12.14 24.47 55.00 2.18 4.45 9.51 191.02 3 11.43 23.09 50.62 1.99 4.22 9.34 159.37 38 11.25 22.81 52.38 1.99 4.06 9.01 152.48 5 11.46 23.05 53.30 2.16 4.58 9.81 169.98 42 11.76 23.54 54.60 2.19 4.60 10.16 200.37 49 11.45 23.31 53.11 2.02 4.07 8.77 153.42 32 11.96 24.49 55.70 2.15 4.42 9.62 164.65 29 11.29 23.00 52.01 1.96 3.98 8.63 151.82 37 11.89 23.62 53.76 2.04 4.25 9.59 158.53 20 11.01 22.39 49.75 1.95 4.03 8.59 148.53 35 12.23 24.21 55.09 2.19 4.69 10.46 182.17 14 11.09 21.97 47.99 1.89 4.14 8.92 158.85 48 11.16 22.82 51.79 2.02 4.12 8.84 154.48 27 11.43 23.51 53.24 2.05 4.11 8.89 149.38 50 11.22 22.62 52.50 2.10 4.38 9.63 177.87 30 11.73 24.00 53.73 2.09 4.35 9.20 150.50 33 12.25 25.78 51.20 1.97 4.25 9.35 179.17 46 12.30 25.00 55.08 2.12 4.52 9.94 182.77 26 11.85 24.24 55.34 2.22 4.61 10.02 201.28 15 11.42 23.52 53.60 2.03 4.18 8.71 151.75 55 12.74 25.85 58.73 2.33 5.81 13.04 306.00 23 11.84 24.54 56.09 2.28 4.86 10.54 215.08 51 11.75 24.46 55.80 2.20 4.72 10.28 168.45 47 11.80 23.98 53.59 2.05 4.14 9.02 162.60 24 11.45 23.06 51.50 2.01 4.14 8.98 156.37 45 11.44 23.46 51.20 1.92 3.96 8.53 165.45

28 11.45 23.57 54.90 2.10 4.25 9.37 160.48 综合评分7.24 5.60 3.68 3.54 2.80 2.39 2.10 2.00 1.87 1.86 1.74 1.57 1.50 1.38 1.29 1.19 0.94 0.75 0.68 0.61 0.59 0.40 0.25 0.14 0.01 0.00 -0.07 -0.1

13 11.96 17 11.13 31 11.73 21 11.00 34 12.03 6 11.31 8 11.00 4 11.41 36 11.76 11 11.60 39 11.55 41 12.25 40 11.58 43 11.13 22 11.79 2 11.20 44 11.81 12 12.90 25 11.95 18 11.15 16

11.79 24.60 58.25 22.39 50.14 23.88 52.70 22.13 50.46 24.96 56.10 23.17 52.80 22.25 50.06 23.04 52.00 25.08 58.10 24.00 53.26 23.13 51.60 25.07 56.96 23.31 53.12 22.21 49.29 24.08 54.93 22.35 51.08 24.22 54.30 27.10 60.40 24.28 53.60 22.59 51.73 24.05

56.05

2.21 4.68 2.03 4.10 2.00 4.15 1.98 4.03 2.07 4.38 2.10 4.49 2.00 4.06 2.00 4.14 2.27 4.79 2.11 4.35 2.02 4.18 2.24 4.84 2.03 4.01 1.95 3.99 2.07 4.35 1.98 4.13 2.09 4.16 2.30 4.84 2.10 4.32 2.00 4.14 2.24

4.74

10.43 171.80 8.92 154.23 9.20 181.05 8.62 149.72 9.64 174.68 9.77 168.75 8.81 149.45 8.80 157.85 10.90 261.13 9.46 165.42 8.76 145.48 10.69 233.00 8.53 145.48 8.97 168.82 9.87 182.20 9.08 152.37 8.84 151.20 11.10 233.22 9.98 188.03 8.98 155.27 9.89

203.88

1 -0.20 -0.23 -0.34 -0.58 -0.95 -0.95 -1.16 -1.24 -1.27 -1.32 -1.32 -1.38 -1.62 -1.67 -1.75 -1.76 -1.89 -1.94 -2.03 -2.40 -2.41

1 11.61 9 12.00 52 11.98 53 10.79 54 11.06 10 11.95

22.94 54.50 24.52 54.90 24.44 56.45 21.83 50.62 22.19 49.19 24.41

54.97

2.15 4.43 2.05 4.23 2.15 4.37 1.96 3.95 1.89 3.87 2.08

4.33

9.79 178.52 9.37 171.38 9.38 201.08 8.50 142.72 8.45 151.22 9.31

168.48

-2.56 -2.67 -2.85 -3.07 -3.14 -3.27

网站首页网站地图 站长统计
All rights reserved Powered by 海文库
copyright ©right 2010-2011。
文档资料库内容来自网络,如有侵犯请联系客服。zhit326@126.com