Analisi Multivariable
cristina.gave3 de Octubre de 2013
1.474 Palabras (6 Páginas)308 Visitas
INTRODUCCIÓ
Aquesta pràctica consta de realitzar un estudi estadístic mitjançant un anàlisi multivariable d’una sèrie de dades extretes d’un heptatló.
OBJECTE
L’objecte de l’estudi es poder relacionar les característiques dels diferents atletes amb les diferents proves que els sotmet l’heptaló. Per a poder relacionar aquestes característiques s’ha optat per un anàlisis de components principals, els qual ens permetrà resumir les dades a les més importants (eliminant les dades amb una certa redundància) i realitzar una representació gràfica d’aquestes per a veure la seva relació.
Aquestes dades han estat extretes de 55 atletes diferents amb les seves respectives 7 proves, les quals mesuren respectivament la resistència, rendiment global, forma física, velocitat, agilitat, flexibilitat, força dels braços i cames i concentració.
SITUACIÓ ACTUAL
La situació de la qual partim son les dades facilitades pel professor de les següents 7 proves:
MODALITAT UNITATS
80 m tanca Segons
Alçada Centímetres
Bala Metres
200m Segons
Llargada Metres
Javelina Metres
800m Segons
Taula 1. Dades inicials
80M TANQUES ALÇADA BALA 200M LLARGADA JAVELINA 800M
19,94 112 6,88 37,32 3,42 15,6 227,1
16,86 144 9,59 32,3 4,49 29,2 250,9
21,53 90 5,49 43,39 2,65 21,66 274,2
20,91 120 8,83 40,51 3,56 25,77 263,5
18,73 117 7,94 33,11 3,69 19,99 267,7
15,65 156 10,71 25,82 4,82 25,73 174,5
21,16 100 5,38 46,87 2,88 16,27 269,6
19,07 128 7,46 38,83 3,8 15,34 187,9
14,15 141 9,89 22,33 4,56 25,33 245,3
21,55 114 7,62 40,03 3,42 20,31 245,3
19,24 115 6,3 35,72 3,54 16,52 245,3
17,45 110 5,74 34,67 3,38 13,62 199,3
15,27 138 7,22 27,69 4,38 19,38 203,5
19,17 127 9,62 35,9 3,85 30,32 235,8
18,97 125 7,61 37,65 3,71 12,86 195,1
21,38 93 6,63 41,8 2,71 19,59 254,2
16,09 151 10,24 29,95 4,69 32,13 245,6
20 119 7,57 35,6 3,56 25,44 225,9
18,8 98 5,83 38,34 2,94 13,26 236,2
21,47 103 6,02 39,93 2,98 13,39 213,2
21,74 108 6,44 42 3,14 17,3 205,7
13,69 144 10,91 25,53 4,61 36,52 241,7
15,05 142 9,97 27,08 4,5 36,46 246,1
14,63 127 8,28 26,68 4,03 21,61 215,8
19,97 118 8,83 37,02 3,5 27,83 227,3
15,43 143 8,68 27,4 4,47 18,13 187,5
20,42 124 6,44 39,56 3,61 17,72 193
13,98 142 9,27 22 4,58 23,28 214
17,04 144 10,92 31,48 4,41 29,39 226,1
16,81 116 8,2 31,9 3,66 23,74 234,8
15,29 145 9,91 31,76 4,55 32,76 243,5
13,97 136 9,93 27,42 4,4 25,84 275,6
19,15 136 7,67 39,17 4,02 20,08 189,4
16,23 136 9,33 30,29 4,31 33,01 260,7
19,49 126 8,98 36,46 3,83 30,05 249
23,32 93 7,29 46,64 2,61 18,91 243,1
21,34 104 3,95 41,9 2,97 10,65 190,3
16,64 122 7,11 30,92 3,8 20,51 207,1
17,3 153 9,48 30,49 4,64 21,42 172,4
15,48 133 7,01 26,92 4,25 14,49 192,7
20,1 101 4,04 39,98 2,97 9,21 210,8
14,87 131 8,9 27 4,18 23,93 211,5
14,36 146 8,59 24,94 4,67 25,82 214,9
20,3 102 4,87 40,92 2,99 14,9 205,1
14,1 139 8,92 27,04 4,45 28,63 264,1
16,42 147 8,22 29,24 4,5 26,61 178,8
20,58 116 7,35 35,86 3,44 18,62 189,1
16,79 137 8,6 30,66 4,31 21,69 220,9
21,14 102 5,99 37,88 3,06 13,57 219,9
20,41 125 8,01 39,82 3,72 26,44 232,3
23,08 106 7,34 46,36 3,03 15,8 239,4
13,18 145 7,56 23,55 4,66 20,48 185,8
18,71 130 7,58 36,07 3,85 16,29 185,5
16,48 144 9,99 29,11 4,48 25,72 190,7
20,35 98 4,71 38,05 2,89 8,87 201,9
Taula 2. Dades inicials
PROCEDIMENT REALITZAT
Primer que tot s’ha calculat el vector variança per a veure si les dades es tenen que tipificar o no, si hi ha alguna dada amb alguna variança molt diferent a la resta aquesta agafaria molta més importància sobre les altres i estaríem falcejant l’anàlisis.
80M TANCA ALÇADA BALA 200M LLARGADA JAVELINA 800M
7,61019953 320,109764 3,00966209 42,3567846 0,4226332 45,9955833 801,685737
Taula 3. Variància.
Com es pot observar, hi ha molta diferència entre les variables per tant això ens indica que hem de tipificar les variables, sinó la variable 800m agafaria una importància molt més gran que la resta de variables.
Per tipificar les dades s’han de seguir els següents passos:
Centrar les dades. Aquesta operació es realitza restant a cada valor de la nostra matriu la mitjana aritmètica que li correspon.
Dividir les dades per la desviació típica de cadascuna.
A continuació es mostra la mitjana aritmètica i la desviació típica:
80M TANCA ALÇADA BALA 200M LLARGADA JAVELINA 800M
18,0950909 124,763636 7,85163636 34,1247273 3,82036364 21,5998182 222,301818
Taula 4. Mitjana
80M TANCA ALÇADA BALA 200M LLARGADA JAVELINA 800M
2,75865901 17,8916116 1,73483777 6,50820902 0,65010245 6,78200437 28,3140555
Taula 5. Desviació típica
ATLETA 80M TANCA ALÇADA BALA 200M LLARGADA JAVELINA 800M
1 0,66877026 -0,71338 -0,56007 0,490960 -0,61584 -0,88466 0,16946
2 -0,4477144 1,075161 1,002032 -0,28037 1,030047 1,120639 1,010034
3 1,24513725 -1,94301 -1,36130 1,423628 -1,8002 0,008873 1,832947
4 1,02039037 -0,26624 0,563951 0,981110 -0,40049 0,614889 1,455043
5 0,23015135 -0,43392 0,050934 -0,15591 -0,20052 -0,23736 1,60337
…… …… …… …… …… …… …… ……
…… …… …… …… …… …… …… ……
…… …… …… …… …… …… …… ……
52 -1,78169 1,131053 -0,16810 -1,62482 1,291544 -0,16511 -1,28917
53 0,222901 0,292671 -0,15657 0,298895 0,045587 -0,78292 -1,29977
54 -0,58546 1,075161 1,23260 -0,77052 1,014665 0,607516 -1,11611
55 0,817393 -1,49587 -1,81091 0,603126 -1,43110 -1,87699 -0,72055
Taula 6. Dades dels 55 atletes tipificades.
Una vegada tenim les dades tipificades procedim a calcular la matriu de correlacions:
80M TANQUES ALÇADA BALA 200M LLARGADA JAVELINA 800M
80M TANQUES 1 -0,804456 -0,621293 0,958458 -0,877854 -0,506665 0,090097
ALÇADA -0,804456 1 0,814226 -0,811202 0,987327 0,637317 -0,233904
BALA -0,621293 0,814226 1 -0,64426 0,81263 0,85197 0,162944
200M 0,958458 -0,811202 -0,64426 1 -0,882704 -0,493256 0,160926
LLARGADA -0,877854 0,987327 0,812635 -0,882704 1 0,647208 -0,167865
JAVELINA -0,506665 0,637317 0,851979 -0,493256 0,647208 1 0,402108
800M 0,090097 -0,233904 0,162944 0,160926 -0,167865 0,402108 1
Taula 6. Matriu de correlacions.
Una vegada obtinguda aquesta matriu es procedeix a calcular els VALORS PROPIS d’aquesta (VAP’S) juntament amb els seus VECTORS PROPIS ASSOCIATS (VEP’S), com que tenim una matriu que es de 7x7 ens sortiran 7 VAP’S i 7 VEP’S. Una característica dels vap’s es que la suma total dels valors propis és igual a la suma de la diagonal de la matriu de correlacions
VALORS PROPIS
4,811107281 1,42296426 0,51008402 0,12403987 0,0985036 0,03241244 0,00088853
Taula 7. Valors propis.
VECTORS PROPIS
Y1 Y2 Y3 Y4 Y5 Y6 Y7
-0,40869360 0,150893512 -0,5337692 0,12381261 -0,0683170 0,709331 0,04630202
0,433184497 -0,13800639 -0,2630064 0,38325872 0,40234395 0,09450106 -0,6375223
0,399525397 0,260425305 -0,3868950 0,21554608 -0,7250882 -0,2246739 0,01337501
-0,41101640 0,192382706 -0,4490518 0,23319645 0,34958584 -0,6312724 0,13157177
0,445859938 -0,11593263 -0,0631260 0,3167131 0,29681938 0,15805639 0,7552436
0,34289261 0,477687523 -0,2825737 -0,6974631 0,29426935 0,03226059 0,01736076
-0,01998189 0,78212991 0,45907511 0,3875313 0,10388804 0,11363637 -0,0568956
Taula 8. Vectors propis.
Dels valors propis sabem que entre tots recolliran el 100% de la informació. Per tant, es calcula la proporció d’informació que te cada VAP per a decidir quants components agafem per definir el nostre model.
VAP’S 4,81110 1,422964 0,510084 0,124039 0,09850 0,032412 0,000888
% per VAP 0,68730 0,20328 0,07286 0,01771 0,01407 0,00463 0,00012
% Acumulat 0,68730 0,89058 0,96345 0,98117 0,99524 0,99987 1
Taula 9. Informació dels valors propis.
Per definició de la teoria, es tenen que agafar suficients valors propis per recollir una quantitat d’informació del 90%. Seguint aquesta definició ens quedaríem amb tres components, encara que pels valors que s’han obtingut amb dues components també es consideraria suficient, ja que un 89% d’informació es podria considerar acceptable perquè esta al voltant del 90%.
Aquest mètode no és l’únic que es pot fer servir. Per això, es comprova mitjançant dos criteris més els quals es mostren a continuació.
El primer d’aquests dos criteris més que s’han decidit aplicar és el DIAGRAMA DE COLZE, aquest criteri representa els VAP’S amb un gràfic de línies amb
...