Análisis Factorial Y Cluster
VHugo1018 de Mayo de 2014
13.982 Palabras (56 Páginas)426 Visitas
Para la realización del trabajo he escogido una base de datos cuyos individuos son los 67 municipios de residencia de las madres menores de 50.000 habitantes, que son:
Alicante. Alcoy/Alcoi
Alicante. Benidorm
Alicante. Elche/Elx
Alicante. Elda
Alicante. Orihuela
Alicante. San Vicente del Raspeig/Sant Vicent del Raspeig
Alicante. Torrevieja
Almería. Ejido(El)
Badajoz. Mérida
Baleares (Illes.) Calvia
Barcelona. Castelldefels
Barcelona. Cornellá de Llobregat
Barcelona. Granollers
Barcelona. Mataró
Barcelona. Mollet del vallÞs
Barcelona. Prat de Llobregat (El)
Barcelona. Rubí
Barcelona. Sant Boi de Llobregat
Barcelona. Sant Cugat del VallÞs
Barcelona. Cerdanyola del Vallés
Barcelona. Viladecans
Barcelona. Vilanova i la Geltrú
Cádiz. Chiclana de la Frontera
Cádiz. Línea de la Concepción (La)
Cádiz. Puerto de Santa Maria (El)
Cádiz. Sanlúcar de Barrameda
Castellón/Castelló. Vila-Real
Ciudad Real. Puertollano
Coruña (A). Ferrol
Coruía (A). Santiago de Compostela
Granada. Motril
Guipúzcoa. Irún
Jaén. Linares
León. Ponferrada
Madrid. Aranjuez
Madrid. Arganda del Rey
Madrid.Collado Villalba
Madrid. Coslada
Madrid. Majadahonda
Madrid. Móstoles
Madrid. Pozuelo de Alarcón
Madrid. Rivas-Vaciamadrid
Málaga. Benalmádena
Málaga. Estepona
Málaga. Fuengirola
Málaga. Mijas
Málaga. Vélez-Málaga
Málaga.Torremolinos
Murcia. Molina de Segura
Asturias. Avilés
Asturias. Gijón
Asturias. Siero
Palmas (Las).Arrecife
Palmas (Las). San Bartolomé de Tirajana
Palmas (Las). Santa Lucía de Tirajana
Palmas (Las). Telde
Pontevedra. Vigo
Santa Cruz de Tenerife. Arona
Cantabria. Torrelavega
Sevilla. Utrera
Toledo. Talavera de la Reina
Valencia. Gandía
Valencia. Paterna
Valencia. Sagunto/Sagunt
Valencia. Torrent
Vizcaya. Barakaldo
Vizcaya. Getxo
La base de datos cuenta con 10 variables, todas ellas cuantitativas y están calculadas en unidades, es decir, en los números de nacimientos de hijos según los estudio que tienen las madres:
No saben leer o escribir.
Sabe leer y escribir pero fue menos de 5 años a la escuela.
Fue a la escuela 5 años o más pero sin completar EGB, ESO o Bachillerato Elemental.
Bachiller Elemental, EGB o ESO completa (Graduado Escolar).
Bachiller Superior, BUP, Bachiller LOGSE, COU, PREU.
FPI, FP grado medio, Oficialía Industrial o equivalente.
FPII, FP superior, Maestría Industrial o equivalente.
Diplomatura, Arquitectura o Ingeniería Técnicas.
Arquitectura, Ingeniería, Licenciatura o equivalente.
Doctorado.
Los objetivos principales del estudio que voy a llevar a cabo son:
Conocer el número de nacimientos de hijos, según la residencia de la madre, cogiendo para el estudio sólo municipios de menos de 50.000 habitantes, es decir, no capitales.
También queremos conocer el número de nacimientos que hubo en el año 2.009, utilizando para ello los estudios que tienen las madres, para estudiar si los estudios influyen o no a la hora de tener más o menos hijos.
Conocer posibles diferencias e intentar clasificar los distintos estudios de las madres. Por lo que en cada análisis pretendemos realizar :
Análisis Factorial: Reducción de información mediante la extracción de factores que relacionen las variables que forman nuestra base de datos que es de variables cuantitativas.
Análisis Clúster: Realizar agrupaciones homogéneas de las Comunidades Autonómicas Españolas en función de los factores obtenidos en el análisis anterior.
Para llevar a cabo este trabajo, hemos realizado el informe con todas las técnicas de obtención de información que dichas técnicas han sido secundarias.
En general se han empleado:
Datos del INE de nacimientos según la residencia de las madres por municipios menores de 50.000 habitantes y nivel de estudios de las madres en el año 2.009.
Todas las variables de la base de datos, es decir, las unidades: número de nacimientos son de tipo numérico y de medida escala.
La métodos que vamos a utilizar para analizar el 1º trabajo ha sido la siguiente:
TRABAJO 1:
ANÁLISIS FACTORIAL:
Matriz de correlaciones
Contraste de KMO y Prueba de Barlett
Contraste MSA o Test de Kaiser (Matrices Anti-Imagen)
Gráfico de Saturación o Sedimentación
Varianza Total Explicada
Comunalidad
Matriz de Componentes: Contribuciones Relativas y Absolutas
Correlaciones Reproducidas
Gráfico de Componentes
Gráfico de Individuos
Rotación de Factores
Matriz de Componentes Rotados: Contribuciones Relativas Rotadas y Contribuciones Absolutas Rotadas
Matriz de Transformación de los Componentes
Gráficos de Componentes Rotados
Gráfico de Individuos Rotados
Denominaciones de los 3 Factores
ANÁLISIS CLÚSTER:
Resumen del Procedimiento de los Casos
Historial de Conglomeración
Dendrograma
Conglomerado de Pertenencia
Denominaciones de los 3 Clústeres
El objetivo es la reducción de las p variables en k factores. Este análisis recibe la denominación de ANÁLISIS R-FACTORIAL, Siendo el más habitual. no obstante en ocasiones también se realiza el análisis factorial sobre la matriz traspuesta, es decir, sobre los individuos. Este análisis recibe el nombre de ANÁLISIS Q-FACTORIAL y sus utilización es mucho menor, ya que informáticamente plantea muchos problemas debido a que el número de individuos suele ser mayor que el número de variables y existe otro tipo de análisis que puede ofrecer resultados similares, como el análisis clúster y el MDS.
Es decir, el objetivo del análisis factorial en nuestro trabajo es la reducción de información pasando de las 10 variables que tiene nuestra base de datos a un número más reducido de factores, siempre teniendo en cuenta que hay que evitar una pérdida significativa de información.
UNA DEFINICIÓN DEL ANÁLISIS FACTORIAL QUE VIENE EN LOS LIBROS PUEDE SER:
Análisis factorial es una técnica estadística de reducción de datos usada para explicar la variabilidad entre las variables observadas en términos de un número menor de variables no observadas llamadas factores. Las variables observadas se modelan como combinaciones lineales de factores más expresiones de error. El análisis factorial se originó en psicometría, y se usa en las ciencias del comportamiento tales como ciencias sociales, mercadeo, gestión de productos, investigación de operaciones y otras ciencias aplicadas que tratan con grandes cantidades de datos.
MATRIZ DE CORRELACIONES
Comenzaremos observando la Matriz de correlaciones (Tabla 1):
Matriz de correlacionesa
No sabe leer o escribir Sabe leer y escribir pero fue menos de 5 años a la escuela Fue a la escuela 5 años o más pero sin completar EGB, ESO o Bachillerato Elemental Bachiller Elemental, EGB o ESO completa (Graduado Escolar) Bachiller Superior, BUP, Bachiller LOGSE, COU, PREU FPI, FP grado medio, Oficialía Industrial o equivalente FPII, FP superior, Maestría Industrial o equivalente Diplomatura, Arquitectura o Ingeniería Técnicas Arquitectura, Ingeniería, Licenciatura o equivalente Doctorado
Correlación No sabe leer o escribir 1,000 ,911 ,605 ,386 ,228 ,206 ,173 ,134 -,024 -,080
Sabe leer y escribir pero fue menos de 5 años a la escuela ,911 1,000 ,727 ,492 ,257 ,264 ,148 ,141 -,060 -,143
Fue a la escuela 5 años o más pero sin completar EGB, ESO o Bachillerato Elemental ,605 ,727 1,000 ,866 ,466 ,602 ,387 ,271 -,004 -,116
Bachiller Elemental, EGB o ESO completa (Graduado Escolar) ,386 ,492 ,866 1,000 ,780 ,829 ,667 ,560 ,210 ,077
Bachiller Superior, BUP, Bachiller LOGSE, COU, PREU ,228 ,257 ,466 ,780 1,000 ,832 ,820 ,851 ,573 ,441
FPI, FP grado medio, Oficialía Industrial o equivalente ,206 ,264 ,602 ,829 ,832 1,000 ,902 ,791 ,471 ,328
FPII, FP superior, Maestría Industrial o equivalente ,173 ,148 ,387 ,667 ,820 ,902 1,000 ,854 ,550 ,418
Diplomatura,
...