Analis Cluster
Enviado por Puchun • 12 de Septiembre de 2014 • 449 Palabras (2 Páginas) • 180 Visitas
Analisis Cluster
• Se utiliza la información de una serie de variables para cada sujeto u objeto y, conforme a estas variables se mide la similitud entre ellos.
• Una vez medida la similitud se agrupan en: grupos homogéneos internamente y diferentes entre sí.
• La "nueva dimensión" lograda con el cluster se aprovecha después para facilitar la aproximación "segmentada" de un determinado análisis.
Conviene tener claro que:
• Que la técnica no tiene vocación / propiedades inferenciales
• Que por tanto, los resultados logrados para una muestra sirven sólo para ese diseño (su valor atañe sólo a los objetivos del analista): elección de individuos, variables relevantes utilizadas, criterio similitud utilizado, nivel de agrupación final elegido.... definen diferentes soluciones.
• Que cluster y discriminante no tiene demasiado en común: el discriminante intenta explicar una estructura y el Cluster intenta determinarla.
Etapas de un análisis Cluster
1. SELECCIÓN DE LA MUESTRA DE DATOS
• Adecuar al máximo la muestra al objeto de análisis
• Depuración de atípicos (interesan elementos como miembros de grupos,no interesa la excesiva "individualidad")
2. SELECCIÓN y TRANSFORMACIÓN DE VARIABLES A UTILIZAR
CANTIDAD
• No elegir variables indiscriminadamente: RECORDAMOS: cada estructura se manifiesta en una serie de variables y cada grupo de variables revela, sólo, una determinada estructura.
• Resultado muy sensible a la inclusión de alguna variable irrelevante.
• La inclusión indiscriminada de variables aumenta la probabilidad de atípicos.
TRANSFORMACIÓN
• Depende / Afecta a muchas decisiones posteriores (medida de distancia /similitud empleada, por ejemplo)
• Estandarización por variable: aunque resulta útil para mediciones posteriores de distancia puede afectar al resultado del análisis y no se recomienda si las diferencias de medidas reflejan alguna cualidad natural de interés conceptual.
• Estandarización por encuestado: singular, pero en baterías de indicadores elimina patrones de respuesta en los sujetos, ofreciendo la importancia relativa de cada indicador.
• Factorización: puede resultar interesante factorizar previamente las variables y realizar el Cluster con factores en lugar de con variables.
...