ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

CLUSTERING MEDALLISTAS OLÍMPICOS EN JMP


Enviado por   •  1 de Mayo de 2014  •  804 Palabras (4 Páginas)  •  210 Visitas

Página 1 de 4

CLUSTERING MEDALLISTAS OLÍMPICOS EN JMP

Vamos a echar un vistazo a los resultados de los Juegos Olímpicos de verano en 2008 en Beijing. Nos preguntamos si sería posible descubrir patrones en los datos cuando se combinan con indicadores económicos, como el producto interno bruto (PIB) y la población de los respectivos países en el mismo año que se llevaron a cabo las olimpiadas.

¿Qué es Clustering?

Clustering es una técnica multivariante de agrupación de filas que comparten valores similares. El objetivo de la agrupación es dividir los datos en grupos de manera que las observaciones dentro de un grupo son tan similares como sea posible el uno al otro, y tan diferentes como sea posible a las observaciones de otros grupos.

Hay varios métodos de agrupación; los más comunes son k-means clustering y la agrupación jerárquica. Elegimos la agrupación jerárquica, ya que es un buen método para los conjuntos de datos más pequeños. En cada paso, los dos grupos que están más cerca juntos se combinan en un solo grupo. Este proceso continúa hasta que sólo hay un grupo que contiene todos los puntos.

Clustering es posible en muchos productos de SAS: SAS Enterprise Guide, SAS Enterprise Miner, Base SAS JMP. Hemos realizado el análisis de cluster Olímpicos en JMP.

Cómo agrupar en JMP?

1. Abra el conjunto de datos medallas en JMP y seleccione Analyze > Multivariate Methods > Cluster

2. Seleccione medallas, el PIB, la población -> Y, Columns

3. Seleccionar Nombre País -> Label

4. Asegúrese de que Hierarchical sea seleccionada en Opciones y que Ward y Standardize Data estén seleccionadas en Método.

5. Al hacer clic en Aceptar, el proceso de clustering empezara.

Cómo interpretar los resultados?

La secuencia de la agrupación se visualiza fácilmente con la ayuda del dendrograma. Un dendrograma es un diagrama de árbol que muestra cada observación, y demuestra que se agrupan como y cuando entró en su cluster.

Puede arrastrar la pequeña asa en forma de diamante en la parte superior o inferior de la dendrograma para identificar un determinado número de clusters. Quisimos identificar 10 grupos. Si hace clic en cualquier tallo clúster, todos los miembros del grupo más destacado en el dendrograma como en la tabla de datos.

El gráfico de sedimentación debajo del dendrograma tiene un punto para cada grupo unirse.

En la tabla histórica agrupación se ve que el número de grupos comienzan con 83, que es el número de filas de

...

Descargar como (para miembros actualizados)  txt (4.9 Kb)  
Leer 3 páginas más »
Disponible sólo en Clubensayos.com