ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Relación ejercicios tema 1 estadistica multivariante

Raul CintadoApuntes27 de Octubre de 2019

1.210 Palabras (5 Páginas)353 Visitas

Página 1 de 5

DEPARTAMENTO DE ESTADÍSTICA Y ECONOMETRÍA

Estadística Multivariante

Grado en Marketing e Investigación de Mercados

Relación de Ejercicios del Tema 1: Introducción al Análisis Multivariante

  1. En el fichero “inmuebles.sgd” se recoge la siguiente información para 3.337 operaciones inmobiliarias llevadas a cabo por los trabajadores de una empresa, ubicada en Cataluña, entre enero de 2004 y abril de 2007:

Variable 

Descripción

Provincia

Barcelona, Gerona, Lérida y Tarragona

Superficie

En metros cuadrados

Precio de la operación

En euros

Se pide:

  1. Estudie la normalidad univariante para las variables Superficie y Precio de la operación a partir de un análisis gráfico y analítico.

Describir – ajuste de distribuciones – ajuste de datos no censurados.

SUPERFICIE:

Pruebas de Bondad-de-Ajuste para Superficie

Prueba de Kolmogorov-Smirnov

Normal

DMAS

0,0610236

DMENOS

0,0633641

DN

0,0633641

Valor-P

0,0

Se rechaza la hipótesis de normalidad ya que p-valor es 0.

[pic 2]

No hay normalidad.

Los test de Shapiro y el de kolmogorov no se realizan ya que la muestra es demasiado grande.

PRECIO:

Se rechaza la hipótesis de normalidad ya que p-valor es 0.

El test de Shapiro y el de kolmogorov no se realizan ya que la muestra es demasiado grande.

Describir – datos numéricos – análisis de una variable. Nos fijamos en el sesgo y la curtosis que deben de estar entre (-2, +2).

No se encuentran dentro de estoa valores luego no son normales.

  1. ¿Podríamos afirmar que las variables Superficie y Precio de la operación siguen una distribución normal bivariante? ¿Por qué?

No. Ya que ninguna de las dos variables sigue una distribución normal independientemente, por lo tanto, no pueden ser normales conjuntamente.

  1. Estudie la normalidad de la variable Precio de la operación para las distintas provincias recogidas en la base de datos

De una en una:

-Describir – análisis de una variable – arriba precio – abajo provincia= “nombre de la provincia”

Todas a la vez:

-Comparar - varias muestras – comparación de varias muestras – columna de códigos y datos – arriba precio – justo abajo debajo provincia – resumen estadístico.

Se rechaza la hipótesis de normalidad.

  1. El fichero “hipótesis.sf3” ofrece la siguiente información para cuatro empresas:

Variable 

Descripción

Cotización

mensual (euros/acción)

Facturación

mensual (miles euros)

Empresas

Empresas A, B, C y D

Se pide:

  1. Estudie la normalidad univariante para las variables Cotización y Facturación a partir de un análisis gráfico y de un test específico de normalidad.

Describir – ajuste de distribuciones – ajuste de datos no censurados. Elegimos una variable de las dos. Le damos a aceptar – marcamos las 3 primeras y luego el histograma y el gráfico cuantil-cuantil. Luego hacemos el mismo proceso para la otra variable.

H0: existe normalidad para la variable cotización.[pic 3]

H1: H0 no es cierta.

H0: existe normalidad para la variable facturación.[pic 4]

H1: H0 no es cierta.

Se acepta la hipótesis nula de normalidad ya que el p-valor es mayor a 0,05 en ambos casos.

[pic 5][pic 6]

Se acepta la hipótesis de normalidad ya que en el grafíco Q-Q los valores se encuentran próximos a la recta de normalidad.

  1. Verifique la hipótesis de homocedasticidad entre las distintas empresas para las variables Cotización y Facturación.

Comparar – varias muestras – columnas de códigos y datos (dependiendo de las columnas que haya) – ponemos cotización arriba y empresa en códigos por nivel - verificación de varianzas.

[pic 7]

H0: [pic 8]

        H1: H0 no es cierta.

Se acepta que la variabilidad de la variable cotización es la misma entre las 4 empresas, ya que p-valor es mayor a 0,05.

        

Seguimos el mismo proceso con la variable facturación.

  1. Un establecimiento comercial quiere analizar el gasto de sus clientes. Para ello selecciona un panel de 30 consumidores con la siguiente información (fichero “consumidores.sgd”):

Horario: Horario de compra preferido por el cliente (Mañana, tarde o indiferente).

Sexo: Hombre/Mujer.

Perfumería. Gasto mensual en perfumería y cosmética (euros).

Moda. Gasto mensual en moda y complementos (euros).

Deportes. Gasto mensual en deportes (euros).

Bricolaje. Gasto mensual en bricolaje (euros).

 Se pide:

  1. Estudie la normalidad de la variable Perfumería.

Ho: perfumería sigue normal.

H1: H0 no es cierta.

Prueba de normalidad: como solo tengo 30 datos lo podemos estudiar solo según shapiro, y podemos decir que se acepta la hipótesis de normalidad, ya que p-valor es mayor que 0,05.

  1. Verifique si la variable Perfumería presenta heterocedasticidad (desigualdad de varianzas) en función del Horario de compra. Interprete el resultado obtenido.

Presenta homocedasticidad ya que todas las varianzas son iguales.

  1. Analice si existen casos atípicos para la variable Perfumería.

Prueba de normalidad: como solo tengo 30 datos lo podemos estudiar solo según shapiro, y podemos decir que se acepta la hipótesis de normalidad.

Estimados de Localización

Media muestral

50,8333

Mediana muestral

52,0

Media recortada

50,2857

Media Winsorizada

49,9

No hay grandes diferencias. No hay valores atípicos.

Estimados de Escala

Desviación estd. muestral

19,8999

DAM/0.6745

14,8258

Sbi

17,819

Sigma Winsorizada

16,6412

No hay grandes diferencias. No hay valores atípicos.

Intervalos de confianza del 95,0% para la media

Límite Inferior

Límite Superior

Estándar

43,4026

58,2641

Winsorizada

42,5217

57,2783

No hay grandes diferencias. No hay atípicos.

Valores Ordenados

Valores Estudentizados

Valores Estudentizados

Modificados

Fila

Valor

Sin Supresión

Con Supresión

Valor-Z DAM

27

7,0

-2,20269

-2,4622

-3,03525

16

16,0

-1,75043

-1,8853

-2,4282

20

28,0

-1,14741

-1,19472

-1,6188

17

31,0

-0,996655

-1,03153

-1,41645

30

32,0

-0,946404

-0,977757

-1,349

...

9

66,0

0,762148

0,78287

0,9443

2

67,0

0,8124

0,835692

1,01175

4

78,0

1,36517

1,43624

1,7537

29

84,0

1,66668

1,7849

2,1584

15

109,0

2,92296

3,56338

3,84465

...

Descargar como (para miembros actualizados) txt (10 Kb) pdf (464 Kb) docx (920 Kb)
Leer 4 páginas más »
Disponible sólo en Clubensayos.com