ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Metodos Estadísticos

ayleenvc29 de Mayo de 2013

3.192 Palabras (13 Páginas)323 Visitas

Página 1 de 13

Métodos Cuantitativos para la Toma de Decisiones

Informe Análisis Regresión Simple:

Relación entre el consumo de combustible en vehículos y otras variables.

Indice

Introducción 3

1 Determinación de la muestra 4

1.1 Población 4

1.2 Campos de la base de datos 4

1.3 Muestra 4

1.4 Variable dependiente 6

1.5 Variable independiente 7

1.5.1 Análisis descriptivo muestral 7

2 Selección de la variable predictora y regresión lineal 9

2.1 Criterios de Selección 9

2.2 Análisis de varianza entre consumo y peso 10

2.3 Modelo de ajuste 11

2.4 Análisis de puntos aberrantes 13

2.5 Validación de supuestos 15

2.5.1 Homocedasticidad 15

2.4.2 Supuesto de errores no correlacionados 15

2.5.3 Supuesto de Normalidad 17

Conclusiones 19

Anexo 20

Anexo 1 - Base de datos 21

Introducción

El presente trabajo desarrolla un estudio estadístico realizado sobre el consumo de combustible de los vehículos versus otras variables explicativas.

En particular el estudio busca establecer un modelo de regresión lineal simple, que relacione los galones por milla que consume un vehículo con otras variables que puedan explicar su comportamiento, como son la aceleración (tiempo que los vehículos tardaron en alcanzar una velocidad de 60 milla/hora), la potencia (en caballos de fuerza), el displacement (capacidad de cilindros en pulgadas cúbicas) y peso del vehículo (libras).

Establecer un modelo de regresión lineal, implica realizar adecuados procedimientos para la obtención de la muestra y la aprobación de los supuestos bajo los cuales el modelo establecido es válido.

Para cumplir este objetivo se usó el software estadísticos R y la ayuda de excel. Estos programas poseen herramientas para aplicar distintos test estadísticos, los cuales son analizados detalladamente en este trabajo, además de realizar la regresión y generar una variedad de gráficos, entre otras funciones.

Se estableció un nivel de significancia del 5%, para las pruebas de hipótesis realizadas en este estudio.

En primer lugar se procederá a describir cómo se realizó el muestreo, para ello de explicará el contexto en el cual se enmarca el estudio y los procedimientos utilizados para determinar la muestra. Además de identificar la variable respuesta, las variables predictoras y un breve análisis descriptivo.

Luego de eso se detallará el tratamiento de puntos atípicos y la validación de los supuestos del modelo de regresión lineal (Homocedasticidad, Errores no Correlacionados y Normalidad de Errores).

Finalmente se presentará el modelo de regresión lineal simple realizado y las conclusiones obtenidas de este informe.

Determinación de la muestra

Para determinar la muestra se detallará a continuación los procedimientos y las especificaciones realizadas en cuanto a las observaciones recolectadas para el estudio.

Población

La población es el conjunto de todos los elementos que son objeto del estudio estadístico. En este caso no corresponde a todos los vehículos del mundo pero si a cierto conjunto que paso por un determinado lugar en Estados Unidos, específicamente en un taller mecánico, de los cuales se registraron algunos datos asociados al rendimiento de los vehículos en el año 78. El tamaño de la población es igual a 150 datos.

Campos de la base de datos

La base de datos tiene los siguientes campos; consumo (galones/milla), cilindraje, displacement (pulg3), potencia (hp), aceleración (tiempo en alcanzar 60 mill/hr), peso (lb), marca y modelo. Pero sólo fueron seleccionados para realizar el estudio la potencia, la aceleración, el peso y displacement.

Muestra

El objetivo de este estudio es analizar las influencias de ciertas variables sobre el consumo de los vehículos en galones por millas. Y como primer paso, con los datos que se tienen se realiza previamente una estadística descriptiva de la población. Ver tabla 1.1.

Tabla 1.1 – Estadística descriptiva de la población de las galones por milla.

Estadistica descriptiva

Media 0,03733235

Error típico 0,00084612

Mediana 0,03460249

Moda 0,02777778

Desviación estándar 0,01036282

Varianza de la muestra 0,00010739

Curtosis -0,5426974

Coeficiente de asimetría 0,69887762

Rango 0,0430569

Mínimo 0,02145923

Máximo 0,06451613

Suma 5,59985186

Cuenta 150

Basándonos en estos datos es que se consideró pertinente utilizar un error absoluto (d) de 0,1036 [galones/milla] que corresponde a un 10% de la desviación estándar poblacional (σ) y además se había establecido a priori un α de 5%. Utilizando la fórmula mostrada a continuación, se determinó el tamaño de muestra mínimo que permitía cumplir con las especificaciones antes mencionadas es de 385 observaciones.

n=((Z_(1-α/2)*σ)/d)^2

El tamaño de la muestra es de 385 observaciones, pero como este tamaño es mayor que la población se hará un ajuste de la muestra con la siguiente fórmula:

n"ajustado"=(N/(1+N/n))

Luego de ajustar la muestra, el tamaño de la muestra es de 108 observaciones.

El tipo de muestreo para seleccionar la muestra es un muestreo estratificado, pues la población no es homogénea, ya que los autos son de diferentes marcas, esto viene dado porque los autos tienen distinta procedencia, por tanto la calidad y los procesos internos mecánicos podrían variar de una a otra. Por lo mismo se mantuvo la proporción de muestras según marcas.

La proporción considerando la población de 150 observaciones y el tamaño de la muestra como 108, se procedió a calcular una razón entre ambas, ésta es de 0,72.

A continuación se muestra en un resumen cómo se seleccionaron las muestras.

Tabla 1.2 – Resumen de selección de muestra.

Marca Población Muestra

Nro datos Concentración Nro datos

AMC 5 3% 4

Audi 3 2% 2

Buick 7 5% 5

Cadillac 1 1% 1

Chevrolet 14 9% 10

Chrysler 3 2% 2

Datsun 12 8% 9

Dodge 13 9% 9

Fiat 1 1% 1

Ford 15 10% 11

Honda 9 6% 7

Mazda 9 6% 6

Mercedes 2 1% 1

Mercury 5 3% 4

Nissan 1 1% 1

Oldsmobile 6 4% 4

Peugeot 3 2% 2

Plymouth 9 6% 6

Pontiac 5 3% 4

Saab 1 1% 1

Subaru 2 1% 1

Toyota 11 7% 8

Triumph 1 1% 1

Volkswagen 10 7% 7

Volvo 2 1% 1

Total 150 100% 108

La muestra aleatoria fue seleccionada sin reposición, y sin seguir ningún patrón, con la función de aleatorio, que provee excel, se escogieron las muestras dentro de cada estrato de la población.

Variable dependiente

Como se ha mencionado anteriormente, la variable cuyo comportamiento se desea explicar es el consumo de combustible (en galones por milla). El registro se hizo durante el tiempo en que un vehículo alcanzaba los 60 millas/hora.

Variable independiente

Utilizando tanto la experiencia personal como la lógica, se propone que las variables que explican el consumo de un vehículo son; la potencia, la aceleración, peso y displacement.

Análisis descriptivo muestral

A continuación se presenta las tablas de resumen con la estadística descriptiva de cada una de las variables en estudio.

Tabla 1.3 – Estadística descriptiva muestral de las variables independientes.

Potencia Aceleración

Media 89,1574074 Media 16,3111111

Error típico 2,36095365 Error típico 0,23410469

Mediana 87 Mediana 15,95

Moda 90 Moda 16,4

Desviación estándar 24,53575 Desviación estándar 2,43288734

Varianza de la muestra 602,003029 Varianza de la muestra 5,91894081

Curtosis 0,43022715 Curtosis 0,58203334

Coeficiente de asimetría 0,89219128 Coeficiente de asimetría 0,62528743

Rango 117 Rango 13,5

Mínimo 48 Mínimo 11,3

Máximo 165 Máximo 24,8

Suma 9629 Suma 1761,6

Cuenta 108 Cuenta 108

Peso Displacement

Media 2701,75926 Media 157,231481

Error típico 59,6157316 Error típico 7,09909347

Mediana 2635 Mediana 135

Moda 1985 Moda 151

Desviación estándar 619,544857 Desviación estándar 73,7759435

Varianza de la muestra 383835,829 Varianza de la muestra 5442,88984

Curtosis -0,6355525 Curtosis 0,6184733

Coeficiente de asimetría 0,4552203 Coeficiente de asimetría 1,20137151

Rango 2605 Rango 282

Mínimo 1755 Mínimo 78

Máximo 4360 Máximo 360

Suma 291790 Suma 16981

Cuenta 108 Cuenta 108

Dentro de las conclusiones que se podrían obtener a partir de las variables

...

Descargar como (para miembros actualizados) txt (24 Kb)
Leer 12 páginas más »
Disponible sólo en Clubensayos.com