ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Análisis de Regresión. Introducción..

billy140893Informe22 de Noviembre de 2016

3.438 Palabras (14 Páginas)397 Visitas

Página 1 de 14

1.- Análisis de Regresión. Introducción.

Esta importante herramienta se fundamente en dos acciones principales. Primero obtener una ecuación y su línea, recta o curva, que represente la relación entre las dos variables que se estudia. Estas se conocen como ecuación de regresión y línea de regresión. Segundo, calcular para la variable dependiente el valor de la estimación que corresponde a cada valor que se le asigne a la variable independiente, basados en la relación descrita en la ecuación de regresión.

2.- Francis Galton. (Inglés. 16 de febrero de 1822 – 17 de enero de 1911). Primo segundo de Charles Darwin. Reconocido caballero a la edad de 87 años. Contribuyó en diferentes áreas de la ciencia. Fue antropólogo, geógrafo, explorador, inventor, meteorólogo, estadístico y psicólogo. Las investigaciones de Galton fueron fundamentales para la constitución de la ciencia de la estadística:

  • Inventó el uso de la línea de regresión, siendo el primero en explicar el fenómeno de la regresión a la media.
  • En las décadas de 1870 y 1880 fue pionero en el uso de la distribución normal.
  • Inventó la máquina Quincunx, un instrumento para demostrar la ley del error y la distribución normal.
  • Descubrió las propiedades de la distribución normal bivariada y su relación con el análisis de regresión.
  • Descubrió las propiedades de la distribución normal bivariada y su relación con el análisis de regresión.

En su trabajo “Regression towards mediocrity in hereditary stature” publicado en 1885, analizó la relación entre la estatura media de los dos padres de una familia y la estatura media de sus hijos adultos. En un diagrama X-Y (X estatura media de los padres - Y es la estatura media de los hijos adultos), cada punto representa la estatura de una familia. Como era de esperarse los padres altos tienden a tener hijos altos y padres bajos tienden a tener hijos de baja estatura. Pero observó que la estatura de los hijos se desviaba menos de la estatura media de todos los hijos que las estaturas de sus padres de la estatura media de todos los padres. Los padres altos o bajos tienen hijos con estaturas más medianas que ellos mismos. Así, las estaturas de los hijos tienden a regresar hacia la estatura promedio de la población. Galton llamó línea de regresión a la línea que describe la relación promedio entre dos variables.

3.- Conceptos:[pic 1]

  • Diagrama de dispersión. Es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. Los datos se muestran como un conjunto de puntos, cada uno con el valor de una variable que determina la posición en el eje horizontal y el valor de la otra variable determinado por la posición en el eje vertical. Un diagrama de dispersión se llama también gráfico de dispersión.

  • Ecuación de regresión. Útil para calcular tendencias. En estadística la ecuación de regresión lineal o ajuste lineal es un método matemático que modela la relación entre una variable dependiente Y, las variables independientes Xi en un fenómeno aleatorio. Este modelo puede ser expresado como: Línea o curva de regresión. Se dibuja por entre el diagrama de dispersión. [pic 2]

Yr = f(x) = mx + b

Donde [pic 3]

[pic 4]

  • Estimación. Dar un valor aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra. Por ejemplo, una estimación de la media de una determinada característica de una población de tamaño N podría ser la media de esa misma característica para una muestra de tamaño n. 

 

  • Error estándar de regresión. Comúnmente llamado error estándar de estimación. Se calcula utilizando los propios datos y es el promedio estándar de las variaciones de los datos con respecto de la línea de regresión, medidos sobre el eje Y

[pic 5]

  • Estimación corregida (o Rango de confianza en la estimación). Este rango está asociado con una determinada probabilidad o nivel de confianza. Los porcentajes en la estimación son:
  • Estimación ± 1 Syx                68% de probabilidad.
  • Estimación ± 2Syx                95% de probabilidad.
  • Estimación ± 3 Syx                99% de probabilidad.

4.- Leer y resolver juntos el ejercicio de análisis de regresión.

Práctica. En el análisis de los datos que se obtienen al estudiar una situación específica, puede resultar que algunas variables estén relacionadas, y con una dependencia que será más fuerte en algunos casos que en otros. Por ejemplo, si se estudia un grupo de personas, cabe esperar que la relación entre las variables edad y estatura sea más significativa entre personas jóvenes que entre personas adultas. Cuando los datos de las variables se llevan a las coordenadas X-Y, la gráfica que resulta se denomina “diagrama de dispersión” o “nube de puntos”.

  • Primero. Resolver el siguiente ejercicio utilizando el método de “mínimos cuadrados”.

A continuación se presenta una tabla con los datos de las ventas (en millones de pesos) obtenidas por una empresa en los últimos once años:

Año

2001

2002

2003

2004

2005

2006

2007

2008

2009

2010

2011

Ventas

10

20

30

45

70

90

125

150

180

220

270

En esta práctica se realizaran las siguientes acciones:

  1. Elaborar el diagrama de dispersión de los datos.
  2. Calcular la ecuación de regresión lineal, mediante el método de los mínimos cuadrados.
  3. Dibujar sobre la gráfica la línea de regresión basados en la ecuación de regresión.
  4. Estimar la venta para el próximo año dentro de un margen de seguridad.
  5. Calcular el error para la estimación.
  6. Determinar el rango de valores considerando el error en la estimación.

a) En la figura 2 se presenta el diagrama de dispersión (o nube de puntos) con los datos de la tabla 1:

[pic 6]

Figura 2. Diagrama de dispersión.

b) Cálculo de la ecuación de regresión lineal mediante el método de mínimos cuadrados.

En la tabla 2 se presenta la hoja de trabajo necesaria para obtener los datos del método de mínimos cuadrados. Debe observar que los años 2001 al 2011 fueron sustituidos por un número ordinal del 1 al 11. De esa manera se trabaja con cifras más pequeñas y el resultado es idéntico.

x

y

xy

[pic 7]

[pic 8]

1

10

10

1

100

2

20

40

4

400

3

30

90

9

900

4

45

180

16

2025

5

70

350

25

4900

6

90

540

36

8100

7

125

875

49

15625

8

150

1200

64

22500

9

180

1620

81

32400

10

220

2200

100

48400

11

270

2970

121

72900

66

1210

10075

506

208250

Tabla 2. Hoja de trabajo para mínimos cuadrados.

...

Descargar como (para miembros actualizados) txt (21 Kb) pdf (684 Kb) docx (989 Kb)
Leer 13 páginas más »
Disponible sólo en Clubensayos.com