ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Estadistica, Temas Selectos


Enviado por   •  25 de Mayo de 2013  •  1.562 Palabras (7 Páginas)  •  554 Visitas

Página 1 de 7

POLÍGONO DE FRECUENCIA

Es el nombre que recibe una clase de gráfico que se crea a partir de un histograma de frecuencia. Estos histogramas emplean columnas verticales para reflejar frecuencias): el polígono de frecuencia es realizado uniendo los puntos de mayor altura de estas columnas.

Es decir, por tanto, podríamos establecer que un polígono de frecuencia es aquel que se forma a partir de la unión de los distintos puntos medios de las cimas de las columnas que configuran lo que es un histograma de frecuencia. Este se caracteriza porque utiliza siempre lo que son columnas de tipo vertical y porque nunca debe haber espacios entre lo que son unas y otras.

En las ciencias sociales, en las ciencias naturales y también en las económicas es donde con más frecuencia se hace uso de estos mencionados histogramas ya que se emplean para llevar a cabo lo que es la comparación de los resultados de un proceso determinado.

se conoce como polígonos de frecuencia para datos agrupados a aquellos que se desarrollan mediante la marca de clase que tiene coincidencia con el punto medio de las distintas columnas del histograma. En el momento de la representación de todas las frecuencias que forman parte de una tabla de datos agrupados, se genera el histograma de frecuencias acumuladasque posibilita la diagramación del polígono correspondiente.

HISTOGRAMA

Gráfica que muestra la frecuencia de los datos, en la que el eje horizontal representa unidades discretas, ciertos rangos, o intervalos, en tanto que el eje vertical representa la frecuencia. Frecuentemente, se dibujan barras rectangulares con sus áreas proporcionales a las frecuencias dentro de los rangos o de los intervalos.

Histogramas: Se agrupan los datos en clases, y se cuenta cuántas observaciones (frecuencia absoluta) hay en cada una de ellas. En algunas variables (variables cualitativas) las clases están definidas de modo natural, p.e sexo con dos clases: mujer, varón o grupo sanguíneo con cuatro: A, B, AB, O. En las variables cuantitativas, las clases hay que definirlas explícitamente (intervalos de clase).

Se representan los intervalos de clase en el eje de abcisas (eje horizontal) y las frecuencias, absolutas o relativas, en el de ordenadas (eje vertical).

LA OJIVA

La ojiva es el poligono es de frecuencias acumuladas, es decir, que en ella se permite ver cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los números asignados a cada intervalo.

La ojiva apropiada para información que presente frecuencias mayores que el dato que se está comparando tendrá una pendiente negativa (hacia abajo y a la derecha) y en cambio la que se asigna a valores menores, tendrá una pendiente positiva. Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas, existen las ojivas mayor que y las ojivas menor que.

Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por esto la aplicación de la técnica es parcial):

Un extremo de la ojiva no se toca al eje horizontal, para la ojiva "mayor que" sucede con el extremo izquierdo; para la ojiva "menor que", con el derecho.

En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor.

Las siguientes son ejemplos de ojivas, a la izquierda la "mayor que", a la derecha la "menor que", utilizando los datos que se usaron para ejemplificar el histograma:

La ojiva "mayor que" (izquierda) se le denomina de esta manera porque viendo el punto que está sobre la frontera de clase “4:00″ se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se diría, sin errores de gramática: después de las 4:00). De forma análoga, en la ojiva "menor que" la frecuencia que se representa en cada frontera de clase son el número de observaciones menores que la frontera señalada (en caso de tiempos sería el número de observaciones antes de la hora que señala la frontera).

LA VARIANZA

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.

La varianza se representa por .

Varianza para datos agrupados

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Ejercicios de varianza

Calcular la varianza de la distribución:

9, 3, 8, 8, 9, 8, 9, 18

Otra forma para asegurar que las diferencias entre la media y los puntos de un valor positivo, es elevándola al cuadrado. Al promedio de estas distancias al cuadrado se le conoce como varianza.

Varianza (S2 o 2): Es el resultado de la división de la sumatoria de las distancias existentes entre cada dato y su media aritmética elevadas al cuadrado, y el número total de datos.

Distinguimos dos símbolos para identificar la varianza: S2 para datos muestrales, y σ2 para datos poblacionales. Note que la fórmula para la varianza muestral presenta en su denominador al tamaño de la muestra menos uno, tendencia adoptada por los estadísticos para denotar una varianza más conservadora.

Al igual que ocurre con la desviación media, podemos definir las fórmulas para datos agrupados en tablas tipo A y tipo B. Para las tablas tipo A tenemos:

Una advertencia en el uso de esta medida, es que al elevar las distancias al cuadrado, automáticamente se elevan las unidades. Por ejemplo, si unidad trabajada en los datos es centímetros, la varianza da como resultados centímetros al cuadrado.

5.2.1 Ejemplo: Varianza para datos no agrupados

La siguiente muestra representa las edades de 25 personas sometidas a un análisis de preferencias para un estudio de mercado.

25 19 21 35 44

20 27 32 38 33

18 30 19 29 33

26 24 28 39 31

31 18 17 30 27

Determinar la varianza.

SOLUCIÓN

PASO 1: Calcular la media aritmética.

PASO 2: Calcular la varianza

En este punto, la varianza es identificada por S2.

La varianza equivale a 51,8567. Por elevar las unidades al cuadrado, carece de un significado contextual dentro del análisis descriptivo del caso.

5.2.2 Ejemplo: Varianza para datos agrupados

Calcular la varianza a partir de la siguiente tabla de frecuencia (suponga que los datos son poblacionales).

Ni Lm Ls F Mc

1 [15 17) 2 16

2 [17 19) 5 18

3 [19 21) 13 20

4 [21 23) 4 22

5 [23 25] 1 24

Total 25

SOLUCIÓN

PASO 1: Calcular la media aritmética.

PASO 2: Calcular la varianza

En este punto, la varianza es identificada por S2.

DESVIACIÓN ESTÁNDAR

La desviación estándar o desviación típica es la raíz cuadrada de la varianza.

Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.

La desviación estándar se representa por σ.

Desviación estándar para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviación estándar para datos agrupados

Ejercicios

Calcular la desviación estándar de la distribución:

9, 3, 8, 8, 9, 8, 9, 18

Calcular la desviación típica de la distribución de la tabla:

Xi Fi Xi • fi Xi2 • fi

[10, 20) 15 1 15 225

[20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250

[40, 50) 45 9 405 18 225

[50, 60) 55 8 440 24 200

[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

42 1 820 88 050

REGRESION LINEAL

En estadística la regresión lineal o ajuste lineal es un método matemático que modela la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:

: variable dependiente, explicada o regresando.

: variables explicativas, independientes o regresores.

: parámetros, miden la influencia que las variables explicativas tienen sobre el regresando.

Donde es la intersección o término "constante", las son los parámetros respectivos a cada variable independiente, y es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.

Existen diferentes tipos de regresión lineal que se clasifican de acuerdo a sus parámetros:

[editar]Regresión lineal simple

Sólo se maneja una variable independiente, por lo que sólo cuenta con dos parámetros. Son de la forma:4

(6)

Donde es el error asociado a la medición del valor y siguen los supuestos de modo que (media cero, varianza constante e igual a un y con ).

[editar]Análisis

Dado el modelo de regresión simple, si se calcula la esperanza (valor esperado) del valor Y, se obtiene:5

(7)

Derivando respecto a y e igualando a cero, se obtiene:5

(9)

(10)

Obteniendo dos ecuaciones denominadas ecuaciones normales que generan la siguiente solución para ambos parámetros:4

(11)

(12)

La interpretación del parámetro es que un incremento en Xi de una unidad, Yi incrementará en

Regresión lineal múltiple

La regresion lineal nos permite trabajar con una variable a nivel de intervalo o razón, así también se puede comprender la relación de dos o más variables y nos permitirá relacionar mediante ecuaciones, una variable en relación a otras variables llamándose Regresión múltiple. Constantemente en la práctica de la investigación estadística, se encuentran variables que de alguna manera están relacionados entre si, por lo que es posible que una de las variables puedan relacionarse matemáticamente en función de otra u otras variables.

Maneja varias variables independientes. Cuenta con varios parámetros. Se expresan de la forma:6

(13)

Donde es el error asociado a la medición del valor y siguen los supuestos de modo que (media cero, varianza constante e igual a un y con ).

...

Descargar como  txt (9.9 Kb)  
Leer 6 páginas más »
txt