ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Estadistica Parametrica


Enviado por   •  7 de Septiembre de 2012  •  2.680 Palabras (11 Páginas)  •  718 Visitas

Página 1 de 11

ESTADÍSTICA NO PARAMÉTRICA

Una característica común de las técnicas que se han visto hasta el momento es que en todas ellas se ha supuesto una función de probabilidades para las variables aleatorias que integran la muestra. Más aún, es muy común que el modelo probabilístico que se adopta sea el Normal. En muchos casos este supuesto se justifica, mientras que en otros casos es absurdo. Las técnicas de la Estadística no Paramétrica se caracterizan porque su aplicación no depende de un modelo probabilístico específico, sino que son válidas bajo condiciones distribucionales muy amplias. La estadística en donde las técnicas dependen de un modelo probabilístico específico se llama Estadística Paramétrica.

Otro aspecto de las técnicas de la Estadística Paramétrica es que invariablemente hacen uso de la media y de la varianza muestrales. Esto puede ser una limitación muy severa ya que el cálculo de la media y de la varianza requiere realizar operaciones aritméticas tales como la suma y el producto con elementos de la muestra. Sin embargo, en muchas ocasiones los datos que se obtienen no admiten la operación de suma ni mucho menos la de multiplicación.

Ejemplo 1. En una encuesta para estudiar el grado de religiosidad de una población se tomaron dos muestras, una de campesinos y otra de empleados. Las muestras son de tamaño 10 y 8 respectivamente. Medir la religiosidad de una persona es más complicado que medir su estatura, por lo que el investigador hace una serie de preguntas a cada entrevistado y de acuerdo con sus respuestas le asigna uno de los siguientes cinco grados de religiosidad en orden ascendente:

Fanático antireligioso J

Moderadamente opuesto a la religión O

Indiferente I

Moderadamente religioso R

Fanático religioso F

Las muestras obtenidas son: 1) Campesinos: R I,R,O,R,F,R,R,F,F y 2) Empleados: I,I,O,J,R,R,I,I.

Si se quieren analizar estos datos muestrales con las técnicas de la estadística paramétrica, se requiere calcular la media y la varianza muestrales y es claro que no tiene sentido la operación J+O, porque J y O no son números y además el supuesto de normalidad es absurdo, porque la normal es una variable aleatoria numérica contínua.

La prueba de Mann y Whitney

Esta técnica es muy útil para comparar dos poblaciones usando muestras independientes cuando la escala es ordinal. Es decir, se tienen muestras aleatorias de dos poblaciones cuyos elementos denotamos por:

Muestra población 1:

Muestra población 2:

Los supuestos necesarios para usar correctamente la prueba son los siguientes

1. Las muestras aleatorias y son independientes

2. La escala de medición es ordinal

Puesto que la escala es ordinal, se puede calcular la mediana de cada muestra, por lo tanto la hipótesis que puede plantearse involucra la mediana de las poblaciones que se desean comparar. Si X y Y son las variables aleatorias y y las medianas respectivas. De esta manera se tienen tres posibles juegos de hipótesis:

1. en oposición a

2. en oposición a

3. en oposición a

Para construir una estadística de prueba recordemos que la mediana es un parámetro de localización y que la única relación que puede establecerse entre observaciones de escala ordinal, es el ordenamiento por su magnitud. Si se ordenan las n+m observaciones de las dos muestras de acuerdo con su magnitud se pueden obtener muy diversos ordenamientos. Si entonces se espera que las observaciones de las dos muestras se encuentren más o menos uniformemente mezcladas. Si al colocar las n+m observaciones en orden ascendente se encuentra que los elementos de una muestra ocupan las posiciones superiores, es lógico pensar que la población de la que se extrajo esa muestra tiene su distribución de frecuencias concentrada en valores mayores que la otra población, o en términos de hipótesis que tiene una mayor mediana.

La figura 1 proporciona evidencia de que la población de campesinos está desplazada a la derecha de la de empleados en cuanto a su religiosidad.

La lógica de la prueba de Mann y Whitney está basada en el ordenamiento ejemplificado en la figura 1, resumiendo la información del ordenamiento gráfico en una estadística de prueba que pueda usarse para obtener reglas de decisión con niveles de significancia preestablecidos.

De acuerdo con lo anterior, se define el rango de una observación, como el lugar que le corresponde en el ordenamiento de todas las observaciones, por lo que una observación tiene más rango si es mayor que otra. Toda la información de la muestra se sintetiza en la suma de los rangos de los datos. Es decir, para la muestra se tienen los rangos y además la estadística . Es claro que un valor grande de apoya la hipótesis de que es mayor que y además, dada la naturaleza ordinal de las mediciones, toda la información pertinente sobre la mediana de X se encuentra en .

Ejemplo 2. Supóngase que se tienen muestras aleatorias de dos poblaciones cuyos modelos probabilísticos se identifican mediante los nombres de las variables X y Y. Las observaciones son:

X: 9, 8, 12, 7, 10, 15, 11, 19, 2, 23 ; n=10

Y: 0, 14, 6, 1, 20, 5, 3 ; m=7

La asignación de rangos se puede hacer con base en la siguiente tabla.

2

7

8

9

10

11

12

15

19

23 0

1

3

5

6

14

20

3

7

8

9

10

11

12

14

15

17 1

2

4

5

6

13

16

Obsérvese que y son variables aleatorias ya que dependen de valores aleatorios y contienen la información necesaria para probar hipótesis con respecto a las medianas de dos muestras independientes. De acuerdo con lo anterior Mann y Whitney en sus trabajos de investigación construyeron la siguiente variable aleatoria:

Obsérvese que es una estadística de prueba ya que en primer lugar es una variable aleatoria, puesto que depende de y en segundo lugar, no depende de parámetros desconocidos. Mann y Whitney encontraron que la variable aleatoria es simétrica y que el valor esperado (media) y la varianza están dados por las siguientes fórmulas:

También calcularon tablas para poder definir la zona de rechazo de una prueba estadística que involucra las medianas de dos muestras independientes, dado un nivel de significancia preestablecido para la prueba. De esta manera, para probar cualquiera de los siguientes juegos de hipótesis:

1. en oposición a

2. en oposición a

3. en oposición a

Las reglas de decisión para una prueba con nivel de significancia son:

a) La hipótesis 1 se rechaza si > o si < nm-

b) La hipótesis 2 se rechaza si >

c) La hipótesis 3 se rechaza si < nm-

Donde y son valores de las tablas de Mann y Whitney para muestra independientes de tamaño n y m respectivamente y nivel de significancia .

Ejemplo 3. Para comparar dos métodos de alfabetización se toman dos muestras de tamaño 11 y 12 de una población de analfabetas. A los integrantes de la primera muestra se les instruye con el método tradicional (T) y a los de la segunda muestra con un método nuevo (N). Al final de los cursos se registró el número de palabras por minuto que cada individuo lee. Los resultados son los siguientes:

Método T: 60, 71, 41, 38, 72, 69, 75, 39, 90, 62, 70, 58.

Método N: 80, 69, 76, 49, 68, 82, 59, 88, 93, 94, 73.

La hipótesis del investigador es que el método nuevo es más eficiente que el tradicional. Si se identifica al método nuevo como la variable aleatoria Y, la hipótesis a probar es:

en oposición a

Ordenados T: 38, 39, 41, 58, 60, 62, 69, 70, 71, 72, 75, 90

Ordenados N: 49, 59, 67, 68, 73, 76, 80, 82, 88, 93, 94

El cálculo de los rangos se da en la siguiente tabla.

38 1

39 2

41 3

49 4

58 5

59 6

60 7

62 8

67 9

68 10

69 11

70 12

71 13

72 14

73 15

75 16

76 17

80 18

82 19

88 20

90 21

93 22

94 23

Total =113

=163

La estadística de prueba tiene el valor de

Si se considera , entonces de la tabla de Mann y Whitney se obtiene que . Como 35 es menor que 93 entonces se rechaza y por lo tanto se concluye con un nivel de significancia de que el método nuevo de alfabetización es mejor que el tradicional.

La prueba de Mann y Whitney con observaciones repetidas

Una situación muy común al comparar dos muestras independientes es la existencia de datos que se repiten en las muestras. Cuando sucede esto se dice que hay empates. En esta situación Mann y Whitney resolvieron la asignación de rangos de la siguiente manera. Si se tienen r observaciones con el mismo valor, entonces se ordenan las n+m observaciones y se colocan esas r observaciones en seguida de la que tiene el valor inmediatamente menor que ellas. De esta manera, si k es la posición de la observación que precede a las repetidas, entonces el rango que se asigna a cada una de las observaciones repetidas es:

Es decir, el rango que se asigna a las observaciones repetidas es el promedio de los rangos que les corresponderían si estuvieran en orden ascendente.

Ejemplo 4. Supóngase que se tienen dos muestras con sus observaciones ordenadas, una de tamaño 7 y otra de tamaño 9.

X: 1, 3, 5, 5, 7, 9, 15

Y: 0, 4, 5, 8, 10, 15, 17, 19, 23

Obsérvese que hay dos números que se repiten en las muestras, el 5 y el 15, por lo que en este caso se dice que hay dos empates. El cálculo de los rangos se da en la siguiente tabla.

0 1

1 2

3 3

4 4

5 6

5 6

5 6

7 8

8 9

9 10

10 11

15 12.5

15 12.5

17 14

19 15

23 16

Total =47.5

=88.5

Obsérvese que el número 5 se repite 3 veces, por lo que r=3. También obsérvese que el número inmediato que está antes de ellos está en la posición 4, por lo que k=4. De esta manera el rango de los tres números 5 que se repiten es:

Por otro lado, el número 15 se repite dos veces, por lo tanto r=2 y la posición del número que les precede es 11, es decir k=11, por lo tanto el rango se calcula como:

Ejemplo 5. Considere los datos de religiosidad del ejemplo 1, pruebe que el grado de religiosidad de los campesinos es mayor que el de los empleados, asignando números enteros que preserven el orden de las categorías. Fanático antireligioso J=1, Moderadamente opuesto a la religión O=2, Indiferente I=3, Moderadamente religioso R=4 y Fanático religioso F=5.

Si se denotan los campesinos con la letra X y los empleados con la letra Y, entonces los datos muestrales ordenados de acuerdo con la nueva escala son los siguientes:

X: 2,3,4,4,4,4,4,5,5,5 ; Y: 1,2,3,3,3,3,4,4

La tabla de asignación de rangos de acuerdo con el método de las mediciones repetidas es la siguiente:

X Y R(X) R(Y)

1 1

2 2.5

2 2.5

3 5.5

3 5.5

3 5.5

3 5.5

3 5.5

4 9.5

4 9.5

4 9.5

4 9.5

4 9.5

4 9.5

4 9.5

5 11.5

5 11.5

5 11.5

Total 90 44.5

El sentido común indica que el grado de religiosidad debe ser mayor en los campesinos que en los empleados, por lo que la hipótesis estadística a probar es la siguiente:

en oposición a

La estadística de prueba es

En este caso la hipótesis anterior se rechaza si < nm- . Si entonces y como se tiene que . Como 35 no es menor que 21, entonces no se rechaza y se concluye que el grado de religiosidad de los campesinos no es mayor que la de los empleados.

La prueba de Mann y Whitney cuando n o m son mayores de 20

La tabla de Mann y Whitney solo sirve cuando los tamaños de muestra de n y m son menores que 20. Para n o m mayores de 20, Mann y Whitney sugieren normalizar la estadística , restándole la media y dividiendo entre la desviación estándar. Es decir, como,

entonces

se distribuye como una variable aleatoria normal estándar, la cual tiene media cero y varianza uno.

En el caso de que existan empates y n o m son mayores que 20 el valor de la varianza de usada en el denominador de se modifica de la siguiente manera:

donde r es el número de empates y es el número de observaciones en el j-ésimo empate.

Ejemplo 6. Para ilustrar la aproximación normal, se utilizan los datos ejemplo 3, que se refieren a los dos métodos de alfabetización.

Recuérdese que la hipótesis a probar es

en oposición a

Los datos que se tienen son , y

Para aplicar la normalización recuérdese que el valor esperado y la varianza de son

Sustituyendo los datos se tiene que

De tal manera que da como resultado

Si entonces el valor de tablas de una normal que deja a su izquierda una probabilidad de es . Como -1.91 es menor que -1.65 se dice que cae en la zona de rechazo y entonces se rechaza la hipótesis y se concluye que el método nuevo es mejor que el tradicional.

Nótese que si la hipótesis a probar fuese en oposición a entonces y entonces como -1.91 no es menor que -1.96 entonces no se rechaza y se concluye que los métodos de enseñanza tienen iguales resultados.

Ejemplo 7. Considérense los datos muestrales del número de accidentes ocurridos durante 7 días consecutivos en dos carreteras diferentes. Si se supone que la primera carretera se denota con la letra X y la segunda con la letra Y y que los datos observados son los siguientes:

X: 1, 3, 5, 5, 7, 9, 15

Y: 0, 4, 5, 8, 10, 15, 17

Utilizando el método de normalización pruebe que en la carretera X ocurre un menor número de accidentes que en la carretera Y. El juego de hipótesis a probar es

en oposición a

Como existen dos empates la tabla de asignación de rangos es la siguiente

0 1

1 2

3 3

4 4

5 6

5 6

5 6

7 8

8 9

9 10

10 11

15 12.5

15 12.5

17 14

Total =47.5

=57.5

como n=7 y m=7 entonces,

Sustituyendo los datos se tiene que

Como existen dos empates es necesario modificar la varianza de de acuerdo con la siguiente expresión:

donde r es el número de empates y es el número de observaciones en el j-ésimo empate. Los datos que se tienen es que r=2 , y por lo que

El valor de con la varianza corregida por los empates es entonces

Si entonces el valor de tablas de una normal que deja a su izquierda una probabilidad de es . Como -0.64 no es menor que -1.65 se dice que no cae en la zona de rechazo y entonces no se rechaza la hipótesis y se concluye que el número de accidentes que ocurren en la carretera X es menor que en la carretera Y.

...

Descargar como  txt (14.7 Kb)  
Leer 10 páginas más »
txt