La Inferencia Estad´ıstica
onekeyTrabajo24 de Mayo de 2014
3.602 Palabras (15 Páginas)984 Visitas
Inferencia
Estad´ıstica
(Teor´ıa y problemas)
I. Espejo Miranda F. Fernandez Palac´ın M. A. L´opez S´anchez M. Mun˜oz M´arquez
A. M. Rodr´ıguez Ch´ıa
A. S´anchez Navas
C. Valero Franco
°c Servicio de Publicaciones. Universidad de C´adiz
I. Espejo Miranda, F. Fern´andez Palac´ın, M. A. L´opez S´anchez, M. Mun˜oz
M´arquez, A. M. Rodr´ıguez Ch´ıa, A. S´anchez Navas, C. Valero Franco
Edita: Servicio de Publicaciones de la Universidad de C´adiz c/ Doctor Maran˜´on, 3. 11002 C´adiz (Espan˜a) www.uca.es/publicaciones
ISBN: 978-84-9828-131-6
Se concede permiso para copiar, distribuir y/o modificar este documento ba jo los t´erminos de la Licencia de Documentaci´on Libre de GNU, Versi´on 1.2 o cualquier otra versi´on posterior publicada por la Free Software Foundation. Una traducci´on de la licencia est´a incluida en la secci´on titulada “Licencia de Documentaci´on Libre de GNU”.
Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation. A copy of the license is included in the section entitled “GNU Free Documentation License”.
Inferencia Estad´ıstica (Revisi´on: Marzo 2007)
I. Espejo Miranda, F. Fern´andez Palac´ın, M. A. L´opez S´anchez, M. Mun˜oz M´arquez, A. M. Rodr´ıguez Ch´ıa, A. S´anchez Navas, C. Valero Franco
°c 2007 Servicio de Publicaciones de la Universidad de C´adiz
http://www.uca.es/teloydisren
Cap´ıtulo 1
La Inferencia Estad´ıstica
1. Introducci´on
En un sentido amplio, se entiende por Inferencia a la parte de la Estad´ıstica que estudia grandes colectivos a partir de una pequen˜a parte de ´estos. El conjunto de individuos que se pretende analizar se denomina poblacion, mientras que la parte que sirve de apoyo para realizar dicho an´alisis se llama muestra. T´ecnicamente la Inferencia consiste en, una vez estudiada la muestra, proyectar las conclusiones obtenidas al conjunto de la poblaci´on. Por motivos obvios, la calidad del estudio que se realice depende, por una parte, de la calidad de la muestra y, por otra, del uso que de ella se haga. La primera de las cuestiones se resuelve a trav´es de la Teor´ıa de Muestras, mientras que en la segunda se utilizan las herramientas suministradas por la Estad´ıstica Descriptiva y el C´alculo de Probabilidades.
A continuacion se dan unas pinceladas que ayudan a comprender algunos de los aspectos de la Teor´ıa de Muestras. Su an´alisis en profun- didad escapa a nuestros objetivos, y resulta fuera de lugar debido a su gran extensi´on y complejidad.
1. Ante todo, una muestra debe ser suficientemente representativa de la poblaci´on de la cual ha sido extra´ıda, tratando de reflejar lo
mejor posible las particularidades de ´esta. Las partes de la citada poblaci´on que no est´en debidamente representadas en la muestra llevan a la aparici´on de sesgos o errores sistem´aticos que viciar´an el proceso de la Inferencia desde el origen. Para alcanzar buenos niveles de representatividad existen distintos tipos de muestreo que, de forma suscinta, se repasan posteriormente.
2. La segunda de las condiciones que se pide a una muestra, es que a trav´es de ella se alcancen unos objetivos de precisi´on fijados de antemano. Esta condici´on tiene que ver con el hecho de que, al no hacerse un estudio exhaustivo, existen m´argenes de error en el calculo de las caracter´ısticas de la poblaci´on, en la determinaci´on de la estructura probabil´ıstica de ´esta, etc. Mayores niveles de pre- cision exigir´an una mayor informaci´on sobre la poblaci´on, es decir, un mayor taman˜o muestral (nu´mero de elementos que componen la muestra).
2. Clasificaci´on de los procedimientos inferenciales
En primer lugar, se ha de hacer notar que la poblaci´on va a venir representada por una variable aleatoria con una determinada distribu- ci´on de probabilidad. Dependiendo del grado de conocimiento de ´esta se distinguen dos m´etodos para realizar el proceso inferencial:
1. Inferencia param´etrica. Es aquella en la que se admite que la distri- bucion de la poblaci´on pertenece a una cierta familia param´etrica de distribuciones, siendo necesario u´nicamente precisar el valor de los par´ametros para determinar la distribuci´on poblacional.
2. Inferencia no param´etrica. No supone ninguna distribuci´on de pro- babilidad de la poblaci´on, exigiendo s´olo hip´otesis muy generales, como puede ser la de simetr´ıa. A su vez los procedimientos no param´etricos se pueden clasificar en:
a ) Procedimientos de localizaci´on, que estudian los par´ametros de localizaci´on de la distribuci´on.
1.3 Naturaleza de la informaci´on extra´ıda de la poblaci´on 3
b ) Procedimientos de estructura, que analizan las condiciones que se dan en la distribuci´on de la variable.
c) Procedimientos sobre las condiciones de la muestra, que com- prueban si se verifican las hip´otesis exigibles a los valores muestrales, como la independencia, ausencia de valores at´ıpi- cos, etc.
Por su parte, la inferencia param´etrica puede ser estudiada desde dos enfoques diferentes:
1. Enfoque cl´asico. En el cual los par´ametros de la distribuci´on de probabilidad de la poblaci´on se consideran constantes.
2. Enfoque bayesiano. Considera a los par´ametros como variables aleatorias, permitiendo introducir informaci´on sobre ellos a trav´es de la distribuci´on a priori.
3. Naturaleza de la informaci´on extra´ıda de la poblaci´on
La introducci´on se ha centrado en lo que se conoce como Teor´ıa de Muestras. Sin embargo, con el objeto de obtener una visi´on m´as global del proceso inferencial, se distinguen dos procedimientos para la obtenci´on de informaci´on. En el primero, dicha informaci´on se obtiene de forma as´eptica, con el s´olo prop´osito de observar las unidades mues- trales, y en el segundo, se establecen las condiciones en las cuales se proceder´a a la medici´on de lo que se conoce como unidades experimen- tales. Formalmente, dicha distinci´on implica dos categor´ıas, la primera de ellas, como ya ha quedado de manifiesto, supone el encontrarse den- tro de la Teor´ıa de Muestras, mientras que la segunda se conoce como Disen˜o de Experimentos.
La Teor´ıa de Muestras, en primer lugar necesita establecer los protocolos que se deben respetar para alcanzar los niveles de represen- tatividad y precisi´on prefijados; a ´esto se le llama disen˜o muestral, que conduce a una muestra potencial. Una vez realizado dicho disen˜o, se pro- cede a la obtenci´on de una o varias muestras mediante la observaci´on,
la medici´on o la encuestaci´on. Estas alternativas est´an directamente re- lacionadas con la naturaleza de los datos: atributos, variables continuas, discretas o de clase, ordenadas o no.
El Disen˜o de Experimentos, por su parte, fue creado por Fisher en la d´ecada de 1920 y en sus or´ıgenes tuvo una clara aplicaci´on al mun- do agr´ıcola, relacionando las condiciones en las que se realizaban los cultivos, que constituyen los denominados factores, con la producci´on obtenida, variable dependiente. El campo de aplicaci´on se ha ido exten- diendo con el paso de los an˜os, teniendo en la actualidad una aplicaci´on generalizada en la mayor´ıa de los campos cient´ıficos. En cualquier caso, en lo que sigue no se considera como objeto de an´alisis, con lo cual los estudios que a continuacion se llevan a cabo se restringen a la Teor´ıa de Muestras.
Antes de continuar, es necesario aclarar algunas cuestiones de vital importancia para entender el desarrollo te´orico que aqu´ı se presenta.
Cuando se plantea realizar un estudio inferencial se debe realizar un disen˜o muestral. Esto implica que cada elemento de la muestra potencial es una variable aleatoria unidimensional, mientras que la muestra es un vector aleatorio de dimensi´on el taman˜o de ´esta. Ademas, no debe confundirse el individuo f´ısico con la caracter´ısti- ca o caracter´ısticas que se desean estudiar de ´este.
Cuando de cada individuo se estudia una u´nica caracter´ıstica se habla de an´alisis univariable o univariante, cuando se estudian dos, bivariable o bivariante y cuando se consideran m´as de dos, multi- variable o multivariante. En lo que sigue, se considerar´a un an´alisis univariable.
Una muestra de taman˜o n ser´a denotada
...