Parametro Y Estimador
Ruoss21 de Septiembre de 2011
2.913 Palabras (12 Páginas)1.319 Visitas
Introducción
En nuestro trabajo de Investigación “Parámetro y Estimador” como tema de Estadística inferencial, expondremos los distintos tipos de parámetros como Parámetro de centralización y dispersión, y los estimadores como son por sus propiedades el de sesgo estadístico, eficiencia, consistencia, robustez, la invariancia y otros.
El parámetro consiste en una medida descriptiva de la población total de todas las observaciones de interés para el investigador o en síntesis es toda medida descriptiva de una población. Sus derivados son el Parámetro centralizado que consiste en datos que representan de forma global a la población y el parámetro de dispersión consiste en datos que informan de la concentración o dispersión de los datos respecto de los parámetros de centralización.
El Estimador es un estadístico (esto es, una función de la muestra) usado para estimar un parámetro desconocido de la población. Para cada parámetro pueden existir varios estimadores diferentes. En general, escogeremos el estimador que posea mejores propiedades que los restantes, como insesgadez, eficiencia, convergencia y robustez (consistencia).
Parámetro estadístico.
Es una medida descriptiva de la población total de todas las observaciones de interés para el investigador
Un parámetro es toda medida descriptiva de una población. Algunos ejemplos son: el ingreso promedio de todos los asalariados de Estados Unidos, o la producción total de todas las plantas manufacturadas. EL punto clave para recordad es que un parámetro describe una población.
Pueden ser de dos tipos:
Parámetros de centralización. Son datos que representan de forma global a toda la población. Por ejemplo, si hacemos un examen en la clase y queremos tener una idea global del resultado de dicho examen, ¿cómo lo podríamos hacer? Parece lógico que sumando todas las notas y dividiendo el resultado por el número de alumnos, es decir, lo que todos conocemos como calculando la media.
Media aritmética. Se define la media aritmética como la suma de todos los datos dividida por el número de datos. Se representa por
Para calcular la media aritmética hacemos:
Sin embargo, podemos observar que aparecen datos repetidos y que en un estudio estadístico tenemos los datos agrupados en una tabla en la que aparecen las frecuencias. Por tanto, podemos simplificar el cálculo de la media aritmética con la fórmula:
Si la variable es continua, el cálculo se hace de la misma forma pero utilizando las marcas de clase.
Moda. Se define la moda como el valor de la variable que más se repite, es el decir, aquél que tiene mayor frecuencia absoluta. Se representa por Mo.
Vamos a distinguir para el cálculo de la moda entre variables discretas y continuas.
Si la variable es discreta, el cálculo de la moda no presenta ninguna dificultad, únicamente observamos las frecuencias, vemos cuál es la mayor y la moda será el valor de la variable correspondiente a dicha frecuencia.
En la siguiente escena podemos calcular la moda de una variable discreta.
Sin embargo si la variable es continua la mayor frecuencia absoluta corresponde a un intervalo, del que decimos que es el intervalo modal. Pero si queremos calcular un único valor de la variable para la moda, aplicamos la siguiente fórmula:
en la que Li representa el límite inferior del intervalo modal, c es la amplitud del intervalo y fMo, fMo-1 y fMo+1 son las frecuencias del intervalo modal, el anterior y el posterior.
Mediana. Si ordenamos todos los valores de la variable de menor a mayor, se define la mediana como el valor de la variable que está en el centro. Se representa por Me. Aquí tenemos que comprender que si hay un número impar de valores, habrá un sólo valor central; mientras que si hay un número par de valores habrá dos valores centrales.
También vamos a distinguir para su cálculo entre variable discreta y variable continua.
Si la variable es discreta y el número de datos es impar, la mediana será el dato que ocupe el lugar central.
Si la variable es discreta y el número de datos es par, la mediana será la media aritmética de los dos valores centrales.
Si la variable es continua, no distinguiremos si el número de datos es par o impar, tendremos un intervalo para la mediana. Igual que se ha hecho con la moda podemos suponer que los datos se distribuyen uniformemente en los intervalos y calcular la mediana con la siguiente fórmula:
en la que N representa el número de datos y F se refiere a la frecuencia absoluta acumulada.
Cuartiles, deciles y percentiles. Entre las medidas de centralización y de dispersión podemos citar éstas que tienen el cálculo similar al de la mediana.
Cuartiles. Son valores que dividen a la población en cuatro partes iguales. Los vamos a representar por C1, C2 y C3. Entre cada dos de ellos estará el 25 % de los datos. Lógicamente el segundo cuartil coincidirá con la mediana.
Deciles. Son valores que dividen a la población en diez partes iguales. Los representaremos por Dn. El quinto decil coincide también con la mediana.
Percentiles. Son valores que dividen a la población en cien partes iguales. Los representamos por Pn. Evidentemente los percentiles 25, 50 y 75 coinciden con los cuartiles. Y los percentiles 10, 20 , ... , 90 coinciden con los deciles.
El cálculo de estos parámetros, tanto para variables discretas como para variables continuas, se hace de forma similar al cálculo de la mediana.
Si la variable es discreta, para calcular un percentil, calcularemos el porcentaje de datos que corresponde a dicho percentil, es decir para calcular el percentil de orden "p", calcularemos p•N/100. Si este valor no coincide con ninguna de las frecuencias absolutas acumuladas, cogemos el primer valor de la variable cuya frecuencia absoluta acumulada supera este dato. Pero si este valor coincide con una frecuencia absoluta acumulada, el percentil buscado será la media aritmética entre el valor de la variable correspondiente y el siguiente.
Si la variable es continua aplicamos la siguiente fórmula muy similar a la utilizada para el cálculo de la mediana:
Parámetros de dispersión. Son datos que informan de la concentración o dispersión de los datos respecto de los parámetros de centralización.
Por ejemplo, vamos a suponer que hemos realizado el mismo examen en dos grupos distintos. En uno, todos los alumnos han sacado la misma nota, un 5; en otro, la mitad de los alumnos ha sacado un 0 y la otra mitad un 10. ¿Cuál es la media en los dos casos? ¿Se pueden considerar los dos grupos iguales si la media coincide?
Parece entonces que no es suficiente con las medidas de centralización, hace falta otros parámetros que informen sobre la mayor o menor concentración de los datos.
Recorrido. Se define el recorrido como la diferencia entre el mayor y el menor de los valores de la variable. Se representa por R. Nos indica un intervalo en el que están comprendido todos los datos.
A veces puede ocurrir que hay valores de la variable, excesivamente pequeños o grandes que hacen que la información que proporciona el recorrido sea equivocada, por ejemplo si en la estatura tenemos todos los alumnos y alumnas con una estatura normal y uno o una mide alrededor de dos metros. Para estos casos es más útil el siguiente parámetro.
Recorrido intercuartílico. Es la diferencia entre los cuartiles tercero y primero. Se representa por RI (RI=C3-C1) y representa la amplitud del intervalo en el que se encuentra el 50% central de los datos.
Desviación media. Al calcular la media, podemos ver la diferencia que hay entre este parámetro y cada valor de la variable, a la que llamaremos desviación. Podemos definir la desviación media como la media aritmética de todas las desviaciones, pero si la calculamos nos llevaremos la sorpresa de que vale 0. ¿Por qué?
Para evitar esta situación, se define la desviación media como la media aritmética de los valores absolutos de las desviaciones respecto de la media. La podremos calcular con la fórmula:
Varianza. Se define la varianza como la media aritmética de los cuadrados de las desviaciones respecto de la media.
Para calcularla, aplicamos la fórmula:
Si desarrollamos esta fórmula, podemos encontrar otra expresión más sencilla para el cálculo de la varianza:
Desviación típica. Se define la desviación típica como la raíz cuadrada positiva de la varianza.
Estimador
En estadística, un estimador es un estadístico (esto es, una función de la muestra) usado para estimar un parámetro desconocido de la población. Por ejemplo, si se desea conocer el precio medio de un artículo (el parámetro desconocido) se recogerán observaciones del precio de dicho artículo en diversos establecimientos (la muestra) y la media aritmética de las observaciones puede utilizarse como estimador del precio medio.
Para cada parámetro pueden existir varios estimadores diferentes.
...