INTRODUCCIÓN A LA ESTADÍSTICA
olivaraldo5 de Septiembre de 2014
4.070 Palabras (17 Páginas)215 Visitas
CONCEPTOS GENERALES SOBRE ESTADÍSTICA
Qué significa Estadística?
Si buscamos en el Diccionario de la Real Academia Española de la Lengua (DRAE) el vocablo Estadística aparecen tres acepciones de dicha palabra:
1. Estudio de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación de las sociedades humanas.
2. Conjunto de estos datos.
3. Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades.
Probablemente el más común de los significados conocidos de la palabra sea el segundo, y por ello solemos ver en los medios de comunicación que cualquier recopilación de cifras referentes a algún asunto es llamado (de forma muy reduccionista) estadística o estadísticas. Sin embargo, el valor real de la Estadística como ciencia tiene que ver mucho más con la primera y la tercera acepción del DRAE. Concretamente, el primero de los significados se corresponde con lo que vamos a estudiar como Estadística Descriptiva, donde la Estadística se utiliza para resumir, describir y explorar datos, y el tercero con lo que denominaremos Inferencia Estadística, donde lo que se pretende mediante la Estadística es utilizar datos de un conjunto reducido de casos para inferir características de éstos al conjunto de todos ellos.
Clasificación de la Estadística
La Estadística como disciplina o área de estudio comprende técnicas descriptivas como inferenciales. Incluye la observación y tratamiento de datos numéricos y el empleo de los datos estadísticos con fines inferenciales.
Para su estudio se clasifica de la siguiente forma:
Descriptiva
Inferencial
La Estadística es el estudio científico relativo al conjunto de métodos encaminados a la obtención, representación y análisis de observaciones numéricas, con el fin de describir la colección de datos obtenidos, así como inferir generalizaciones acerca de las características de todas las observaciones y tomar las decisiones más acertadas en el campo de su aplicación.
Estadística Descriptiva
El origen de la Estadística descriptiva puede relacionarse con el interés por mantener registros gubernamentales hacia fines de la Edad Media. Cuando los estados nacionalistas empezaron a surgir durante ese período, se volvió necesario obtener información acerca de los territorios bajo la jurisdicción de cada nación. Esta necesidad de información numérica acerca de los ciudadanos y recursos lleva al desarrollo de técnicos para obtener y organizar datos numéricos. Hacia fines del siglo XVII, ya existían investigaciones semejantes a nuestros censos modernos. Al mismo tiempo, las compañías de seguros empezaban a recopilar tablas de mortalidad para determinar las primas de seguros de vida. En las primeras etapas de desarrollo, la estadística incluía poco más que la obtención, clasificación y presentación de datos numéricos. Aún hoy en día, estas actividades siguen siendo una parte importante de la Estadística. A continuación se da una definición de Estadística Descriptiva.
“La Estadística Descriptiva es el estudio que incluye la obtención, organización, presentación y descripción de información numérica”.
Estadística Inferencial
Son estudios realizados para elaborar y manejar grandes números con el fin de extraer conclusiones válidas para aplicar determinadas medidas o decisiones razonables en un grupo, basadas en dicho análisis; estos estudios extraen consecuencias globales a partir de estudios parciales, para esto recoge, organiza, resume y analiza datos. Intenta tomar decisiones basadas en la aceptación o rechazo de ciertas relaciones que se toman como hipótesis, esta toma de decisiones va acompañada de un margen de error. Utiliza técnicas especiales para conocer los elementos de un conjunto a partir de los datos de un subconjunto del mismo. Sus precursores son Francis Galton y Karl Pearson a finales del siglo XIX y a comienzos del XX. Actualmente se aplica en la medicina, biología, economía, ciencias de la educación, psicología, química.
Esta rama de la estadística está basada en la teoría de probabilidades. Se inició como una técnica para conocer cuales son las combinaciones más favorables en los juegos de azar y actualmente estudia la probabilidad de éxito de las diferentes soluciones posibles de un problemas, para lo cual utiliza los datos observados en una o varias muestras de una población. Emplea un modelo matemático para inferir el comportamiento de la población total, partiendo de los resultados obtenidos en las observaciones de las muestras.
Para concluir diremos que existe otra gran división de las técnicas estadísticas:
a) Estadística Paramétrica.
b) Estadística No Paramétrica.
La Estadística Paramétrica es un conjunto de técnicas desarrolladas para niveles altos de medición como el de intervalos. Los métodos paramétricos permiten hacer inferencias acerca de parámetros poblacionales de las distribuciones. Estos métodos fueron los primeros en ser desarrollados por los investigadores de la Estadística.
La Estadística no paramétrica es un conjunto de técnicas diseñadas para niveles de medición menores, por ejemplo, el nominal y ordinal, para efectuar estimaciones no habrá parámetros en estricto sentido. A los procedimientos estadísticos que no dependen para su validez de la forma funcional de la distribución original de la población se les denomina procedimientos no paramétricos o libres de distribución.
Los Procedimientos No Paramétricos disponibles actualmente ofrecen varias ventajas para el investigador y analista de datos; entre ellos se pueden mencionar los que estableció Bradley en 1968:
1) La mayoría de los procedimientos no paramétricos se basan en un conjunto mínimo de suposiciones y esto tiende a reducir la posibilidad de utilizarlos inadecuadamente.
2) Los cálculos aritméticos necesarios para la aplicación de muchos procedimientos no paramétricos son cortos y fáciles, de manera que con su empleo se puede ahorrar tiempo.
3) Los procedimientos no paramétricos son por lo general fácilmente comprensibles para personas no muy formadas matemática o estadísticamente.
4) Se pueden aplicar los procedimientos no paramétricos cuando los datos que se van a analizar consisten más bien en rangos o conteos de frecuencia tales como porcentaje de pruebas, estatura, peso, longitud, entre otras.
Definiciones básicas
Se denomina población a un conjunto de individuos o casos, objetivo de nuestro interés. Podemos distinguir entre poblaciones tangibles y poblaciones conceptuales. Una población es tangible si consta de elementos físicos reales que forman un conjunto finito. Por ejemplo, si estamos considerando el estudio de la altura de los alumnos de la Escuela, el conjunto de estos alumnos es una población tangible. Una población conceptual no tiene elementos reales, sino que sus casos se obtienen por la repetición de un experimento. Por ejemplo, cuando planteábamos las pruebas sobre placas de silicio, vemos que hay tantos casos como pruebas puedan hacerse, lo que supone un conjunto infinito de casos. En poblaciones conceptuales es imposible, por tanto, conocer todos los casos, y tenemos que conformarnos con muestras de los mismos.
Una variable o dato es una característica concreta de una población. Por ejemplo: Si consideramos la población de todos los alumnos de la Escuela, podemos fijarnos en la variable altura. Si consideramos el supuesto de las pruebas sobre placas de silicio, podemos considerar la variable espesor de la capa de óxido de silicio generada.
Se denomina muestra a cualquier subconjunto de datos seleccionados de una población. El objetivo de una muestra, ya sea en una población tangible o en una población conceptual es que los elementos de la muestra representen al conjunto de todos los elementos de la población. Esta cuestión, la construcción de muestras adecuadas, representativas, es uno de los aspectos más delicados de la Estadística. En una muestra aleatoria simple, todos los elementos de la población deben tener las mismas posibilidades de salir en la muestra y, además, los elementos de la muestra deben ser independientes: el que salga un resultado en la muestra no debe afectar a que ningún otro resultado salga en la muestra. Por ejemplo, podríamos estar interesados en la población de todos los españoles con derecho a voto (población tangible, pero enorme), de los que querríamos conocer un dato o variable, su intención de voto en las próximas elecciones generales. Dado que estamos hablando de millones de personas, probablemente deberemos escoger una muestra, es decir, un subconjunto de españoles a los que se les realizaría una encuesta. Si queremos que esa muestra sea aleatoria simple, deberemos tener cuidado de que todos los españoles con derecho a voto tengan las mismas posibilidades de caer en la muestra y de que la respuesta de un entrevistado no afecte a la de ningún otro.
El tratamiento de los datos. Estadística descriptiva
Obtenidos a través de encuestas, experimentos o cualquier otro conjunto de medidas, los datos estadísticos suelen ser tan numerosos que resultan prácticamente inútiles si no son resumidos de forma adecuada. Para ello la Estadística utiliza tanto técnicas gráficas como numéricas, algunas de las cuales describimos en este capítulo. Podemos decir que existe una clasificación, un tanto artificial, de
...