Estadística Descriptiva
RigobertoJr18 de Noviembre de 2013
2.398 Palabras (10 Páginas)285 Visitas
Unidad I: ESTADISTICA DESCRIPTIVA
1.1 ¿Qué es estadística?
¿Qué es estadística? ¿Cómo se aplica y de que manera puede servir en la solución de
algunos problemas en la ingeniería? No se intenta definirla, en su lugar se plantean tres
problemas que se resuelven a través de ella:
1. Supóngase que un ingeniero en carreteras desea estudiar el flujo de vehículos en un
cruce determinado. Podría observar el flujo de vehículos a determinadas horas y días
representativos, para elaborar una estimación del número promedio de vehículos que pasan
por el cruce por hora.
2. La producción de una fábrica se ve afectada, tanto en volumen como en calidad, por
muchos factores a lo largo del proceso de producción. Al tener registros que muestren los
valores de estos factores en el pasado, así como los de la producción actual, se puede
intentar establecer una ecuación predictiva que relacione a la producción con los factores.
3. De un conjunto representativo de clientes, cada uno de ellos es entrevistado para
conocer su opinión con respecto a determinado producto nuevo. De la información
obtenida, el analista de mercados deberá decidir si existe demanda suficiente para el
producto.
Los problemas mencionados ilustran brevemente el hecho de que la estadística en la
ingeniería requiere del uso de información muestral para estimar, predecir y, en última
instancia, para decidir.
En los ejemplos anteriores, el centro de nuestro interés, el gran conjunto de datos se
llama población, y el subconjunto seleccionado de ahí, representa una muestra.
Se ve pues, que el objetivo de la estadística es el de hacer inferencias (predecir, decidir)
sobre algunas características de una población tomando como base la información
contenida en una muestra.
Cuando se desea conocer alguna característica de una población se lleva acabo un censo
y para conocer una característica de una muestra se hace uso generalmente de una
encuesta. ▄
1.2 Términos básicos.
La característica de interés sobre cada elemento individual de una población o muestra se
llama variable. La edad de un estudiante que ingresa a la universidad, el departamento de
procedencia, su estatura y su peso son cuatro variables.
El valor de la variable que corresponde a un elemento de una población o muestra se
llama dato. Este valor puede ser un número, una palabra o un símbolo. Por ejemplo,
Manuel Petronilo Osegueda ingresó a la universidad a la edad de “18” años, procede del
departamento de La Libertad, mide “1.70 Mt.” y pesa “83 Kg.”. Estas cuatro partes de datos
son los valores de las cuatro variables aplicadas a Manuel Petronilo Osegueda.
El conjunto de valores recolectados para la variable de cada uno de los elementos que
pertenecen a la muestra se llaman datos. Por ejemplo, el conjunto de 25 estaturas
recolectadas de 25 estudiantes.
Un experimento es una actividad planeada cuyos resultados proporcionan un conjunto
de datos. El experimento incluye las actividades para seleccionar los elementos y obtener
los valores de los datos.
El valor numérico que resume todos los datos de una población completa se llama
parámetro. La “proporción” de estudiantes que tenían más de 20 años de edad cuando
ingresaron a la universidad es un ejemplo de parámetro. Un parámetro es un valor que
describe a la población. A menudo es utilizada una letra griega para denotar a un
parámetro, por ejemplo: , 2 , la media y varianza poblacional respectivamente.
Para todo parámetro existe un estadístico muestral asociado. El estadístico describe a la
muestra de la misma forma como el parámetro describe la población. El estadístico es el
valor numérico que resume los datos de la muestra. La estatura “promedio” encontrada al
utilizar el conjunto de 25 estaturas es un ejemplo de un estadístico muestral. Casi todos los
estadísticos muestrales se determinan con ayuda de fórmulas y suelen simbolizarse usando
letras del alfabeto español: 2 ,
_
x y s la media y varianza muestral respectivamente.
Ejemplo 1.1. Un estudiante de estadística está interesado en determinar el costo de los
libros de texto para los estudiantes de la facultad de ingeniería de una universidad. Cada
uno de los términos recientemente descritos puede identificarse en esta situación.
1. La población es la colección de todos los libros que pertenecen a todos los estudiantes
de la facultad.
2. Una muestra es cualquier subconjunto de una población. Por ejemplo, una muestra
serían los libros textos que pertenecen a los estudiantes de la escuela de ingeniería civil.
3. La variable podría ser el valor en dólares de un libro texto individual.
4. Un dato podría ser el valor en dólares de un libro texto en particular. El libro del Br.
Rogelio Bernal, por ejemplo, está valorado en $ 20.
5. Los datos serían el conjunto de valores que corresponden a la muestra obtenida (20;
37.50; 10.25;…).
6. El experimento serían los métodos aplicados para seleccionar los libros que integren la
muestra y determinar el valor de cada libro de la muestra. Podría efectuarse preguntando a
cada miembro de la escuela de ingeniería civil, o de otras formas.
7. El parámetro sobre el que se está buscando información es el valor “promedio” de
todos los libros de la población.
8. El estadístico que se encuentra es el valor “promedio” de todos los libros textos de la
muestra.
Básicamente, hay dos clases de variables: 1) variables que obtienen información
cuantitativa y 2) variables que obtienen información cualitativa.
En resumen se tiene lo siguiente:
Variable continua
Variable discreta
Cuantitativo
Jerarquizado
Nomin al
Cualitativo
Dato
Las variables continuas son aquellas que pueden asumir virtualmente cualquier valor en
un determinado intervalo, como el peso w o la altura h de un estudiante.
Una variable discreta es la que asume solo valores, por lo general enteros, como el
número de alumnos N en una asignatura
Las variables nominales comprenden categorías, como: sexo, color de los ojos, campo
de estudios, país, continentes, estudios realizados, etc.
Las variables jerarquizadas son las que comúnmente se refieren a las evaluaciones
subjetivas cuando los conceptos se jerarquizan según la preferencia o logro: en los
concursos, los lugares se jerarquizan en 1er. lugar, 2º. lugar, etc.; las posiciones de los
equipos se les asignan los números 1, 2, 3, . . .
La misma población puede dar origen a diferentes tipos de datos, como en la población
de alumnos de la carrera de Ingeniería Civil de la UES.
Continuo
Discreto
Nominal
Jerarquizado
Peso
Edad
(años)
Sexo
Ciclo
1.3 Ramas de la estadística
Conviene establecer claramente las ramas de la estadística, bien distintas en sus objetivos e
instrumentos de cálculo.
La estadística descriptiva trata con la organización, el resumen y la presentación de
datos. Utiliza métodos gráficos y numéricos para describir un conjunto de datos.
Organiza, resume y simplifica en términos generales información que a menudo es bastante
compleja. Se ocupa de los métodos para organizar y resumir datos.
En la probabilidad, las propiedades de la población en estudio se suponen conocidas, y
se formulan y responden preguntas en relación con una muestra tomada de la población.
En la estadística inferencial, las características de una muestra están disponibles para el
experimentador, y esta información lo capacita para sacar conclusiones respecto de la
población.
La relación entre las dos últimas disciplinas se puede resumir al decir que la
probabilidad razona desde la población hacia la muestra (razonamiento deductivo),
mientras que la estadística inferencial razona desde la muestra hacia la población
(razonamiento inductivo).
La estadística inferencial o simplemente estadística, consiste entonces en el análisis e
interpretación de una muestra de datos. La idea básica del muestreo es medir una pequeña
porción, pero típica de alguna “población”, y posteriormente utilizar dicha información
para inferir que característica tiene la población total. Los tres tipos más importantes de
técnicas inferenciales que estudiaremos son la estimación puntual, la estimación del
intervalo de confianza, y la prueba de hipótesis.
Así pues, en probabilidad se supone que la población es conocida y se calcula la
probabilidad de observar una muestra particular. En estadística, se supone que la muestra es
conocida y, con la ayuda de la probabilidad, se trata de describir la distribución de
frecuencias
...