Estadistica Descriptiva
yarjac7 de Junio de 2014
3.170 Palabras (13 Páginas)372 Visitas
Estadística Descriptiva o Deductiva
Es un proceso mediante el cual se recopila, organiza, presenta, analiza e interpreta datos de manera tal que describa fácil y rápidamente las características esenciales de dichos datos mediante el empleo de métodos gráficos, tabulares o numéricos, así por ejemplo:
Supóngase que un docente de Matemática calcula la calificación promedio de uno de sus cursos a su cargo. Como solo se está describiendo el desempeño del curso pero no hace ninguna generalización acerca de los diferentes cursos, en este caso el maestro está haciendo uso de la Estadística Descriptiva.
POBLACIÓN
Llamado también universo o colectivo es el conjunto de todos los elementos que tienen una característica común.
Una población puede ser finita o infinita. Es población finita cuando está delimitada y conocemos el número que la integran, así por ejemplo: Estudiantes de la Universidad UTN. Es población infinita cuando a pesar de estar delimitada en el espacio, no se conoce el número de elementos que la integran, así por ejemplo: Todos los profesionales universitarios que están ejerciendo su carrera.
MUESTRA
Es un subconjunto de la población. Ejemplo: Estudiantes de 2do Semestre de la Universidad UTN. Sus principales características son:
Representativa.- Se refiere a que todos y cada uno de los elementos de la población tengan la misma oportunidad de ser tomados en cuenta para formar dicha muestra.
Adecuada y válida.- Se refiere a que la muestra debe ser obtenida de tal manera que permita establecer un mínimo de error posible respecto de la población.
Para que una muestra sea fiable, es necesario que su tamaño sea obtenido mediante procesos matemáticos que eliminen la incidencia del error.
Para calcular el tamaño de la muestra suele utilizarse la siguiente fórmula:
Donde:
n = el tamaño de la muestra. N = tamaño de la población.
Desviación estándar de la población que, generalmente cuando no se tiene su valor, suele utilizarse un valor constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor, se lo toma en relación al 95% de confianza equivale a 1,96 (como más usual) o en relación al 99% de confianza equivale 2,58, valor que queda a criterio del encuestador.
e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.
Ejemplo ilustrativo: Calcular el tamaño de la muestra de una población de 1000 elementos.
Solución:
Se tiene N=1000, y como no se tiene los demás valores se tomará o=0,5 , Z = 1,96 y e = 0,05. Reemplazando valores en la fórmula se obtiene:
VARIABLE
Son caracteres susceptibles a cambio y pueden tener diferentes valores en cada elemento o individuo.
Clasificación
- Variable Cualitativa
Son atributos que se expresan mediante palabras no numéricas. Como por ejemplo, profesión, religión, marca de automóvil, estado civil, sexo, raza, etc.
- Variable Cuantitativa
Es toda magnitud representada por números. Como por ejemplo, peso, estatura, número de habitantes, etc.
- Variable Discreta
Es una característica cuantitativa representada por números enteros o exactos, que generalmente resultan del proceso de conteo, como por ejemplo: número de estudiantes de la promoción del año anterior.
- Variable Continua
Es una característica cuantitativa que puede tomar cualquier valor representado por un número racional, que generalmente resultan del proceso de medición, como por ejemplo, tiempo destinado a estudiar Estadística
Niveles de medición
- Nivel Nominal
Cuando los datos sólo pueden contarse y clasificados en categorías, no existe un orden específico entre las clases. Como por ejemplo, se cuentan cuántos hombres y cuántas mujeres asisten a determinado evento.
- Nivel Ordinal
Cuando se ordenan los datos por jerarquías, una categoría es mayor que otra. Como por ejemplo, excelente es mejor que bueno o bueno es mejor que regular. Otro ejemplo: Una persona puede tener mucho o poco dinero.
- Nivel de Intervalos
Cuando se incluye todas las características del nivel ordinal, pero la diferencia entre los valores tiene un significado medido en unidades iguales que son comunes y constantes, que permiten asignar números reales a todos los miembros de la clase ordenada, facilitando el establecimiento de diferencias en grados de propiedad y entre objetos sobre la base de una medida. Como por ejemplo: La diferencia entre 70 kilogramos y 60 kilogramos, es de 10 kilogramos. Otro ejemplo: Si la temperatura de hoy es de 20 grados centígrados y la de ayer fue de 25 grados centígrados, se sabe que la de hoy es 5 grados centígrados más baja que la de ayer.
- Nivel de Razón o Cociente
Este es el nivel de medición "más alto", tiene todas las características del nivel de intervalos y además en este nivel de medición el cero tiene significado (así si se tiene 0 dólares, entonces no se poseen fondos), y la razón (o cociente) entre dos números también es significativa (Un estudiante obtiene una calificación de 3/10 y otro 6/10, el segundo estudiante obtiene el doble que el primero).
Distribuciones de frecuencia
Cuando se dispone de gran número de datos, es útil el distribuirlos en clases o categorías y determinar el número de individuos pertenecientes a cada clase, que es la frecuencia de clase. Una ordenación tabular de los datos en clases, reunidas las clases y con as frecuencias correspondientes a cada una, se conoce como una distribución de frecuencias o tabla de frecuencias. La Tabla 1 es una distribución de frecuencias de alturas (registradas con aproximación de pulgada) de 100 estudiantes de la Universidad XYZ.
La primera clase o categoría, por ejemplo, comprende las alturas de 60 a 62 pulgadas y viene indicada por el símbolo 60 - 62. Puesto que 5 estudiantes tienen una altura perteneciente a esta clase, la correspondiente frecuencia de clase es 5.
Los datos ordenados y resumidos como en la distribución de frecuencia anterior, se suelen llamar datos agrupados. Aunque con el proceso de agrupamiento generalmente se pierde parte del detalle original de los datos, tiene la importante ventaja de presentarlos «todos» en un sencillo cuadro que facilita el hallazgo de las relaciones que pueda haber entre ellos, puestas así de manifiesto.
Intervalos de clase y límites de clase
Un símbolo que define una clase, tal como 60 - 62 de la tabla anterior, se conoce como intervalo de clase. Los números extremos, 60 y 62, son los límites de clase; el número menor 60 es el límite inferior de la clase y el mayor 62 es el límite superior. Los términos clase e intervalo de clase se utilizan a menudo indistintamente, aunque el intervalo de clase es realmente un símbolo para la clase.
Un intervalo de clase que, al menos teóricamente, no tiene límite superior o inferior, se conoce como intervalo de clase abierto. Por ejemplo, al referirse a la edad de grupos de individuos el intervalo de clase, «mayores de 65 años» es un intervalo de clase abierto.
Límites reales de clases
Si las alturas se registran con aproximación de pulgada, el intervalo de clase 60 - 62 teóricamente incluye todas las medidas desde 59,5000... a 62,5000 … pulgadas. Estos números, representados brevemente por los números exactos 59,5 y 62,5, se conocen como límites reales de clase o límites verdaderos de clase; el menor de ellos, 59,5, es el límite real inferior y el mayor de ellos, 62,5, es el límite real superior.
Prácticamente, los límites reales de clase se obtienen sumando al límite superior de un intervalo de clase el límite inferior del intervalo de clase contiguo superior y dividiendo por 2.
A veces, los límites reales de clase se utilizan para simbolizar las clases. Por ejemplo, las diferentes clases de la primera columna de la Tabla 1 podrían indicarse por 59,5 - 62,5, 62,5 - 65,5, etc. Sin embargo, con tal notación aparece una ambigüedad, pues los límites reales de clase no coincidirían con las observaciones reales. Así si una observación fuese 62,5 no sería posible discernir si pertenece al intervalo de clase 59,5 - 62,5 o al 62,5 - 65,5.
TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE
El tamaño o anchura de un intervalo de clase es la diferencia entre los límites reales de clase que lo forman y se conoce como anchura de clase, tamaño de clase o longitud de clase. Si todos los intervalos de clase de una distribución de frecuencias tienen igual anchura, esta anchura común se representa por c. En tal caso, c es igual a la diferencia entre dos sucesivos límites de clase inferiores o superiores. Para los datos de la Tabla 1, por ejemplo, el intervalo de clase es c = 62,5 - 59,5 = 65,5 - 62,5 = 3.
Marca de clase
La marca de clase es el punto medio del intervalo de clase y se obtiene sumando los límites inferior y superior de la clase y dividiendo por 2. Así, la marca de clase del intervalo 60 - 62 es (60 + 62)/2 = 61. La marca de clase se llama también punto medio de la clase.
Para análisis matemáticos posteriores, todas las observaciones pertenecientes a un intervalo de clase dado se suponen coincidentes con la marca de clase. Así, todas las alturas en el intervalo de clase 60 - 62 pulgadas se considerarán como de 61 pulgadas.
Teoría
...