Datos estadísticos
Isaac FelixDocumentos de Investigación18 de Junio de 2023
2.304 Palabras (10 Páginas)215 Visitas
Introducción
La estadística es una disciplina fundamental en el análisis y la interpretación de datos en diversas áreas del conocimiento. Proporciona herramientas y métodos para recopilar, organizar, resumir y analizar información numérica, lo que nos permite extraer conclusiones significativas y tomar decisiones informadas.
En este contexto, los datos estadísticos desempeñan un papel crucial. Representan valores numéricos que se obtienen a partir de mediciones o recopilación de información en una muestra o población. Estos datos pueden presentarse en forma de números, tablas, gráficos u otras representaciones visuales.
El proceso de obtener datos estadísticos se basa en la selección de una muestra representativa de la población de interés. El muestreo es una técnica utilizada para seleccionar una muestra que sea representativa y que permita generalizar los resultados obtenidos al conjunto más amplio de la población. Existen diferentes métodos de muestreo, como el muestreo aleatorio simple, estratificado, por conglomerados, entre otros.
Una vez obtenidos los datos, es necesario analizarlos para sacar conclusiones. Aquí es donde entran en juego diferentes pruebas y técnicas estadísticas, como el chi cuadrado, la prueba T de Student, el coeficiente alfa de Cronbach y el coeficiente alfa de Fisher.
El chi cuadrado es una prueba estadística utilizada para determinar si existe una asociación significativa entre dos variables categóricas. Permite evaluar si las diferencias observadas entre las frecuencias observadas y las esperadas se deben al azar o a una relación real.
La prueba T de Student es una herramienta ampliamente utilizada para comparar las medias de dos grupos y determinar si existen diferencias significativas entre ellos. Se aplica cuando los datos siguen una distribución normal y se desconoce la desviación estándar de la población.
El coeficiente alfa de Cronbach es una medida de confiabilidad o consistencia interna utilizada en la psicometría. Se aplica para evaluar la consistencia de un conjunto de ítems o preguntas en una escala de medición. Cuanto más cercano a 1 sea el coeficiente alfa de Cronbach, mayor será la confiabilidad de la escala.
Por último, el coeficiente alfa de Fisher es una medida de confiabilidad utilizada en el análisis factorial. Evalúa la consistencia interna de un conjunto de variables o ítems en un análisis de componentes principales. Valores más cercanos a 1 indican una mayor consistencia interna
Prueba Estadística Chi Cuadrado
La prueba de chi-cuadrado es un método estadístico utilizado para determinar si existe una diferencia significativa entre las frecuencias esperadas y las frecuencias observadas en una o más categorías. Se usa comúnmente para analizar datos categóricos y para probar hipótesis en varios campos como la biología, la sociología, la economía y la psicología.
La prueba de chi-cuadrado consiste en calcular la suma de las diferencias al cuadrado entre las frecuencias observadas y esperadas, dividida por las frecuencias esperadas. El valor resultante se compara con un valor crítico de una distribución de chi-cuadrado con grados de libertad iguales al número de categorías menos uno. Si el valor calculado excede el valor crítico, entonces hay evidencia para rechazar la hipótesis nula de que no hay una diferencia significativa entre las frecuencias observadas y esperadas.
Figura 1
Formula de Chi Cuadrado o de Karl Pearson
[pic 1]
Fuente: (Romero, 2011)
Oi: Frecuencias observadas. Es el número de casos observados clasificados en una determina celda de la tabla de contingencia.
Ei: Frecuencias esperadas o teóricas. Es el número de casos esperados correspondientes a cada celda de la tabla de contingencia. Se puede definir como aquella frecuencia que se observaría si ambas variables fuesen independientes.
Como en cualquier prueba de contraste estadístico, se intenta rechazar la hipótesis nula y aceptar en consecuencia, la hipótesis alternativa. La hipótesis nula se corresponde con la independencia de las variables, o lo que es lo mismo, que las diferencias entre las frecuencias observadas y esperadas son muy pequeñas, y en consecuencia, el estadístico chicuadrado también obtendrá un valor muy pequeño.
Al contrario, cuando el valor de chi-cuadrado sea muy grande, pensaremos que las diferencias entre nuestros valores observados en el estudio y los esperados teóricamente son tan grandes que el azar no podría explicarlas, y por tanto, rechazaremos la hipótesis nula y aceptaremos la
Existen dos consideraciones especiales en la aplicación de la prueba chi-cuadrado cuando el tamaño muestral es pequeño, y se puedan encontrar celdas con frecuencias esperadas cuyo valor sea inferior a 5.
a) Si al menos el 25% de las frecuencias esperadas es inferior a 5 pero superior a 3, se ha de emplear la prueba chi-cuadrado aplicando la corrección Yates.
b) Por el contrario, si al menos el 25% de las frecuencias esperadas es inferior a 3, se ha de emplear el test exacto de Fisher como alternativa a la prueba chi-cuadrado. alternativa.
La prueba de chi-cuadrado tiene algunas limitaciones, como su sensibilidad al tamaño de la muestra y los supuestos de independencia entre categorías. Por lo tanto, es importante considerar cuidadosamente estos factores al interpretar los resultados de una prueba de chi-cuadrado.
Ejemplo de Aplicación
En una fábrica se producen piezas para repuestos en tres turnos distintos: mañana, tarde y noche. Las piezas pueden resultar de calidad excelente, buena o mediocre. Los resultados de un día de trabajo se muestran a continuación
MAÑANA | TARDE | NOCHE | TOTALES | |
EXCELENTES | 65 | 68 | 62 | 195 |
BUENOS/MEDIOCRES | 35 | 32 | 38 | 105 |
TOTALES | 100 | 100 | 100 | 3000 |
[pic 2]
Conclusión
Dado que = 0,791 < = 5,991 se acepta la hipótesis a hipótesis nula, es decir, existe evidencia para afirmar que la calidad de la pieza fabricada es independiente del turno[pic 3][pic 4]
Dado que p >0, 05 se acepta la hipótesis nula, es decir, existe evidencia para afirmar que la calidad de la pieza fabricada es independiente del turno
T de student
La prueba de T de Student, también conocida como la prueba t de Student o simplemente t-test, es una técnica estadística utilizada para determinar si hay una diferencia significativa entre las medias de dos grupos independientes de datos. (ROSS, 2018)Fue desarrollada por el estadístico británico William Sealy Gosset, quien publicó su trabajo bajo el seudónimo de "Student" debido a las restricciones de confidencialidad de la empresa cervecera en la que trabajaba.
La prueba de T de Student se basa en la distribución t de Student, que es una distribución de probabilidad utilizada cuando el tamaño de la muestra es pequeño y la varianza poblacional es desconocida. Esta distribución tiene forma de campana y se caracteriza por tener colas más gruesas que la distribución normal estándar.
Para realizar la prueba de T de Student, se deben seguir los siguientes pasos:
- Plantear las hipótesis nula (H0) y alternativa (H1): La hipótesis nula establece que no hay diferencia significativa entre las medias de los dos grupos, mientras que la hipótesis alternativa sugiere que sí hay una diferencia significativa.
- Seleccionar un nivel de significancia (alfa): El nivel de significancia es la probabilidad aceptable de cometer un error tipo I, es decir, rechazar incorrectamente la hipótesis nula. Un nivel de significancia comúnmente utilizado es 0.05.
- Calcular la estadística de prueba: La estadística de prueba es el valor t calculado a partir de los datos. Se utiliza una fórmula que tiene en cuenta las medias, las desviaciones estándar y el tamaño de las muestras de ambos grupos.
- Comparar la estadística de prueba con el valor crítico: El valor crítico se obtiene a partir de la distribución t de Student y depende del nivel de significancia y del número de grados de libertad. Si la estadística de prueba es mayor que el valor crítico, se rechaza la hipótesis nula.
- Interpretar los resultados: Si se rechaza la hipótesis nula, se concluye que hay una diferencia significativa entre las medias de los dos grupos. De lo contrario, no se encuentra evidencia suficiente para afirmar que exista una diferencia significativa. (Parra, 2011)
Ejemplo
Supongamos que un investigador quiere determinar si hay una diferencia significativa en la altura promedio entre hombres y mujeres en una población. Para ello, recopila una muestra aleatoria de 50 hombres y 50 mujeres y registra sus alturas en centímetros.
...