DEFINICIONES DE ALGUNOS CONCEPTOS DE ESTADISTICA
Balm24 de Febrero de 2014
5.375 Palabras (22 Páginas)533 Visitas
ESTADÍSTICA INFERENCIAL I
DEFINICIONES POR CAPITULOS:
CAPITULO 1
ALEATORIZACIÒN: técnica utilizada para reducir la influencia no predeterminadle de variables extrañas sobre los resultados del experimento.
BLOQUEO: es una técnica utilizada con el fin de aumentar la precisión del experimento. Se usa cuando se conoce la fuente de variabilidad y se puede controlar. Al controlarla se reduce la variabilidad introducida por esta fuente y se evita que esta influya en la respuesta cuando no se está interesado en el efecto de la misma. Un bloque es una porción del material experimental que debe ser más homogénea que el conjunto completo del material.
DISEÑO DE EXPERIMENTOS: se refiere al proceso de planear el experimento que se desea. Es la adquisición de los datos apropiadamente para analizarlos de manera estadística. Cuando se tiene un proceso para análisis, es importante definirlo correctamente y proceder a buscar el mejor diseño de experimentos, de manera que se le pueda sacar el mejor provecho a los datos colectados por medio del análisis estadístico. Las bases de un diseño de experimentos son: replicación, aleatoriedad y bloqueo.
ERROR ALEATORIO: se produce como consecuencia de realizar el estudio con una muestra en lugar de estudiar a toda la población y generalizar los resultados que hemos obtenido en nuestra muestra a la población. Es un error que se puede cuantificar mediante el cálculo del intervalo de confianza y el nivel de seguridad con el que se da ese intervalo. Este tipo de error será de mayor si conforme la muestra sea más pequeña y disminuirá al aumentar el tamaño muestral, llegando a desaparecer si estudiamos a toda la población.
ERROR EXPERIMENTAL: componente del error aleatorio que refleja los errores del experimentador en la planeación y ejecución del experimento.
EXPERIMENTO: es un cambio en las condiciones de operación de un sistema o proceso, que se hace con el objetivo de medir el efecto del cambio en una o varias propiedades del producto o resultado.
Factores controlables: son variables de proceso que se pueden fijar en un punto o en un nivel de operación.
Factores estudiados: son las variables que se investigan en el experimento para observar cómo afectan o influyen en la variable respuesta.
Factores no controlables: son variables que no se pueden controlar durante la operación normal del proceso.
Matriz de diseño: es el arreglo formado por los tratamientos que serán corridos, incluyendo las repeticiones.
NIVELES: Son los valores que toma un factor en un experimento dado.
PLANEACIÓN: está compuesta por las actividades encaminadas a entender el problema, el diseño y la realización de las pruebas experimentales adecuadas. Un planteamiento claro del problema contribuye a menudo en forma sustancial a un mejor conocimiento del fenómeno y de la solución final del problema.// son actividades encaminadas a entender, delimitar el problema u objeto de estudio y seleccionar variables de respuesta y factores. Concluye con la especificación de los tratamientos a realizar y con la organización del trabajo experimental.
Proceso de deducción: es cuando las consecuencias derivadas de la hipótesis pueden ser comparadas con los datos.
Proceso de inducción: es cuando las consecuencias de la hipótesis original y los datos no están de acuerdo, por lo que se inicia este proceso para cambiar tal hipótesis.
TRATAMIENTO: los diferentes valores que se asignan a cada factor estudiado en un diseño experimental se llaman niveles. Una combinación de niveles de todos los factores estudiados se llama tratamiento o punto de diseño.
REPETICIÓN: es correr más de una vez un tratamiento o una combinación de factores. Es preciso no confundir este principio con medir varias veces el mismo resultado experimental. Repetir es volver a realizar un tratamiento, pero no inmediatamente después de haber corrido el mismo tratamiento, sino cuando corresponda de acuerdo con la aleatorizaciòn. Las repeticiones permiten distinguir mejor que parte de la variabilidad total de los datos se debe al error aleatorio y cual a los factores. Cuando no se hacen repeticiones no hay manera de estimar la variabilidad natural o el error aleatorio, y esto dificulta la construcción de estadísticas realistas en el análisis de los datos.
UNIDAD EXPERIMENTAL: es la pieza(s) o muestra(s) que se utiliza para generar un valor que sea representativo del resultado del experimento o prueba. En cada diseño de experimentos es importante definir de manera cuidadosa la unidad experimental, ya que esta puede ser una pieza o muestra de una sustancia o un conjunto de piezas producidas, dependiendo del proceso que se estudia.
Variable de respuesta: a través de esta(s) variable(s) se conoce el efecto o los resultados de cada prueba experimental.
CAPITULO 2
Error tipo I: para una prueba estadística es el error de rechazar la hipótesis nula cuando es verdadera. La probabilidad de cometer un error tipo I se denota con el símbolo α.
Error tipo II: para una prueba estadística es el error de aceptar la hipótesis nula cuando es falsa y alguna hipótesis alternativa es verdadera. La probabilidad de cometer un error tipo II se denota mediante el símbolo β.
Estadístico: cualquier función de los datos muéstrales que no contiene parámetros desconocidos.
Estadístico de prueba: número calculado a partir de los datos y de H0 cuyo valor permite decidir si se rechaza o no la hipótesis nula.
Estimador puntual: consiste en la estimación del valor del parámetro mediante un solo valor, obtenido de una formula determinada.
Grados de libertad: es un estimador del número de categorías independientes en una prueba particular o experimento estadístico.
Hipótesis estadística: es una afirmación con respecto a una distribución de probabilidad, puede ser una afirmación con respecto a un parámetro.
Inferencia estadística: se le llama al conjunto de procedimientos estadísticos en los que interviene la aplicación de modelos de probabilidad y mediante los cuales se realiza alguna afirmación sobre poblaciones con base en la información producida por muestras.
Intervalo de confianza: o intervalo de estimado es un rango (o intervalo) de valores usados para estimar el valor verdadero del parámetro de la población.
Muestras pareadas: son aquellas en los que los datos de ambas poblaciones se pueden ver como pares porque tienen algo en común y no son independientes.
Potencia de la prueba: es la probabilidad de no cometer el error de segunda especie, es decir, de no equivocarse al aceptar una hipótesis nula verdadera (1-β), es pues, la probabilidad de rechazar la hipótesis nula cuando esta es falsa.
Región de aceptación: es la región que contiene los valores más favorables a H0.
Región de rechazo: es la región que contiene los resultados menos favorables a H0, en el supuesto de que H0 sea verdadera.
Significancia observada: el valor-p, que a menudo se denomina nivel de significancia observado, es el nivel más pequeño en el que se puede rechazar H0.
Significancia predefinida: es el riesgo máximo que se esta dispuesto a correr con respecto al error tipo I.
CAPITULO 3
Análisis de varianza: es una prueba que nos permite medir la variación de las respuestas numéricas como valores de evaluación de diferentes variables nominales.
Contraste: es una técnica que permite comprobar si la información que proporciona una muestra observada concuerda (o no) con la hipótesis estadística formulada sobre el modelo de probabilidad en estudio y, por tanto, se puede aceptar (o no) la hipótesis formulada.
Contrastes ortogonales: se utilizan cuando se tienen un conjunto de tratamientos cualitativos con estructura, de tal forma que es conveniente comparar un tratamiento contra el promedio de otros tratamientos o un conjunto de tratamientos contra otro conjunto de tratamientos.
Cuadrados medios: la suma de cuadrados representa la suma de las variabilidades cuadráticas, pero para poder ser utilizados en comparaciones, necesitamos tener parámetros que estimen la variabilidad cuadrática media. Para conseguir esto, dividiremos las sumas de cuadrados entre sus correspondientes grados de libertad. Los grados de libertad totales son N-1, y estos grados de libertad son iguales a la suma de los grados de libertad ENTRE GRUPOS más los grados de libertad DENTRO de GRUPOS. A las desviaciones cuadráticas medias les llamamos cuadrados medios.
Diagramas de cajas: es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes". Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución. Primero es necesario encontrar la mediana para luego encontrar los 2 cuartiles restantes
Diferencia mínima significativa (LSD): Es usualmente usado para comparar una pareja de medias de tratamientos, pero puede ser utilizado para comparaciones de más de dos medias de tratamientos. Esta prueba determina el valor mínimo necesario para considerar diferentes dos tratamientos y lo utiliza para comparar los diferentes pares de medias que se deseen evaluar. Los pares de medias que se comparan son los que han sido planeados antes de ejecutar el experimento, por ello es una prueba para comparaciones planeadas.
Diseño balanceado: este diseño se caracteriza porque cada sujeto (o cada grupo) es sometido a todas
...