Estadistica proyecto
Jorge Soria CastroTrabajo22 de Octubre de 2015
2.383 Palabras (10 Páginas)347 Visitas
[pic 1]
[pic 2]
ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL
Integrantes: Jorge Soria Castro
Freddy Riera Maldonado
Paralelo: 6
Tema: Proyecto de Estadística
Fecha de entrega: 10/09/2015
Profesor: Ing. Elkin Angulo R.
Término: 2015-2016 1S
INDICE
1. Introducción 1
2. Justificación de la Investigación 2
3. Marco Teórico 3
4. Estadística Descriptiva e Inferencial 10
5. Resultados de Análisis 1
6. Conclusiones 3
7. Recomendaciones
Bibliografía 4
Introducción
En este proyecto se realizará un experimento donde se tomaran muestras de 10 datos, haciendo que una persona camine 15 metros en un suelo de cemento y en césped, alternando sus caminatas entre cemento y césped para evitar sesgos, en el cual se comparará los tiempos en que le toma a una persona caminar en un suelo de cemento y en césped.
Con esos datos utilizaremos la estadística descriptiva que nos ayudará a estudiar de manera más detallada tales resultados como sus varianzas, medias, desviaciones, quartiles que nos permitirá conocer a fondo lo que pasa con los datos de las muestras.
También haremos uso de la estadística inferencial para realizar hipótesis, determinar si existe o no una diferencia entre caminar en césped o no y así conocer cómo puede variar esos resultados si se tomara más muestras en el experimento.
Al estudiar esas muestras y utilizar el estudio estadístico, tomaremos decisiones con las cuales rechacemos una hipótesis o otra y probemos si tiene bases estadísticos con los cual podamos justificar e interpretar los resultados. También nos ayudaremos de programas computacionales tales como R, para obtener más información sobre dichos resultados.
Justificación de la Investigación
Objetivo General
- Conocer los usos de la estadística descriptiva e inferencial en un experimento.
Objetivos Específicos
- Identificar si existen diferencias en los tiempos en que una persona se demora caminar en un suelo de cemento y en césped.
- Obtener las medias y desviaciones de los datos de las muestras para compararlas.
- Plantear una hipótesis para obtener evidencia que la respalde o la rechace.
Marco Teórico
La estadística descriptiva es una ciencia que a partir de la organización, recopilación e interpretación de datos, en un experimento, nos permite generar decisiones. Para poder ser analizados por la estadística descriptiva, estos experimentos necesitan cumplir con ciertas condiciones.
- Se conoce el número de resultados posibles del experimento
- Cuando se realiza el experimento se desconoce el resultado específico
- Se puede realizar N veces
A todo experimento que cumple con dichas características se lo conoce como Experimento Estadístico.
Tipos de Datos
Dependiendo de las características a analizar podemos clasificar los datos a recopilar de la siguiente manera:
Datos cuantitativos:
Aquellos que denoten una característica que solo puede expresarse de manera numérica. Ej: Edad, Peso, etc.
Datos Cualitativos:
Aquellos que denoten una característica a manera de cualidad. Ej: Estado Civil, Género, etc.
Los datos cuantitativos dependiendo de su conjunto de referencia se pueden clasificar en:
- Datos Discretos:
Cuando su conjunto referencial son los enteros. Ej: Número de hijos, Número de familiares, etc.
- Datos Continuos:
Aquellos tienen como conjunto referencial a todos los números reales. Ej: Edad, Peso, Ingresos etc.
Al momento de analizar un experimento resulta de suma utilidad realizar una tabla para organizar los datos recopilados. A esta tabla se la conoce como Tabla de Frecuencias.
Esta tabla tiene los siguientes componentes:
Frecuencia Absoluta:
Es la cantidad de veces que se repite un resultado durante un experimento. Se representa como ni.
Frecuencia Relativa:
Es la razón entre la cantidad de veces que ocurre un evento y la cantidad de experimentos realizados en total. Se representa como fi.
Frecuencia Absoluta (acumulada):
Siendo X el valor a analizar, es la suma de las frecuencias absolutas de los valores menores o iguales que X. Se representa como Ni.
Frecuencia Relativa (acumulada):
Siendo X el valor a analizar, es la suma de las frecuencias relativas de los valores menores o iguales que X. Se representa como Fi.
Dependiendo del tipo de variable podemos representar los datos recopilados mediante gráficas que pueden ser:
Histograma:
Es la representación gráfica de una variable, donde la altura de cada barra es proporcional a la frecuencia de los valores representados, ya sea esta acumulada o relativa. [pic 3]
Figura 1: Histograma
Ojiva:
Es un polígono de frecuencias acumulado. Nos permite distinguir el número de valores recolectados que están más allá o a menos que un rango determinado de frecuencias. Se la utiliza para realizar estimaciones.
[pic 4]
Figura 2: Ojiva
Diagramas de Cajas:
Es un diagrama que permite obtener de manera rápida la distribución de los datos que conforman la muestra. Normalmente se lo adosa a la ojiva ya que es un subproducto de la misma. Para graficarlo solo se necesitan los cuartiles y el primer y último término de la muestra. En este gráfico es posible además ver los valores aberrantes.
Estadística Inferencial
Es una rama de la estadística que estudia las muestras, su comportamiento y sus propiedades. Tiene como objetivo generalizar las propiedades de la población bajo estudio, basado en los resultados de una muestra representativa de la población.
Población De Interés:
Conjunto de todas las unidades de investigación con una o más características de interés.
Parámetros:
Características de interés a investigar, suele ser necesario el uso de proporciones.
Muestra:
Subconjunto representativo de una población.
Estimadores:
Equivalente muestral del parámetro a estudiar. Cada estimador tiene un nivel de sesgo, error y varianza propias.
Características de Estimadores:
Dependiendo de los parámetros y sus características los estimadores se dividen en:
Sesgo:
Sea Ө un parámetro poblacional y Ô un estimador de Ө. Entonces el sesgo se define como: B(Ô) = E(Ô)- Ө
Varianza:
Sea Ө un parámetro poblacional y Ô un estimador de Ө. Entonces la varianza se define como: Var(Ô) = E(Ô –E(Ô))²
Error Cuadrático Medio:
Sea Ө un parámetro poblacional y Ô un estimador de Ө. Entonces el ECM se define como: ECM(Ô) = E(Ô – Ө)²
ECM(Ô) = Var(Ô) - B(Ô)²
Al momento de analizar un experimento se necesita proponer una o dos hipótesis que luego serán refutadas o aceptadas en base a los datos estadísticos.
Hipótesis:
Es la teoría a comprobar, evalúa uno o varios parámetros de una o más poblaciones.
Hipótesis nula (Ho):
Siempre relaciona un parámetro mediante una igualdad.
Hipótesis Alterna H(1):
Dependiendo de la relación (mayor o menor que, diferente) puede ser denominada de una o dos colas respectivamente.
Estadístico de Prueba:
Medida cuantitativa que proviene de una muestra de datos de tal manera que se permita inferir sobre la población original.
...