Estadistica Descriptiva
alfredo.novoa9 de Mayo de 2012
8.768 Palabras (36 Páginas)637 Visitas
MEDIA ARITMÉTICA
Es la suma de los valores de una variable dividida por, él numero de ellos. La media aritmética, que se representa con .
La fórmula de la media aritmética es:
Ejemplo:
se obtiene con los siguientes pasos
1. Se suman todos los datos
10 + 3 + 5 + 9 + 6 + 8 + 8 + 7 + 9 + 6 + 8 + 7 =
2. La suma () se divide entre el número de datos (n) :
La media aritmética o promedio de las evaluaciones es 7.16, que es el valor representativo de todos los datos.
MEDIA ARITMÉTICA PONDERADA
A veces se asocia a los números x1, x2,...,xn que se quieren promediar, ciertos factores o pesos w1, w2,...,wn que dependen de la significación o importancia de cada uno de los números. Entonces se genera una media aritmética ponderada, que también se representa con equis testada.
Ejemplo
Supongamos que un alumno quiere encontrar el promedio ponderado de sus cinco calificaciones. La segunda calificación vale el doble de al primera, la tercera el triple de la primera, la cuarta vale cuatro veces la primera y la quinta cinco veces. ¿Cuál es su promedio si sus calificaciones son 8.5, 7.3, 8.3, 6.4 y 9.2?
X1 = 8.5 ; W1 = 1
X2 = 7.3 ; W2 = 2
X3 = 8.3 ; W3 = 3
X4 = 6.4 ; W4 = 4
X5 = 9.2 ; W5 = 5
(8.5*1+7.3*2+8.3*3+6.4*4+9.2*5)
(1+2+3+4+5)
= 119.6/15 = 7.97 es el promedio ponderado de las calificaciones de este alumno
LA MEDIANA
Es la observación que se encuentra en el centro cuando los datos están ordenados, divide a los datos en dos partes iguales.
- Si n es impar:
la mediana es la observación que está en el lugar (n+1)/2, esto es
- Si n es par:
la mediana es el promedio de las observaciones n/2 y n/2+1, esto es
Ejemplo
Encuentra la mediana para el siguiente conjunto de datos
9
12
5
16
8
3
11
1. Primero se ordenan los datos
3
5
8
9
11
12
16
Una vez ordenados, como el número de datos es impar (7), se busca el que tiene la posición (n+1)2, o sea (7+1)2 = 4. Este número es el 9 y representa la mediana.
Ejemplo
Calcula la mediana para el siguiente conjunto de datos
8.3
5.7
9.2
3.9
7.4
11.8
10.6
4.3
Nuevamente se ordenan los datos
3.9
4.3
5.7
7.4
8.3
9.2
10.6
11.8
Una vez ordenados, como el númeo de datos es par (8), se busca el número que tiene la posición n/2 y el que tiene la posición n/2+1, o sea 8/2 = 4 y 8/2+1 = 5. Los números que tienen la posición cuarta y quinta son 7.4 y 8.3. Estos números se promedian y el resultado será la mediana.
(7.4+8.3)/2 = 7.85. Este resultado 7.85 representa la mediana para este conjunto de datos
LA MODA
La moda es el dato que aparece con mayor frecuencia en una colección.
Ejemplo
Si se observa cual es el dato que más se repite en las evaluaciones, se tiene:
3, 5, 6, 6, 7, 7, 8, 8, 8, 9, 9, 10
Que es el ocho. Este valor representa la moda de esta colección, por lo tanto, la moda se refiere al dato que tiene mayor frecuencia.
Nota: Si ninguna observación se repite, se dice que esos datos no tienen moda. Si todos los datos se repiten el mismo número de veces, los datos serán multimodales.
Ejemplo
Encuentra la moda de los siguientes datos
4
9
5
6
7
Como los datos sólo existen una vez, este conjunto de datos no tienen moda.
Ejemplo
Encuentra la moda del siguiente conjunto de datos
9
3
6
7
9
8
5
9
7
3
El 3 se repite dos veces, el 7 se repite también dos veces, pero como el 9 se repite tres veces, este último número es la moda para este conjunto de datos.
Ejemplo
Calcula la moda para los datos que se presentan a continuación
6
7
8
6
9
7
8
5
6
8
El máximo número de veces que se repiten los datos son tres, y hay dos datos que se repiten tres veces, el 6 y el 8. El conjunto de datos es bimodal y sus modas son el 6 y el 8.
Ejemplo
Calcula la moda para estos datos
8
6
5
5
9
6
8
6
5
9
8
9
En este conjunto de datos, todos se repiten tres veces. El 5, 6, 8 y el 9 son moda. No hay ninguno que no lo sea, es un caso multimodal
DESVIACIÓN ESTÁNDAR
La desviación estándar es la medida de dispersión mas usada en estadística, tanto en aspectos descriptivos como analíticos. En su forma conceptual, la desviación estándar se define así:
Fórmula de trabajo para la población
Fórmula de trabajo para la muestra:
Ejemplo:
Cuando se trata de datos agrupados la formula es:
Ejemplo :
x
f
fx
x2
fx2
32
1
32
1024
1024
37
3
111
1369
4107
42
8
336
1764
14112
47
9
423
2209
19881
52
7
364
2704
18928
57
4
228
3249
12996
62
3
186
3844
11532
67
3
201
4489
13467
72
2
144
5184
10368
Sumas
40
2025
106415
Conociendo la desviación estándar, se puede calcular otros estimadores derivados que son de gran utilidad para describir y/o interpretar el comportamiento de los datos
VARIANZA (VARIANCIA) S2
La varianza, , se define como la media de las diferencias cuadráticas de n puntuaciones con respecto a su media aritmética, es decir:
Para datos agrupados en tablas, usando las notaciones establecidas en los capítulos anteriores, la varianza se puede escribir como
Una fórmula equivalente para el cálculo de la varianza está basada en lo siguiente:
Con lo cual se tiene
Si los datos están agrupados en tablas, es evidente que
La varianza no tiene la misma magnitud que las observaciones (ej. si las observaciones se miden en metros, la varianza lo hace en metros2). Si queremos que la medida de dispersión sea de la misma dimensionalidad que las observaciones bastará con tomar su raíz cuadrada.
Por ello se define la desviación típica, , como:
Ejemplo
Calcular la varianza y desviación típica de las siguientes cantidades medidas en metros:
3,3,4,4,5
Para calcular dichas medidas de dispersión es necesario calcular previamente el valor con respecto al cual vamos a medir las diferencias. Éste es la media:
La varianza es:
Siendo la desviación típica su raíz cuadrada:
Las siguientes propiedades de la varianza (respectivamente, desviación típica) son importantes a la hora de hacer un cambio de origen y escala a una variable. En primer lugar, la varianza (resp. Desviación típica) no se ve afectada si al conjunto de valores de la variable se le añade una constante. Si además cada observación es multiplicada por otra constante, en este caso la varianza cambia en relación al cuadrado de la constante (resp. La desviación típica cambia en relación al valor absoluto de la constante). Esto queda precisado en la siguiente proposición
TASA INTERNA DE RENTABILIDAD O DE RETORNO
Generalmente conocido por su acrónimo TIR, es el tipo de descuento que hace que el VAN (valor actual o presente neto) sea igual a cero, es decir, el tipo de descuento que iguala el valor actual de los flujos de entrada (positivos) con el flujo de salida inicial y otros flujos negativos actualizados
...