ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Análisis Estratégico de la información

Salvador GonzálezApuntes13 de Abril de 2020

3.218 Palabras (13 Páginas)134 Visitas

Página 1 de 13

Materia: Análisis Estratégico de la información

Unidad #2: Estadística Descriptiva

2.1 Definición de estadística

¿Cómo definiremos el término de estadística? Este es un término que encontramos con frecuencia en nuestro lenguaje diario y en realidad podemos decir que tiene dos significados: En el uso más común podemos decir que la estadística se refiere a la información numérica.

Como ejemplo, el salario inicial promedio de los trabajadores del estado de puebla en el último año, el número de muertes en las carreteras del país por los vacacionistas por año, los partidos de futbol ganamos por la selección mexicana en los últimos mundiales. Esto ejemplos son datos estadísticos, es decir, un conjunto de información numérica que tenemos que interpretar: A esto le llamamos estadística.

A menudo presentamos la información estadística en forma de gráfica, ya que resulta más fácil captar la atención de las personas, interpretar mejor la información y resaltar a la vista los puntos críticos.

Estadística: Es la ciencia de recopilar, organizar, presentar, analizar e interpretar información para ayudar a tomar decisiones más efectivas.

Una vez que tengamos definido el problema que se va a estudiar, el paso siguiente es recoger los datos, pero a menudo es una gran cantidad de datos que no están claros para el estudio. Por ello debemos resumir los datos de manera que tengamos una imagen clara y precisa.

Se requiere reducir en todo lo posible esa gran cantidad de datos que se llegan a obtener, pero evitando al mismo tiempo la posibilidad de ocultar características importantes de los mismo por reducirlos excesivamente.

Desgraciadamente no existe una única manera correcta de ordenar y describir los datos, ya que depende de dos factores: El tipo de datos y el fin del estudio.

Para comenzar a ordenarlos revisemos algunas definiciones que nos serán de mucha utilidad para comenzar a ordenar los datos.

Toma de datos: Es la obtención de una colección de los mismos que no han sido ordenados numéricamente.

Ordenación: La ordenación de los datos es tomar la colección de estos en orden ya sea creciente o decreciente de magnitud.

Rango: La diferencia entre el dato mayor y el dato menor de la colección se llama recorrido o rango de los datos.

Distribuciones de frecuencias: Absolutas y relativas

El primer procedimiento que seguimos para describir un conjunto de datos es en una distribución de frecuencias.

Distribución de frecuencias: Es una agrupación de datos en clases mutuamente excluyentes mostrando el número de observaciones en cada una. Para desarrollarla tomamos los siguientes pasos:

  1. Decidir el número de clases: Esto con el objetivo de utilizar suficientes grupos o clases para revelar la forma de la distribución, necesitamos usar el sentido común ya que demasiadas clases o muy pocas pueden no revelar el comportamiento de los datos.
  2. Determinar el intervalo o ancho de clase: Por lo general, el intervalo o ancho de clase debe ser el mismo para todas las clases, todas se deben cubrir por lo menos con los valores más bajos hasta el más alto.
  3. Establecer los límites de cada clase: Se deben establecer límites de clase claros con el fin de incluir cada observación en un intervalo.
  4. Incluir los datos en el intervalo que les corresponda: Se coloca cada dato en los intervalos que les corresponde para completar la distribución.
  5. Hacer el conteo de los elementos de cada clase: Se cuentan el número de observaciones o datos que caen en cada intervalo y se les conoce como frecuencia de clase.

Una vez realizada la distribución de frecuencias siguiendo los pasos anteriores, procedemos a llenar la información complementaria a la distribución de frecuencias:

Frecuencia absoluta o de clase: Es la frecuencia que cae en cada intervalo o clase y la suma de éstas nos da el total de los datos.

Frecuencia relativa: Es la frecuencia de clase dividida por el total de frecuencias de todas las clases y expresadas generalmente como porcentajes.

Frecuencia acumulada: La frecuencia total de todos los valores menores que el límite real superior de clase de un intervalo de clase dado, se le conoce como frecuencia acumulada.

Frecuencia acumulada porcentual: Es la frecuencia acumulada dividida por el total de frecuencias de todas las clases y expresadas como porcentajes.

A continuación se muestra un ejemplo de una distribución de frecuencias. [pic 1]

Límite de clase: Son los que delimitan el intervalo o clase y son límite superior e inferior. En el ejemplo, el 60 es el límite inferior de la primera clase y el 62 es el límite superior.

Límites reales de clase: Se obtienen sumando el límite superior de un intervalo de clase, el límite inferior del intervalo del clase contiguo superior y dividido por dos. En el ejemplo, si en el intervalo de clase 60-62 teóricamente se incluyen todas las medidas (desde 59.50000 a 62.50000) estos números representados brevemente por los números exactos 59.5 y 62.5 se conocen como límites reales de clase o límites verdaderos de clase: el menos de ellos, 59.5 es el límite real inferior y el mayor de ellos, 62.5 es el límite real superior de clase.

Tamaño o anchura de un intervalo de clase: Es la diferencia entre los límites reales de clase que lo forman. Si todos los intervalos de clase tienen una anchura común se representa por la letra “C”.

Marca de clase: Es el punto medio del intervalo de clase y se obtiene sumando los límites inferior y superior de clase y luego dividiendo el resultado entre dos.  

Presentación grafica de datos: Histogramas, Diagramas de pay, ojivas.

Una vez desarrolladas las distribuciones de frecuencias, podemos representar gráficamente esta información.

Un histograma: Es un gráfico formado por barras verticales construidas sobre una línea horizontal que está delimitada por los intervalos de la variable mostrada. Los intervalos corresponden a los datos de la distribución de las frecuencias.

Los intervalos corresponden a los datos de la distribución de frecuencias. La altura de cada barra es proporcional al número de observaciones, frecuencias o datos que hay en ese intervalo. El número de observaciones o datos puede indicarse encima de las barras.

Polígono de frecuencias: Es un gráfico de línea trazando sobre las marcas de clase, tomando de base una línea horizontal, delimitada por los intervalos y las alturas por los datos o frecuencias y todos los puntos unidos. También se puede obtener uniendo los puntos medios de los techos de los rectángulos en el histograma.

Una ojiva: Llamada a veces gráfica de frecuencias acumuladas, es una línea que conecta puntos que son el porcentaje acumulado de observaciones o datos, situadas por debajo del límite superior de cada intervalo en una distribución de frecuencias acumuladas.

Gráficas circulares o de pastel: Expresa de forma gráfica la distribución proporcional de los datos de estudio, pero estos no deben ser más de 7 ya que el análisis se vuelve complejo. Si rebasa esta cantidad es recomendable hacer una gráfica de barras. Con la elaboración de estas gráficas es más fácil analizar la información ya que a simple vista se destacas las tendencias de los datos.

2.3 Descripción de datos numéricos

Niveles de medición

Los datos se pueden clasificar de acuerdo con los niveles de medición, el nivel de medición de la información nos indica los cálculos que se pueden hacer para resumir y presentar los datos, también determina las pruebas estadísticas que se deben realizar.

Los niveles de medición se clasifican de la siguiente manera:

  • Nivel de medición nominal: Las observaciones de una variable cualitativa sólo se puede clasificar y contar, no existe un orden particular para etiquetarlos.

Por ejemplo: Supongamos que contamos el número de estudiantes que entran a un curso de matemáticas con su identificación y reportamos cuantos hombres y cuantas mujeres son en el curso. Podríamos reportar primero a los hombres y después a las mujeres o primero a las mujeres y después a los hombres. Para el nivel nominal la única medición consiste en el conteo.

  • Nivel de medición ordinal: La clasificación de la información es mutuamente excluyente y colectivamente exhaustiva, la clasificación de la información está ordenada de acuerdo con el rasgo en particular que posee.

Por ejemplo, si le decimos a varios grupos de alumnos del profesor de matemáticas que lo evalúen y las calificaciones son: superior, bueno, promedio y así sucesivamente, no se puede distinguir la magnitud de la diferencia entre los grupos pues no se puede distinguir la magnitud de la diferencia entre los grupos pues no podemos llegar a la conclusión que una calificación de bueno sea necesariamente el doble de malo, sólo podemos concluir que la calificación de bueno es mejor que una de malo.

...

Descargar como (para miembros actualizados) txt (21 Kb) pdf (376 Kb) docx (218 Kb)
Leer 12 páginas más »
Disponible sólo en Clubensayos.com