Organizacion De Datos
Enviado por carlos.23 • 14 de Agosto de 2013 • 3.027 Palabras (13 Páginas) • 636 Visitas
Organización de Datos
Naturaleza de la estadística
Los primeros estudiosos de la estadística se dedicaron, por lo general, a la recolección y exposición de datos útiles para el Estado, de ahí se derivó el nombre estadística. Por ejemplo, recolectaban datos sobre nacimientos y decesos, para auxiliar a los encargados del reclutamiento militar; sobre enfermedades, para ayudar a quienes se ocupaban de la salud pública; y acerca de exportaciones, importaciones, ingresos, egresos y gastos para facilitar la recaudación de impuestos.
La estadística se subdivide en:
a) Estadística descriptiva. Comprende la organización, resumen y presentación de un grupo de datos. El uso de gráficas, tablas y números realza los datos y facilita el trabajo para analizarlos. El índice de desempleo, el costo de la vida, la precipitación pluvial, el rendimiento medio de un auto en kilómetros por litro y los promedios de calificación son un ejemplo.
La probabilidad es otra rama de la estadística; es de utilidad para analizar situaciones en las que interviene el azar, como los juegos de dados, las cartas o el tiro de monedas, así como en el boxeo, fútbol, basquetbol, carreras de caballos, etcétera.
b) Estadística inductiva o inferencial. Consiste en el análisis e interpretación de una muestra de datos. Es el proceso para lograr generalizaciones acerca del todo (llamado población), examinando una parte (llamada muestra); la muestra debe ser representativa de la población.
La idea básica en el muestreo es medir una porción pequeña, pero típica, de alguna población, y posteriormente utilizar dicha información para inferir qué características tiene la población total. Por ejemplo, ver un programa de televisión durante algunos minutos para darse cuenta si vale la pena seguir mirándolo; hojear un libro antes de comprarlo; las fábricas suelen producir un pequeño número de piezas de un producto nuevo antes de pasar a la producción en gran escala, también hacen estudios de mercado de los nuevos productos en ciudades claves, para establecer el grado de aceptación del consumidor.
Datos estadísticos
Los datos estadísticos se obtienen mediante un proceso que comprende la observación o medición de conceptos, como ingresos anuales de una comunidad, calificaciones de exámenes, cantidad de café por taza despachada por una máquina vendedora, resistencia a la rotura de fibras de plástico, porcentaje de azúcar en cereales, etc. Tales conceptos reciben el nombre de variables, ya que producen valores que tienden a mostrar cierto grado de variabilidad, al efectuarse mediciones sucesivas.
Una variable es un símbolo, tal como X, Y, x, y, que puede tomar un valor cualquiera de un conjunto de valores. Una variable puede ser:
• Discreta, cuando solo puede tomar determinados valores. Son los datos obtenidos de un proceso de conteo, solo asumen ciertos valores.
• Continua, cuando toma cualquier valor real entre dos valores reales dados; son datos obtenidos de un proceso de medición, donde pueden asumir cualquier valor en un intervalo determinado.
Por su parte, los datos pueden ser:
• Cuantitativos. Tanto los datos discretos como los continuos se conocen como datos cuantitativos, ya que son inherentemente numéricos.
• Cualitativos. Son los datos nominales y jerarquizados.
Los datos nominales comprenden categorías, como el sexo (masculino o femenino), el color de ojos (azul, castaño, negro, verde), campo de estudios (medicina, derecho, administración, economía, biología, ingeniería), calificaciones (excelente, bueno, regular, malo), etcétera.
Los datos jerarquizados son aquellos que indican preferencia o logro. Por ejemplo, en un concurso de belleza, florería o cocina, los lugares se jerarquizan en primero, segundo, tercero.
Análisis de grandes conjuntos de datos
Distribuciones de frecuencias. Una distribución de frecuencia es un agrupamiento de datos en clases, que muestra el número o porcentaje de observaciones de cada una de ellas. Una distribución de frecuencia se puede presentar en forma tabular y gráfica. El número de clases está generalmente entre 5 y 15, con menos de 5 no se podrían observar características importantes de los datos, en tanto que más de 15 proporcionarían demasiados detalles.
Una distribución de frecuencia relativa se obtiene dividiendo el número de observaciones en cada clase entre el número total de observaciones en los datos como un todo. La suma de las frecuencias relativas es igual a uno.
Una distribución de frecuencia acumulada muestra, para cada clase, el número total de observaciones en todas las clases inferiores y las de la clase en cuestión. Cuando se unen los puntos, esto da una curva de distribución u ojiva.
1.1. Fuentes de información estadística
Para llevar a cabo el trabajo estadístico, es necesario consultar diversas fuentes de información (reconocidas) del fenómeno económico o de la materia de estudio, ya que estas recopilan y ofrecen datos actualizados en forma mensual, trimestral o anual.
Las siguientes son fuentes de consulta confiables en donde podrás encontrar información económica diversa:
1. Banxico. (2002). Informe anual. México: Autor.
2. Banxico. (s.f.). Indicadores Económicos. Varios números. México: Autor.
3. Banxico. http://www.banxico.org.mx/.
4. Bolsa Mexicana de Valores. (2003). Indicadores Bursátiles. México: Autor.
5. CFE. (2003). Estadísticas del Sector Eléctrico Nacional, 1993-2002. México: Autor.
6. CNIE. (2003). Informe Estadístico sobre el Comportamiento de la Inversión Extranjera Directa en México. (Enero-diciembre de 2002). México: Autor.
7. Conapo. (2003). Prontuario Demográfico de México, 2000-2003. México: Autor.
8. Conasami. http://www.conasami.org.mx.
9. Inegi. (2001). Indicadores Sociodemográficos de México (1930-2000). México: Autor.
10. Inegi. (2001). XII Censo General de Población y Vivienda, 2000. Tabulados Básicos. México: Autor.
11. Inegi. (2002). Anuario Estadístico de los Estados Unidos Mexicanos, 2002. México: Autor.
12. Inegi. (2003, julio). Indicadores de Empleo y Desempleo. México: Autor.
13. Inegi. (2003, mayo). Estadísticas Económicas. Producto Interno Bruto Trimestral. México: Autor.
14. Inegi. (2003). Banco de Información Económica. México: Autor.
15. Inegi. (2003). Encuesta Nacional de Empleo. México: Autor.
16. Inegi. (2003). Encuesta sobre Disponibilidad y uso de Tecnología de la Información en los Hogares, 2002. México: Autor.
17. Inegi. (2003). Sistema de Cuentas Nacionales de México. Cuentas de Bienes y Servicios, 1996-2001. México: Autor.
18. Inegi. (2003). Sistema de Cuentas Nacionales de México. Indicadores Macroeconómicos del Sector Público, 1996-2001. México: Autor.
19. Inegi. (2003). Sistema de Cuentas Nacionales de México. La Producción, Salarios, Empleo y Productividad de la Industria Maquiladora de Exportación, 1996-2001. México: Autor.
20. Inegi. (2003). Sistema de Cuentas Nacionales de México. Producto Interno Bruto por Entidad Federativa, 1996-2001. México: Autor.
21. Inegi. (2003). XII Censo General de Población y Vivienda, 2000. Perfil Sociodemográfico. México: Autor.
22. Inegi. Dirección General de Estadística. Dirección de Estadísticas Sociodemográficas.
23. Pemex. Dirección Corporativa de Planeación Estratégica.
24. Presidencia de la República. (2003). Tercer Informe de Gobierno, 2003. Anexo Estadístico. México: Autor.
25. Sagarpa. (2002). Sistema de Información Agropecuaria de Consulta, 1980-2002. México: Autor.
26. Sagarpa. (2003). Anuario Estadístico de la Producción Pecuaria de los Estados Unidos Mexicanos, 2002. México: Autor.
27. Sagarpa. http: www.sagarpa.gob.mx.
28. Sectur. (2003). Compendio Estadístico del Turismo en México, 2002. México: Autor.
29. SSA. (2003). Boletín de Información Estadística, 2001. México: Autor.
1.2. Escalas y técnicas de medida
Son las distintas formas de medir o cuantificar las respuestas a diferentes tipos de preguntas para sintetizar la información y aplicar técnicas estadísticas y matemáticas a los datos que permitan conseguir una mayor riqueza de información. Hay 3 grandes grupos de escalas:
1. Nominativas: tan solo identifican diferentes categorías o alternativas de respuesta, no indican ningún orden u otro significado en sus respuestas. Se suele utilizar para clasificar individuos por sexo, ocupación, etc. La descripción de la variable se realiza por medio del recuento de respuestas que corresponde a cada categoría. Como medida de tendencia central (promedio), se utiliza la moda. Ejemplo: ¿cuál de estas marcas de jugo has probado?
a) Del Valle.
b) Jumex.
c) Naranjada.
d) Ninguna de las 3.
2. Ordinal: en este caso, aparte de representar las diferentes categorías o alternativas de respuesta, los números implican un rango de orden pero no muestran con exactitud la respuesta concreta. Así, se puede utilizar también en este tipo de escalas cualquier conjunto de números, siempre que se presenten de mayor a
...