Proyecto Estadístico
simon.pe.realInforme4 de Noviembre de 2019
2.423 Palabras (10 Páginas)132 Visitas
Proyecto Estadístico Simón Peña Correal 10D
Tarea #1.
Parte A.
Una relación de causalidad es cuando dos eventos o sucesos se enlazan de tal manera que uno antecede y causa otro. Si sucede A, entonces sucederá B. En este contexto estadístico, podríamos decir que un evento o variable, incidiría en el resultado de otro. Por ejemplo, si hay mayor cantidad de guerrilleros o paramilitares en el país, entonces el índice de homicidios aumentará.
Por otro lado, tenemos la asociación estadística la cual es la relación que hay entre eventos o variables, que a pesar de estar relacionados, no hay una causalidad. Por ejemplo, el precio del dólar es inversamente proporcional al precio del petróleo. Entre estas dos variables no hay una relación causal ya que una no causa la otra, sin embargo sabemos que están asociadas gracias a los comportamientos que presentan. Una explicación es que; si sucede A, entonces sucederá B, por lo que se desencadenará un evento C, donde A es el precio del dólar y B el precio del petróleo.
Parte B.
Primera variable: Tasa de alfabetismo –correspondiente- de cada país (%).
Segunda variable: Desconfianza por parte de la población de un país en los partidos políticos (%).
En este caso, ambas variables no presentan una relación de causalidad, ya que una no causa la otra, por lo que podemos afirmar que sí poseen una relación de asociación. Esto se debe a que mientras más conocimiento, consciencia y pensamiento crítico posea la población de un país, más difícil será dejarse influenciar de un discurso político o de los representantes de una ideología. Sin embargo, para poder generar esta consciencia sobre algo, hay que saber leer y también poner en práctica esta lectura. Según Carr, la escritura y lectura ayuda a los estudiantes en las conexiones que hacen entre lo que leen, saben, entienden y piensan (Carr, 2002). De hecho, se indica que a los estudiantes que se les da la oportunidad de escribir junto con la lectura, muestran más evidencia de usar el pensamiento crítico cuando leen. En este orden de ideas, si hay alfabetismo, entonces la población tendrá un nivel de lectura, y si tienen un mayor nivel de lectura generarán pensamiento crítico. Por último, si tienen pensamiento crítico, no se enfocaran en el discurso positivo de los partidos políticos sino en sus carencias.
Tarea #2.
Parte A.
El Análisis Exploratorio de Datos son las técnicas estadísticas cuyo objetivo es conseguir un entendimiento básico de los datos y de las relaciones existentes entre las variables analizadas e identificar el modelo teórico más adecuado para representar la población de la cual proceden los datos. Para conseguir esta finalidad el A.E.D. nos muestra métodos sistemáticos para organizar y preparar los datos, detectar fallos en su diseño y recogida de los mismos, tratamiento y evaluación de datos ausentes,
identificación de casos atípicos, etc.
El AED se divide en múltiples etapas las cuales son:
1) Preparar los datos para que puedan ser estudiados a través de cualquier técnica estadística.
2) Realizar un análisis de la naturaleza de las variables individuales y un análisis descriptivo numérico que permita cuantificar algunos aspectos gráficos de los datos.
3) Realizar un examen gráfico de las relaciones entre las variables analizadas y un
análisis descriptivo numérico que cuantifique el grado de interrelación existente
entre ellas.
4) Evaluar supuestos básicos subyacentes a muchas técnicas estadísticas como, por ejemplo, la normalidad, linealidad y homocedasticidad.
5) Identificar los posibles casos atípicos y evaluar el impacto potencial que puedan ejercer en análisis estadísticos posteriores.
6) Evaluar, si fuera necesario, el impacto potencial que pueden tener los datos
ausentes sobre la representatividad de los datos analizados.
Parte B.
El concepto de robusto de por sí solo no puede ser aplicado a la estadística, sin embargo al combinarlo con una metodología si es aplicable, tal como lo es la estadística robusta, la cual es una aproximación alternativa a los métodos estadísticos clásicos. El objetivo es producir estimadores que no sean afectados por variaciones pequeñas respecto a las hipótesis de los modelos, o sea, modelos atípicos.
Las estadísticas robustas intentan proporcionar métodos que apoyan a los métodos clásicos, pero que no son afectados indebidamente por valores atípicos u otras pequeñas discrepancias del modelo. En Estadística, los métodos clásicos confían en hipótesis que no se resuelven o no se verifican a menudo en la práctica. Desafortunadamente, cuando hay valores atípicos en los datos, los resultados producidos por los métodos clásicos son a menudo de baja calidad.
Tarea #3.
Parte A.
Los datos que se utilizarán en el proyecto son sacados de una investigación de la Universidad de Salamanca, España, realizada por el estudiante Israel Palazuelos, en la cual habla de la desconfianza en los partidos políticos y la percepción ciudadana de desempeño gubernamental. De esa investigación solo tomaremos los datos del porcentaje de la población que desconfía de los partidos políticos, que a su vez fueron extraidos de 18 bases de datos de LAPOP (2010). La otra fuente es un libro de políticas sociales de CEPAL (división de la ONU), titulado “El analfabetismo funcional
en América Latina y el Caribe: Panorama y principales desafíos de política”, escrito por Rodrigo Martínez, Daniela Trucco y Amalia Palma en el 2010. De esta, tomaremos el porcentaje de la población analfabeta, para poder realizar el proyecto.
La población es un total de 26 países, con una muestra de 18 países. De esta forma tomamos aproximadamente el 69.2 % de la población total, ya que existen países que son colonias o no fueron tomados en cuenta, tal como: Surinam, Cuba o Haití. Además, en el trabajo realizado por el estudiante, hay países que no son tomados en cuenta. Los países utilizados serán: Argentina, Bolivia, Brasil, Chile, Colombia, Costa Rica, Ecuador, El Salvador, Guatemala; Honduras, México, Nicaragua, Panamá, Paraguay, Perú, República Dominicana, Uruguay, Venezuela.
A continuación presentamos la tabla #1 del proyecto.
[pic 1]
Parte B.
El AED va a ser conjunto: vamos a tratar cada etapa con ambas variables a la vez:
1) Hablando de la tasa de la tasa de alfabetismo, los datos están organizados de manera ascendente, para así poder ubicar de una forma más fácil las tasas más bajas y la información que nos pueden aportar. Además, al momento de graficar, los puntos se organizarán sin importar el país al que pertenezcan. Podemos empezar a indagar sobre la relación que puede haber entre ambas variables.
Por otro lado, la desconfianza hacia los partidos políticos no presenta orden alguno, ya que adquieren un valor según la tasa de alfabetismo o el país al que correspondan. Así es fácil ver si guardan alguna relación con la primera variable.
2) Para facilitar la comprensión y el análisis de la naturaleza de las variables y su interacción, decidí crear una gráfica con ayuda de Excel:
[pic 2]
3) Así comprendemos la relación y el comportamiento que poseen las variables. En este caso, podemos ver que son inversamente proporcionales, y que mientras más porcentaje de la población posea una mayor tasa de alfabetismo, menos desconfianza de la política poseerán.
4) Normalidad: Se supone que siempre debe haber un comportamiento “normal” al momento de realizar un análisis estadístico; en este caso, debe haber un nivel medio entre ser analfabetas y ser alfabetos. El comportamiento natural debería ser que : mientras menos alfabetismo, hay menos desconfianza y viceversa, por lo que se debería presentar una inclinación descendente.
[pic 3]
[pic 4]
A partir de las gráficas, podemos evidenciar la homocedasticidad que se presentan en ambos tipos de técnicas estadísticas, encontrando grandes semejanzas no solo en su forma, sino es su línea de tendencia.
...