Estadística Para Principiantes
Xarant17 de Febrero de 2015
16.776 Palabras (68 Páginas)418 Visitas
ESTADÍSTICA PARA PRINCIPIANTES
PEDRO JOSÉ SALINAS
La estadística es una de las más importantes disciplinas de la ciencia. La estadística juega un papel muy importante en todas las actividades del hombre. El nombre estadística se origina en el término Status que significa Estado, porque inicialmente se refería a todo lo concerniente al manejo y la administración de los estados o naciones. El censo de las personas, sus actividades económicas, sus propiedades, sus labores, sus nacimientos, muertes y otras cifras demográficas, sus ingresos y egresos, etc. Hoy día la estadística es parte integral de todas las actividades del hombre y es uno de los principales instrumentos, generalmente esencial e indispensable, de la mayoría de ellas, por ejemplo, las actividades científicas, administrativas, políticas, comerciales, de comunicaciones, de producción, industriales, etc.
En lo que aquí concierne, la idea es presentar los métodos estadísticos más comúnmente usados en investigación científica y explicarlos de una manera sencilla y fácil, sin necesidad de conocimientos especiales en matemáticas, para que sea entendido por la mayoría de aquellos que se inician en la investigación científica.
La estadística, en nuestro caso, se refiere a los métodos científicos de colectar, organizar, resumir, presentar y analizar datos, generalmente cifras, así como sacar conclusiones válidas y tomar decisiones sobre la base de esos análisis.
La estadística se puede dividir en estadística descriptiva o deductiva y estadística analítica o inductiva. La estadística descriptiva es aquella que se encarga de describir y analizar las características de un grupo de observaciones o muestra, sin sacar conclusiones o inferencias acerca del grupo mayor o población. La estadística analítica se encarga de analizar la muestra y sacar conclusiones, es decir, inferir la interpretación de los datos analizados. Como la inferencia o las conclusiones no son basadas sobre el total de la población, generalmente se refiere dicha inferencia a la probabilidad.
Universo: Se denomina universo o población al grupo total de individuos, sujetos u objetos que componen ese grupo. Así, el conjunto de todas las personas del mundo, será el universo o población mundial de personas. Igualmente, el conjunto de personas de Venezuela o del Estado Mérida, serán los universos o poblaciones de personas de Venezuela o del Estado Mérida. De la misma manera, el conjunto total de pupitres de una escuela o el conjunto de caballos de una hacienda, o el conjunto de plantas de maíz de una región, o el conjunto de pacientes que asisten a un hospital, serán los universos o poblaciones de esos objetos o individuos en sus respectivos ámbitos.
Población: es el conjunto de elementos, individuos, observaciones con características similares que se encuentran en un sitio y tiempo determinados, es decir, están delimitados en espacio y tiempo. Generalmente se le identifica como N.
Las poblaciones pueden ser finitas o infinitas. Una población es finita cuando tiene un número determinado de individuos, por ejemplo el conjunto de panes que produce una panadería en un día. Mientras que una población es infinita cuando no tiene un límite definido, por ejemplo el número de hojas que pueden caer de los árboles de un bosque tropical.
Observación: Se le denomina observación a cada unidad de estudio, por ejemplo, cada individuo, planta, insecto, roca, casa, vaca, bombillo, paciente, carro, etc. También se le denomina dato.
Los datos pueden ser de dos tipos: datos categóricos y datos numéricos.
Los datos categóricos, a su vez, son de dos tipos: datos nominales y datos ordinales.
Los datos nominales son aquellos que se refieren a condiciones o características que solo se pueden separar por nombres (de allí su denominación), por otra parte, no pueden ser ordenados por jerarquía, ya que no hay ninguno mayor que otro. Ejemplos de datos nominales son: referidos al sexo, hombre, mujer o varón, hembra, o macho, hembra; referidos a la ocupación: comerciante, abogado, limpiador, ingeniero, cocinero, taxista, profesor; referidos al estado civil: soltero, casado, divorciado, viudo; referidos a la procedencia: urbano, sub-urbano, rural.
Los datos ordinales son aquellos que se refieren a pueden ordenarse (de allí su nombre) de mayor a menor, de inferior a superior, de mejor a peor, etc. o viceversa. Ejemplos de datos ordinales son: referidos a la aceptación de un candidato a un puesto público: eficiente, regular, malo, muy malo; referidos a las notas de alumnos: excelente, sobresaliente, bueno, regular, aplazado; referidos al efecto de un medicamento: eficaz, medianamente eficaz, ineficaz; referidos a la opinión sobre algún tema: de acuerdo, medianamente de acuerdo, en desacuerdo. Por supuesto que estas escalas las debe establecer el investigador, es decir, que pueden ser más o menos tipos en cada escala.
Los datos numéricos son aquellos que pueden presentarse o expresarse con cifras o números, por ejemplo, la población de una ciudad o país, la estatura de los estudiantes en una escuela, los reprobados en un examen, los matrimonios en una iglesia, las vacas de una finca, las picadas de hormigas por persona en un día de campo, las casas en una urbanización, la edad de los pacientes en un hospital, etc.
Los datos numéricos son de dos tipos de acuerdo con su configuración, es decir, si no admiten división de la unidad, se denominan discretos, por ejemplo, el número de personas en una familia, las ranas en un charco, los árboles de un bosque, los accidentes de tránsito (no se puede decir que en una familia hay siete personas y tres cuartos personas, o en un charco hay 523.75 ranas, etc. Mientras que si admiten división de la unidad se denominan continuos, como ocurre con la edad, la estatura, la temperatura, etc, que pueden dividirse, prácticamente hasta el infinito, asi podemos decir que la estatura de una persona es de 1.45398102 metros o que su edad es de 36.4902461832 años y su temperatura corporal es de 36.703485 grados Celsius.
Los datos, para fines de cálculos estadísticos, generalmente se les identifican con x. Cada observación será: x1, x2, x3, x4, … xn. Cuando son más de dos serán y, z, etc.
Muestra. Generalmente no es posible o es impráctico observar o estudiar todo el conjunto de individuos u objetos, es decir, toda la población o universo, porque es muy costoso, toma mucho tiempo, es muy difícil, etc. En ese caso se estudia solamente una parte que se llama muestra. La muestra es el conjunto de observaciones que se toman de una población y que se supone representa todas las características generales de la población de estudio. Generalmente se le identifica como n.
Variable: Por variable se entiende a una característica, cualidad, fenómeno, etc. que varía, se modifica o cambia, es decir, que puede tomar cualquiera de los valores de un grupo determinado.
Una variable que puede tener cualquier valor entre dos valores dados se denomina variable continua. Por ejemplo, la estatura de una persona puede ser 168 cm, 168.5 cm, 168.53 cm, 168.53749 cm, 168.53749062 cm y así hasta el infinito.
Una variable que solo puede tener valores fijos entre dos valores dados se denomina variable discreta. Por ejemplo, el número de hijos en una familia puede ser 0, 1, 2, 3, 4, etc., pero no puede ser 2.5 ni 4.67, ni 5.873, etc., es decir, no puede ser la fracción de la unidad.
En los casos donde una condición depende de otra condición, es decir, una situación es causada por otra, o un efecto es ocasionado por una causa, las condiciones se denominan variable independiente la que genera el efecto y este se llama variable dependiente. Por ejemplo, la aplicación de diferentes dosis del fertilizante nitrato de amonio (variable independiente) a una siembra de maíz causará aumento en el crecimiento y por ende en el rendimiento en kilogramos por hectárea (variable dependiente). A medida que aumenta la dosis de fertilizante aumentará el rendimiento del maíz. La relación puede ser inversa, es decir, a medida que aumenta la independiente, disminuye la dependiente. Por ejemplo, la aplicación de diferentes dosis de insecticidas (variable independiente) a una población de mosquitos (variable dependiente) causará su disminución.
En algunos casos, especialmente relacionados con la epidemiología, se denominan variables desconcertantes (en inglés: confounding variables) a aquellas que están asociadas tanto a la causa como al efecto que se investiga. Por ejemplo, si en un grupo de personas entre 0 y 20 años de edad se relaciona la edad con el peso, se encontrará que cuando la edad (variable independiente o causa) aumenta, también aumenta el peso (variable dependiente o efecto), pero si existen otros elementos asociados, tal como el consumo de vitaminas, esto estará asociado a la causa y al efecto, por lo cual se le llama variable desconcertante. Otro término para denominar este tipo de variables es de variables intervinientes.
Constante: Si la variable solo puede tomar un solo valor, se le denomina constante.
Datos crudos se denomina a los datos tomados directamente del experimento, investigación o trabajo que se realiza o se ha realizado, pero que no están arreglados u ordenados. Por ejemplo, los datos de las edades, las estaturas o pesos de los estudiantes de una escuela tomados de acuerdo con el orden alfabético. En ese caso se consideran datos crudos, pues no están arreglados en ningún orden.
Datos ordenados son aquellos datos que se han ordenado para su estudio o análisis. El orden puede ser ascendente
...