Guia Stata
darugia24 de Enero de 2014
6.645 Palabras (27 Páginas)509 Visitas
Introducción
Este documento pretende los introducir el uso del programa STATA, mediante la entrega de conceptos y comandos básicos para el inicio en este software. En una primera parte haremos una pequeña introducción al programa, luego veremos brevemente como se carga una base de datos, y en una tercera parte se verá cual es la manera más adecuada de trabajar con ella. Adicionalmente, en una cuarta parte se verán los comandos que comúnmente se utilizan para inspeccionar una base de datos y obtener estadísticas descriptivas de sus variables, específicamente veremos comandos como sum, el cual nos entrega un set de estadísticas básicas de la variable, describe, y varios otros. En una quinta parte se enseñara como se pueden modificar las bases de datos, especialmente, cambiando el nombre de las variables, unir bases de datos, eliminar y agregar variables, cambiar la estructura de ellas y crear nuevas variables a partir de las variables existentes.
En una sexta parte se aplicará lo aprendido y a partir de ese ejercicio se introducirá la utilidad de los archivos log y do. En la séptima parte se mostrará cómo podemos plasmar la información que nos interesa de los datos en diferentes tipos de gráficos. Finalmente en la octava y última parte se enseñará la utilidad del comando help, el cual nos será de gran utilidad para poder avanzar y utilizar stata cuando no tenemos muy claro cual es el comando a utilizar.
Es importante aclarar que gran parte de los comandos de stata se puede hacer mediante la utilización directa del comando, o mediante la utilización de ventanas. Durante este curso veremos ambas formas.
Un concepto importante de entender antes de comenzar a utilizar este software estadístico, es el de Base de Datos, el primer paso para poder trabajar con STATA es cargar la base de datos. Una base de datos en un conjunto (matriz) de información, tenemos filas y columnas, las que en su conjunto forman la base de datos. Generalmente se organiza de forma tal que las variables se representan por columnas y las observaciones por filas. Por ejemplo, si estamos estudiando las variables escolaridad e ingreso para las mujeres. Nuestra base de datos tendrá dos columnas, donde cada una de ellas representa la escolaridad e ingreso, y cada fila representa una mujer.
Escolaridad Ingreso
10 80.000
12 120.000
13 110.000
4 85.000
5 70.000
8 65.000
17 450.000
21 1.200.000
2 60.000
5 75.000
I. Una pequeña introducción al programa
STATA es una aplicación completa e integrada, basada en comandos, que tiene todos los elementos necesarios para realizar análisis estadístico, manejo de datos estadísticos y gráficos. Las versiones mas nuevas de STATA (a partir de la versión 8.0) posee una forma más fácil de utilizar, que consiste simplemente en hacer clic en ventanas con las opciones de análisis y procesamiento de datos, además tiene la opción “antigua” mediante los comandos. El programa posee una ayuda en línea, es un programa fácil y rápido de utilizar.
¿Cómo se ve STATA?
Cuando abrimos el programa, inmediatamente podemos distinguir 4 ventanas:
Review: en esta ventana aparecen los comandos que han sido utilizados durante la sección en turno.
Results: muestra los resultados de la aplicación de los comandos, sólo los resultados más recientes son visibles en esta ventana
Variables: en esta venta se presenta el listado de variables que se encuentran en la base de datos que se este trabajando
Commands: corresponde a la ventana donde introducen los comandos para obtener el resultado deseado. Sirve para utilizar STATA en forma interactiva.
II. Como organizar el trabajo en STATA
Cuando se abre STATA es importante saber donde se esta trabajando, es decir, en que carpeta se están guardando los resultados o desde que carpeta vamos a llamar la base de datos, etc. Si no se sabe la carpeta o directorio donde STATA esta ubicado podemos averiguarlo escribiendo el comando pwd:
Pwd
C:\data => Este resultado nos indica que estamos ubicados en el disco C del computador en la carpeta data
Para cambiar el directorio o carpeta se debe realizar lo siguiente:
cd C:\Nivelacion_Stata
Utilizo el comando cd y entrego la nueva ruta. En este caso le estoy indicando al programa que se ubique en la carpeta “Nivelacion_Stata” que se encuentra en el disco C del computador.
La ventaja de indicar desde un comienzo en que carpeta del computador se esta trabajando, es que evita indicar la ruta completa de los archivos cada vez que queramos abrir o guardar una base de datos, o abrir o guardar un log. Obviamente esto tiene sentido cuando para un trabajo específico tenemos todos los archivos necesarios en la misma carpeta.
Por ejemplo, si estamos trabajando con información de tres bases de datos distintas, y queremos dejar la información relevante para el estudio en una sola base datos (más adelante veremos como hacer esto), lo ideal es trabajar en una sola carpeta, “Nivelacion_Stata”, y no tener las tres bases de datos repartidas en carpetas distintas. Si no están en la misma carpeta no es útil indicarle el directorio al comienzo, ya que igual cuando llamemos a cada una de las bases de datos, al estar en carpetas distintas, tendremos que cambiar la ruta.
Importante: los sistemas operativos más nuevos permiten que las carpetas tengan nombres con espacio en blanco, por ejemplo, “Nivelacion Stata”. Sin embargo, STATA no va a reconocer una carpeta que tenga espacios en blanco en el nombre, a no ser que se indique la ubicación de esta carpeta entre comillas. Por este motivo, se debe evitar llamar a una carpeta con la que van a trabajar en STATA con nombres que contengan espacios en blanco.
Supongamos que la carpeta en que vamos a tratar se llama “Nivelacion Stata”, en la primera línea del siguiente cuadro podemos apreciar que al entregar la ubicación de la carpeta utilizando el comando cd, el programa nos entrega un error “invalid syntax”, esto se debe a que el nombre de la carpeta tiene espacios en blanco. Si agregamos comillas a la ruta no se produce el error.
Nota: si al introducir un comando no aparece un punto blanco después de ejecutado el comando, significa que no se termino o no se ha terminado de ejecutar. Además, siempre que aparezcan letras rojas significa que hay un error, la ayuda para el error la pueden encontrar pinchando r(198).
En resumen, para trabajar ordenadamente en STATA es conveniente crear una carpeta para cada trabajo independiente, esta carpeta debe tener una ruta que no contenga espacios en blanco en los nombres.
III. ¿Cómo cargar una base de datos?
Las bases de datos en formato Stata tienen extensión .dta. Las versiones antiguas del software no se pueden abrir bases de datos que han sido trabajadas y guardas en una versión más moderna, cuando intentemos hacer esto el programa entregará un error indicando que la base no tiene formato Stata.
Antes de abrir una base de datos se tienen que cumplir dos condiciones:
1- El programa debe estar limpio, sin ninguna base de datos ya cargada. Para limpiar el programa de otras bases de datos se debe utilizar el comando clear. Si he estado trabajando una base de datos previamente la cual se ha modificado y no he guardado estas modificaciones, al intentar abrir una nueva base de datos sin limpiar antes arrojará el siguiente error:
no; data in memory would be lost
2- El programa debe tener suficiente memoria. Para entregarle memoria a Stata se debe utilizar el comando set mem. Por ejemplo, si la base de datos que deseamos cargar pesa 100 MB, en la ventana Stata Command debemos tipear:
set mem 100m
Si Ud. no agrega memoria y los 10 MB que vienen asignados al abrir el programa no son suficientes, el programa arrojará el siguiente error:
no room to add more observations
Esto también puede suceder cuando se ha trabajado en la base de datos y se han creado muchas variables: en un momento el programa se puede quedar sin memoria. En este caso se debe limpiar el programa (borrar la base de datos) utilizando el comando clear; entregarle más memoria al programa utilizando set mem; abrir la base de datos y realizar todo nuevamente. Por esta razón es fundamental que Ud., cuando comience a trabajar, asigne la memoria necesaria para todas las variables que espera generar.
El comando general para entregar memoria a Stata es:
set mem #[b|k|m|g] [, permanently]
con la opción “permanently” la cantidad de memoria ingresada se mantendrá cada vez que se inicie nuevamente el programa.
Existen distintas formas de cargar una base de datos:
1- Utilizando una base ya grabada con la extensión de STATA, es decir, disponer de la base de datos como nombre.dta En este caso podemos apretar el icono abrir y buscar la ubicación de la base de datos. También podemos hacerlo dirigiéndonos a File/Open…
2- Otra forma es tipear en Stata Command use “[disco en que la guardaremos] \ [ruta de acceso] \ [nombre de archivo.dta]”, clear. Por ejemplo:
use "C:\Nivelacion_Stata\exteps09.dta", clear
...