ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

MIS COMANDOS

adfadfApuntes13 de Diciembre de 2020

1.729 Palabras (7 Páginas)170 Visitas

Página 1 de 7

1.- Descargar paquetes: fdth, moments, VCD[pic 1]

2.- Estableces escritorio de trabajo.

3.- Abrir Script.

1.-LEER FICHEROS

read.table 🡪 .txt

read.csv 🡪 .csv

.xls 🡪 .csv

gatos <- read.csv(file="catsM.csv", header=TRUE, sep=",", dec=".")

[pic 2]

2.- COMANDOS BÁSICOS

-attach (x)

-round(x, digits=0)

-ceiling(x) 🡪 redondeo hacia arriba.

-sum(x) 🡪 suma todo.

-prod(x) 🡪 multiplica entre sí.

-sort(x, decreasing = FALSE) 🡪 ordena – a +.

-sample (1:30, 10, replace =F) 🡪 crear sucesión de valores aleatoria.

-seq (0,2,0.1) 🡪  secuencia todos los nº del 0 al 2, en pasos de 0.1.

-length(x) 🡪 longitud del vector/ tamaño muestral.

-format(Fecha,"%d %b. %Y")

-as.Date(c("1/1/2010","5/1/2010","5/1/2010","6/1/2010"),format="%d/%m/%Y")

-Perros<-cbind(Raza,Edad)

-rbind 🡪 filas.

-cbind 🡪 columnas

-Perros[ order( Edad, decreasing = FALSE ) , ]🡪 ordenar datos en función de una variable.

-PerrosAux2 <- Perros[ Edad > 2 , ]

-gatos3 <- gatos[ Sex=="M" & Hwt>15 , ]

-osos19<-osos2[Month==11 | Weight<20,] 🡪 una condición u otra.

3.- ESTADÍSTICA DESCRIPTIVA UNIVARIANTE

  • VARIABLES CUALITATIVAS

-Fabsoluta: table(x)

-Frelativas: prop.table( table(x))

-Diagrama de sectores🡪  pie( table( Sex ),

labels=c("Machos", "Hembras"),

main="Diagrama de sectores para la variable Sexo",

col = c("cyan","purple"))

  • VARIABLES CUANTITATIVAS DISCRETAS 🡪 pocos que se repiten muchas veces

-Fabsoluta: table(x)

-Frelativas: prop.table( table(x))

-Tabla F.abs acumuladas: cumsum( table( parasitos ) )

-Tabla F.rel aumuladas: cumsum( prop.table( table( parasitos ) ) )

-Diagrama de barras:

  • Frec abs: barplot( table( parasitos ) )
  • Frec abs acumuladas: barplot( cumsum( table( parasitos ) ),

main="Diagrama de barras (acumuladas) del número de parásitos",

xlab="Nº de parásitos",

ylab="Nº de perros",

col="purple" )

  • Frec rel: barplot( prop.table(table( parasitos )))
  • Frec rel acumuladas: barplot( cumsum(prop.table(table( Bwt ))))

  • VARIABLES CUANTITATIVAS CONTINUAS 🡪 muchos que se repiten poco

Tabla de todas las F 🡪 Tabla_frec <- fdt(x)

cf: tenemos las frecuencias absolutas acumuladas.

K <- nclass.Sturges(x) 🡪 Me aplica la regla de Sturges

-HISTOGRAMA

  • Frecuencias absolutas:

plot(Tabla_frec2,

type = "fh",

main = "Histograma de frecuencias absolutas de la variable Longitud",

xlab = "Longitud del oso (en pulgadas)",

ylab = "Frecuencia absoluta",

col = "blue")

  • Frecuencias relativas: plot(Tabla_frec2, type="rfh")
  • Frecuencias abs acumuladas: plot(Tabla_frec2, type="cfh")
  • Frec. Relativas acumuladas en % : plot(Tabla_frec2, type="cfph")

Los histogramas nos permiten saber si los datos presentan simetría. Hay que ver si a la izq y drcha. De la media hay un reparto similar de frecuencias o si hay en un lado más datos que en el otro. Si las frecuencias absolutas a ambos lados son similares 🡪 simetría, si hay más a la derecha que a la izq (asimetría negativa), al revés, +

  • 4.- MEDIDAS DESCRIPTIVAS

4.1.- Medidas de localización

- summary( x) 🡪 media + mediana + cuartiles

- quantile( Length, probs=c(0.15, 0.35, 0.90) ) 🡪 percentiles a distintos niveles

-MODA: Tabla_frec2 <- fdt(Length), el que + se repite, sumar intervalos, /2

4.2.- MEDIDAS DE DISPERSIÓN

-rango <- max( Length ) - min( Length ) Diferencia entre valores max y min de la muestra

-IQR( Length ) 🡪recorrido intercuartílico

- var( Length ) 🡪Cuasivarianza

-Varianza:

1. n <- length( Length )

2. varianza <- var( Length ) * ( n - 1 ) / n Nos informa de la dispersión global de los datos.

- sqrt( varianza) 🡪desviación típica Una desviación típica pequeña nos indica que los valores del conjunto de datos son muy similares a la media.

- sqrt(var(Length)) 🡪cuasi-desviación típica

- CV <- sqrt( varianza)/mean(Length) 🡪 coeficiente de variación (adimensional, entre 0 y 1) Cuanto más pequeño, menor variabilidad.

4.3.- MEDIDAS DE ASIMETRÍA

-Coeficiente de asimetría Fisher 🡪 skewness( Length )

🡪 Si el coeficiente es próximo a 0 los datos presentan simetría. Si es + , los datos tienen asimetría positiva, si es -, tienen asimetría negativa.

-Histograma.

4.4.-DIAGRAMA DE CAJA 🡪 boxplot( Length, main="Diagrama de caja para Length")

*Si hay valores atípicos por debajo quantile( Length, probs=0.25) - 1.5 * IQR(Length) y por encima quantile( Length, probs=0.75) + 1.5 * IQR(Length). Nos quedamos con los que estén por encima de x y por debajo de x

Length2 <- Length[ Length > 41.62 & Length < 82.62 ] y boxplot( Length2 )

  • Mediana: Nos da el valor.
  • Cuartiles: En el diagrama de arriba, el valor de Q1 es 3, y el valor de Q3 es 6. Esto quiere decir que el 50% central de la variable oscila entre las puntuaciones 3 y 6.
  • Bigotes: Nos representan las puntuaciones más altas/bajas de la variable. Por lo tanto, esta línea representa la puntuación más alta de la variable, siempre que esta puntuación no sea más alta que el límite superior que hemos calculado para identificar a los valores atípicos leves. Si un bigote está muy alto y el otro muy bajo, hay más variabilidad en el alto.
  • Cuando hay dos diagramas, podemos ver la dispersión de datos, si es muy grande o pequeña.

5.- Estadística descriptiva bivariante

5.1.-Variables cualitativas (o variables cuantitativas discretas o continuas, aunque en dicho caso serán tratadas como variables cualitativas, y no se hará uso del significado numérico del valor de la variable).

...

Descargar como (para miembros actualizados) txt (12 Kb) pdf (176 Kb) docx (42 Kb)
Leer 6 páginas más »
Disponible sólo en Clubensayos.com