Comenzar con R

Romina De León

Comenzaremos con una breve ejercitación para comenzar a incorporar el flujo de trabajo en RStudio, iniciando con la utilización comandos básicos y observar las potentes visualizaciones con datos propios del software.


Aclaración, se utilizan como sinónimos e indistintamente, R y RStudio.

Primeros pasos

Limpieza de entorno

Inicialmente debemos tener en cuenta, si has utilizado con anterioridad el programa, que será conveniente comenzar a trabajar en un entorno limpio:

rm(list = ls())
#rm es código de remove que elimina objetos dentro de la lista de variables, ls()

Ubicación de lugar de trabajo

Posteriormente, ubicaremos el lugar de trabajo, para ello primero pediremos la dirección donde estoy trabajando, si es la que necesito puedo utilizar los siguientes comandos para setear mi ubicación:

getwd() #nos devuelve la carpeta de trabajo actual

path_wd <- getwd() #comando que copia la dirección de carpeta

setwd(path_wd) #seteo mi lugar de trabajo, resulta más sencillo cuando las direcciones son largas o para evitar error de puntuaciones

Importante, recordemos que con <- asignamos una variable a otra.

En caso que el primer comando no devuelva el lugar donde quiero trabajar, puedo copiar la ubicación desde la carpeta o puedo abrir el archivo necesario desde File.

Ejemplos de usos

Caso 1

Vamos a realizar una serie de visualizaciones por simples comandos para acercarnos al funcionamiento en RStudio.

Recordemos que luego de estos pasos, lo fundamental en R es instalar y llamar paquetes y librerías necesarias.

Ahora continuaremos con la carga de la librería, y de uno de los datasets que se encuentran por default en R, como ser mtcars, iris, etc. Para nuetro primer ejemplo usaremos mtcars que contiene información sobre diferentes modelos de automóviles, incluyendo el consumo de combustible y características del motor.

data("mtcars") #con data() llamamos al dataset mtcars, no hace falta conocer su contenido, sin embargo daremos una lectura para entender de que se trata 
mtcars #De esta manera llamamos a nuestro dataset

Ahora realizaremos una visualización genérica de los datos mediante plot() que es una función genérica de R, para hacer visualizaciones básicas como la siguiente. Este tipo de gráfico representa una matriz de dispersión, donde reflejará relaciones y patrones entre las variables numéricas del conjunto de datos. Asimismo también podemos considerar que frente a la cantidad de elementos de este dataset es abrumadora.

plot(mtcars) 

Por lo cual, podríamos mejorarla con algunas indicaciones, por ejemplo seleccionando sólo algunas columnas de ese dataset, mediante el uso de corchetes, para indicar que queremos que represente las columnas 2 a 6.

plot(mtcars[, 2:6]) 

También podríamos darle color, incluyendo col = "color", dentro de las comillas indicamos el valor deseado, y cambiar los símbolos de los puntos, por medio de pch = el número que le sigue indica diferentes símbolos

plot(mtcars[, 2:6], col = "purple", pch = 13)

Caso 2

Ahora veremos otro ejemplo pero llamando a la librería que instalamos al principio, ggplot2, recordemos que solo lo haremos la primera vez que la utilizamos en la sesión, luego queda cargada. Asimismo, queda para la próxima unidad, una explicación más clara sobre la misma, puesto que la usaremos y daremos un detalle mayor de sus funcionalidad. Para ello vamos a cargar otro de los datasets, que mencioné que están predeterminados en R, que es iris, como lo hicimos en el caso anterior:

data("iris")

head(iris, n= 10) #con el comando head() y "n = 10" le pedimos que solo nos muestre las primeras 10 filas del dataset 

Ahora realizaremos un gráfico, con qplot, que muestra también una dispersión de la relación entre las variables del dataset, para ello le diremos que utilice datos de las columnas Petal.Length, Petal.Width y Species, es decir, veremos la dispersión representada en cada punto, que indicará la relación entre cada flor, con diferentes colores, la longitud del pétalo (eje X) y el ancho del pétalo (eje Y).

library(ggplot2) #ahora cargaremos la librería que cargamos al inicio

qplot(Petal.Length, Petal.Width, data = iris, color = Species) 

Caso 3

Este último ejemplo presentará como también en R se pueden utilizar georreferencias, y graficarlas. Para ello instalaremos y llamaremos al paquete leaflet que nos brinda una interfaz para crear mapas interactivos y visualizaciones geoespaciales.

library(leaflet) #llamo a la librería que cree al principio

# Definimos la latitud y longitud de la ubicación específica, para ello fui a Google maps y utilicé mis coordenadas

lat <- -34.64 #indico la latitud

long <- -58.60 #indico la longitud

# Asignamos a una nueva variable mapa los datos de mi ubicación

mapa <- leaflet() #creo el objeto mapa para que luego muestre el mapa interactivo.

mapa <- setView(mapa, lng = long, lat = lat, zoom = 12) #Aquí establecemos la vista inicial del mapa, centramos en una ubicación específica, y le indicamos el nivel de zoom

mapa <- addTiles(mapa) #con este comando indicamos que  agregue el tipo de fondo de mapa, esta librería cuenta con varios proveedores y estilos que permiten personalizar el fondo del mapa

# Muestra nuestro mapa interactivo
mapa

Ejercicio

Hasta aquí le he dejado algunas demostraciones de la potencia de R, ahora le suguiero que se familiaricen con la consola y el entorno, podrían por ejemplo probar nuevas latitudes y longitudes para el mapa, o mirar otras relaciones dentro del dataset Iris y graficarlo, así como también con mtcars.

Cualquier inquietud no duden en escribirme!