Comenzaremos con una breve ejercitación para comenzar a incorporar el flujo de trabajo en RStudio, iniciando con la utilización comandos básicos y observar las potentes visualizaciones con datos propios del software.
Aclaración, se utilizan como sinónimos e indistintamente, R y RStudio.
Inicialmente debemos tener en cuenta, si has utilizado con anterioridad el programa, que será conveniente comenzar a trabajar en un entorno limpio:
rm(list = ls())
#rm es código de remove que elimina objetos dentro de la lista de variables, ls()
Posteriormente, ubicaremos el lugar de trabajo, para ello primero pediremos la dirección donde estoy trabajando, si es la que necesito puedo utilizar los siguientes comandos para setear mi ubicación:
getwd() #nos devuelve la carpeta de trabajo actual
path_wd <- getwd() #comando que copia la dirección de carpeta
setwd(path_wd) #seteo mi lugar de trabajo, resulta más sencillo cuando las direcciones son largas o para evitar error de puntuaciones
Importante, recordemos que con <- asignamos una variable a otra.
En caso que el primer comando no devuelva el lugar donde quiero trabajar, puedo copiar la ubicación desde la carpeta o puedo abrir el archivo necesario desde File.
Vamos a realizar una serie de visualizaciones por simples comandos para acercarnos al funcionamiento en RStudio.
Recordemos que luego de estos pasos, lo fundamental en R es instalar y llamar paquetes y librerías necesarias.
Ahora continuaremos con la carga de la librería, y de uno de los
datasets que se encuentran por default en R, como ser
mtcars
, iris
, etc. Para nuetro primer ejemplo
usaremos mtcars
que contiene información sobre diferentes
modelos de automóviles, incluyendo el consumo de combustible y
características del motor.
data("mtcars") #con data() llamamos al dataset mtcars, no hace falta conocer su contenido, sin embargo daremos una lectura para entender de que se trata
mtcars #De esta manera llamamos a nuestro dataset
Ahora realizaremos una visualización genérica de los datos mediante
plot()
que es una función genérica de R, para hacer
visualizaciones básicas como la siguiente. Este tipo de gráfico
representa una matriz de dispersión, donde reflejará relaciones y
patrones entre las variables numéricas del conjunto de datos. Asimismo
también podemos considerar que frente a la cantidad de elementos de este
dataset es abrumadora.
plot(mtcars)
Por lo cual, podríamos mejorarla con algunas indicaciones, por ejemplo seleccionando sólo algunas columnas de ese dataset, mediante el uso de corchetes, para indicar que queremos que represente las columnas 2 a 6.
plot(mtcars[, 2:6])
También podríamos darle color, incluyendo col = "color"
,
dentro de las comillas indicamos el valor deseado, y cambiar los
símbolos de los puntos, por medio de pch =
el número que le
sigue indica diferentes símbolos
plot(mtcars[, 2:6], col = "purple", pch = 13)
Ahora veremos otro ejemplo pero llamando a la librería que instalamos
al principio, ggplot2
, recordemos que solo lo haremos la
primera vez que la utilizamos en la sesión, luego queda cargada.
Asimismo, queda para la próxima unidad, una explicación más clara sobre
la misma, puesto que la usaremos y daremos un detalle mayor de sus
funcionalidad. Para ello vamos a cargar otro de los datasets, que
mencioné que están predeterminados en R, que es iris
, como
lo hicimos en el caso anterior:
data("iris")
head(iris, n= 10) #con el comando head() y "n = 10" le pedimos que solo nos muestre las primeras 10 filas del dataset
Ahora realizaremos un gráfico, con qplot
, que muestra
también una dispersión de la relación entre las variables del dataset,
para ello le diremos que utilice datos de las columnas
Petal.Length
, Petal.Width
y
Species
, es decir, veremos la dispersión representada en
cada punto, que indicará la relación entre cada flor, con diferentes
colores, la longitud del pétalo (eje X) y el ancho del pétalo (eje
Y).
library(ggplot2) #ahora cargaremos la librería que cargamos al inicio
qplot(Petal.Length, Petal.Width, data = iris, color = Species)
Este último ejemplo presentará como también en R se pueden utilizar
georreferencias, y graficarlas. Para ello instalaremos y llamaremos al
paquete leaflet
que nos brinda una interfaz para crear
mapas interactivos y visualizaciones geoespaciales.
library(leaflet) #llamo a la librería que cree al principio
# Definimos la latitud y longitud de la ubicación específica, para ello fui a Google maps y utilicé mis coordenadas
lat <- -34.64 #indico la latitud
long <- -58.60 #indico la longitud
# Asignamos a una nueva variable mapa los datos de mi ubicación
mapa <- leaflet() #creo el objeto mapa para que luego muestre el mapa interactivo.
mapa <- setView(mapa, lng = long, lat = lat, zoom = 12) #Aquí establecemos la vista inicial del mapa, centramos en una ubicación específica, y le indicamos el nivel de zoom
mapa <- addTiles(mapa) #con este comando indicamos que agregue el tipo de fondo de mapa, esta librería cuenta con varios proveedores y estilos que permiten personalizar el fondo del mapa
# Muestra nuestro mapa interactivo
mapa
Hasta aquí le he dejado algunas demostraciones de la potencia de R,
ahora le suguiero que se familiaricen con la consola y el entorno,
podrían por ejemplo probar nuevas latitudes y longitudes para el mapa, o
mirar otras relaciones dentro del dataset Iris
y
graficarlo, así como también con mtcars
.
Cualquier inquietud no duden en escribirme!