Introducción a R
R es el lenguaje de programación de referencia en todo el mundo para el análisis estadístico. Se trata de un lenguaje orientado a objetos, ya que permite aplicar cálculos a un conjunto de valores a la vez y, por otro lado, es un lenguaje interpretado, ya que los comandos escritos en el teclado son ejecutados directamente sin necesidad de construir un ejecutable. Otras características destacables son: que consume pocos recursos, es vectorial, está disponible para todos los sistemas operativos y trabaja con otros lenguajes; también se caracteriza por ser gratuito y de código abierto y de la misma manera que Python, dispone de una gran comunidad de desarrolladores detrás que lo mejoran y enriquecen continuamente.
R es un lenguaje muy versátil y muy útil para la gestión de datos y elementos estadísticos, en concreto para operar con vectores y matrices. Gracias a R se puede manipular y analizar las bases de datos de forma muy eficiente, preciso y exacta. Además, dispone de gran cantidad de paquetes para la creación de gráficos y de algoritmos para el Machine Learning, aportando capacidades avanzadas en la visualización y en los resultados de los análisis de los datos, siendo muy útil en la minería de datos.
En el siguiente enlace podéis ver un ejemplo de uso de R para la conversión masiva de imágenes Sentinel 2A a format tif.
Ventajas de utilizar R
Para la integración entre ArcGIS y R, Esri diseño una librería puente. Se trata de un paquete gratuito de código abierto para que ArcGIS y R accedan a los datos de forma dinámica sin crear archivos intermedios en el disco. Es una excelente opción cuándo el análisis de la información requiera de una computación independiente o de un análisis individual en los servidores. Los desarrolladores simplemente tendrán que crear herramientas y cajas de herramientas para llevar a cabo la implementación de R en la plataforma ArcGIS.
Desventajas de utilizar R
A pesar de las grandes ventajas de R, también presenta ciertas desventajas. Y es que, al final R no deja de ser un lenguaje desarrollado por estadistas y para estadistas, con el objetivo final de hacer más sencillos los análisis de datos… y esto se nota en su sintaxis, que dificulta mucho la velocidad de los procesos, por lo que los análisis Big Data son más complicados de llevar a cabo. R solo puede ejecutarse a través de un único procesador y por tanto no tiene capacidad para ejecutarse a gran escala. El volumen de datos que es posible procesar es limitado, ya que los datos se procesan en memoria. Por otro lado, R es un lenguaje muy técnico, por lo que su curva de aprendizaje es muy lenta sobre todo para aquellos que no hayan programado antes.
Instalación y ejemplo de uso
ESRI nos lo pone fácil con una completa guía para aprender a instalarlo y a hacer los primeros pinitos sobre un estudio de criminalidad en San Francisco, con los datos relacionados entre ArcGIS Pro y RStudio.
Claro que todo esto es posible gracias a R-ArcGIS Bridge. Además de los índices de crímenes, este ejercicio también se ejecuta por el enriquecimiento de sus datos con atributos adicionales, como por ejemplo los datos de población de San Francisco.
Por ejemplo, el siguiente mapa nos muestra qué áreas tienen una cifra de delitos inesperadamente alta en relación con la densidad de población. Esto es posible gracias a la identificación de cifras de delitos, ya sean altas o bajas, en toda la ciudad de San Francisco.

Los polígonos hexagonales del mapa representan por áreas donde existe un clustering intenso de valores altos. Son zonas donde se producen cifras de valores sorprendentemente altas, incluso teniendo en cuenta la población, por tanto podemos afirmar por ejemplo, que estas áreas son susceptibles de intensificar la presencia policial con el objeto de reducir los delitos que se cometen.
Autor: Luis Gutiérrez Calvo
¿Quieres comentarnos algo? Adelante!