Desde hace unos años, Python es el lenguaje de programación por excelencia dentro de los Sistemas de Información Geográfica.
Su rápida curva de aprendizaje, la flexibilidad respecto al estilo de codificación, la existencia de librerías de análisis geográfica como GeoPandas, GDAL o Rasterio, la posibilidad que ofrece para la automatización de tareas de geoprocesamiento o la integración en SIG como ArcGIS de ESRI, QGIS o GRASS hace de Python el lenguaje más utilizado por los usuarios y programadores de SIG.
En la siguiente entrada usaremos Python y la librería de acceso y análisis de datos geográficos GeoPandas para realizar un proceso que implicará varias de las funcionalidades básicas de cualquier SIG.
- Entrada y salida de datos (I/O).
- Cargaremos archivos en formato Shapefile
- Almacenaremos el resultado del análisis en formato Geopackage
- Consulta y edición de datos
- Con distintos métodos de Geopandas podremos consultar los atributos asociados, el sistema de coordenadas, los tipos de datos, consultas geométricas
- Actualizaremos y añadiremos nueva información.
- Geoprocesamiento y análisis
- Unión de múltiples capas mediante bucle
- Generaremos estadísticas agrupadas
- Representación de datos en mapas usando Matplotlib
El objetivo del proyecto es el análisis del tipo de cultivos y usos de suelo de parcelario catastral de 14 municipios de la provincia de Valencia. Este tipo de trabajo constituye un proceso real que se integra en los estudios de impacto ambiental realizados por el Área de Territorio de Geoinnova.
Para los trabajos se ha usado la interfaz interactiva JupyterLab. Las librerías necesarias han sido instaladas con el gestor de paquetes y dependencias Conda.
Importación de librerías Python
En primer lugar será necesario añadir las librerías que vamos a necesitar.

- os. Es un módulo estándar de Python nos permite acceder a funcionalidades dependientes del sistema operativo será usado para obtener el listado de subcarpetas donde hemos guardado los datos catastrales.
- Pandas. La librería Panda está especialmente pensada para el manejo y análisis de estructuras de datos mediante índices o nombres para filas y columnas. En nuestro script usaremos su método concat para unir todos los archivos shapes de subparcelas catastrales.
- GeoPandas. La finalidad de GeoPandas es la misma que la de la librería anterior pero en esta ocasión manejando, creando y analizando información geográfica.
- Matplotlib. Esta biblioteca se encargará de la parte gráfica de nuestro código. Al ser usada dentro del entorno interactivo de JupyterLab podremos crear representaciones y mapas de nuestros datos espaciales.
Lectura y consulta archivos Shapefile
Usando el método read_file() de Geopandas podemos recuperar uno de los archivos y empezar a trabajar con él convirtiéndolo en un objeto de tipo GeoDataFrame.

Los formatos vectoriales soportados por GeoPandas son los incorporados por la librería Fiona y van desde los clásicos Shapefile, hasta extensiones CAD (DXF y DGN), pasando por GeoJSON, TopoJSON, GML o GPX entre otros. Es posible también acceder a datos almacenados en bases de datos PostGIS.

La siguiente captura muestra algunas operaciones con el objeto GeoDataFrame como consultar el sistema de coordenadas, ver el número total de registros u obtener los metadatos del conjunto de datos almacenados.

Edición de atributos. Cálculo de área
Para obtener las estadísticas finales de superficies por tipo de cultivos vamos a crear un nuevo campo que almacene el área.
Podemos consultar el área de capa polígono con la propiedad que devuelve el área de GeoPandas y usarlo posteriormente para añadir la información en una nueva columna.

Visualización datos
Para la generación de un mapa sencillo con los datos cargados usamos la función plot(). El método permite añadir argumentos para hacer una representación clasificada por los códigos de cultivos, aplicando una rampa de color que destaca las diferencias cualitativas.

Geoprocesamiento. Unión de capas vectoriales
En la estructura de ficheros de nuestro proyecto tenemos una carpeta denominada catastro donde hemos almacenado en subcarpetas la información del parcelario de varios municipios de Valencia.
Estos archivos en formato Shape, han sido previamente tratados con otro código Python para que contengan los datos relativos a los cultivos asociados a cada subparcela. La información procede de la Sede Virtual de Catastro.
El siguiente paso de nuestro trabajo será la obtención de una única capa con la información parcelaria de los 14 municipios que contiene datos de cultivo, pendiente y altitud media. Sobre esta capa podríamos realizar otro tipo de geoprocesos como por ejemplo un análisis de intersección sobre el trazado proyectado de una línea de alta tensión.
El código debe ser capaz de recorrer la estructura de subcarpetas localizando el archivo shape (SUBPARCELA_RU.shp) y devolvernos la capa de unión. Para obtener el listado de carpetas usaremos el método listdir() de la librería os.
La unión de las capas se hará con concat() de la librería Pandas. El método va a necesitar una lista con el conjunto de GeoDataFrames a unir.
Usaremos bucle for que itere sobre la lista con el nombre de los municipios, para guardar el conjunto de datos que cree al final un único objeto con todos los registros.

Composición de mapas con Matplotlib
Vamos ahora a generar una composición algo más compleja usando la librería Matplotlib.

El resultado de la composición es el siguiente.

Agrupación de datos y generación de estadísticas
Con los datos finales podemos realizar un primer análisis estadístico sobre la superficie total de subparcelas por tipo de cultivo.
Para ello, vamos a necesitar calcular del área y almacenarla en una nueva columna como hemos visto en el apartado anterior. Con este nuevo dato usaremos las funciones de agregación que nos devolverán por cultivo los siguientes datos estadísticos:
- Total de parcelas
- Superficie en metros cuadrados por cultivo
- Área de la parcela máxima y de la mínima
- Superficie media

Exportación de resultados en formato GeoPackage y CSV
Terminamos nuestro análisis con dos productos finales: un archivo en formato GeoPackage con los datos geográficos y un CSV con el análisis estadístico que puede ser consultado por ejemplo con un programa de hojas de cálculo.

Los métodos son:
- to_file() de GeoPandas para los datos geográficos
- to_csv() de Pandas para la información estadística.

Desde Geoinnova podemos dar apoyo a mejorar los flujos de trabajo geoespaciales
Con este completo ejemplo hemos demostrado la potencialidad del lenguaje de programación Python para trabajos de tipo GIS.
Las posibilidades de integración en flujos de trabajo repetitivos tanto para empresas geotecnológicas como aquellas que trabajan con datos de índole geográfico. Si necesitáis apoyo en la automatización de estos procesos no dudéis en poneros en contacto con nosotros.
¿Quieres comentarnos algo? Adelante!