Los variogramas o semivariogramas, son funciones que describen la semivarianza de un grupo de muestras a una distancia.
En sí, el variograma permite analizar el comportamiento espacial de una variable sobre un área definida y la influencia que cada uno de los registros tiene sobre sus vecinos. De la misma forma, permite tanto saber si existen clústeres o agrupaciones espaciales de valores similares, como si se dan valores que destaquen sobre sus vecinos: los denominados outliers o valores atípicos.
Por tanto, este estadístico pone en relación:
- La distancia de cada punto respecto a sus vecinos
- El cuadrado de la diferencia de sus valores.
Al relacionarse por pares sobre un gráfico, se genera una “nube de puntos” correspondiente a cada una de las relaciones entre puntos vecinos, de 1 a n puntos o muestras que contenga la muestra.
¿Cómo se generan los semivariogramas?
En este caso, para crear este tipo de gráficos tendremos que acceder a la librería de procesos SAGA. Recordamos que Saga es un software GIS multiplataforma, al cual podemos acceder desde la caja de herramientas de procesos de QGIS siempre que previamente lo hayamos instalado en el sistema.
Para ejecutar la herramienta, accederemos a SAGA > “variogram cloud”. Podremos hacerlo buscándolo desde la caja de herramientas de procesos.

Una vez que accedemos a la herramienta, incluiremos la capa con la que queremos trabajar, en este caso van a ser las temperaturas máximas recogidas en las estaciones meteorológicas de Aragón, y le daremos a guardar nuestro Variogram Cloud o Nube de puntos.
Dependiendo de la versión de QGIS que tengamos, debemos asegurarnos de que su extensión sea un archivo .csv o dbf, no un archivo vectorial .shp.

Una vez esté todo configurado ejecutamos el proceso. Se nos debería cargar el archivo, en mi caso dbf, en formato tabla en nuestro panel de capas.

Al inspeccionar el archivo, podemos ver los distintos campos que se han creado:
- Distancia (geométrica en línea recta entre el punto A y el punto B)
- Dirección (del vector, en grados entre el punto A y el punto B)
- Diferencia (del valor de los dos puntos A y B)
- Varianza de los valores de ambos puntos
- Semivarianza de los valores de ambos puntos
- Covarianza de los valores de ambos puntos
Para poder visualizar la información mediante un gráfico de dispersión, deberemos tener instalado el complemento de Data Plotly previamente. Si no lo tienes instalado, puedes encontrarlo y proceder a su instalación desde:
Complementos > Administrar e Instalar Complementos > Data Plotly > Instalar Complemento
En el Eje de las X especificaremos el atributo distancia y en el eje de las Y el atributo semivarianza. Con ambas variables, se genera un gráfico denominado semivariograma que, como hemos comentado, pone en relación la distancia con la semivarianza de cada punto con todos y cada uno de sus vecinos.

Cada uno de los puntos representados en el gráfico, por tanto, no corresponde a un punto de la capa de temperatura máxima, sino que representa los pares de valores de cada una de las relaciones de todos los puntos para todos los puntos vecinos.

¿Como interpretar un semivariograma?
En lo primero que nos fijamos es que existen una serie de valores que destacan por su elevada semivarianza respecto el resto de puntos del gráfico. Sin embargo, en realidad podríamos diferenciar 3 grupos de relaciones distribuidos en función de qué tan cerca se agrupan los conjuntos de puntos.
- Valores próximos con poca semivarianza de los registros
- Valores lejanos con poca semivarianza de los registros
- Valores intermedios con mucha semivarianza en los registros

Con esta información, podemos intuir de forma muy sencilla y rápida, qué tipos de relaciones espaciales se dan y especular a qué se atribuyen cada uno de los grupos antes citados.
Los valores del grupo A se atribuyen a las relaciones entre puntos situados muy cerca geográficamente y cuyos registros de temperatura máxima no distan notablemente.
El grupo B se compone de las relaciones dadas entre puntos cuyos valores de temperatura máxima son relativamente similares, pero están más alejados geográficamente.
Podríamos deducir que efectivamente hacen referencia a dos áreas con una cantidad de temperaturas máximas a lo largo del año similar pero que se encuentran muy separadas en el espacio.
Teniendo todo ello en cuenta, intuimos que los valores del grupo C se han de dar en lugares intermedios, pero con una amplia diferencia en los valores de temperatura máxima que contienen sus registros. Se trataría de relaciones donde se comparan los anteriormente denominados outliers o valores atípicos respecto sus vecinos más próximos.
Si quieres aprender más sobre diagramas de dispersión y diferentes formas de interpretar los datos, apúntate a nuestros cursos de: Geoestadística Descriptiva e Interpolación espacial en QGIS o al curso de Geoestadística descriptiva e interpolación espacial en ArcGIS y QGIS
¿Quieres comentarnos algo? Adelante!