La estadística espacial es la rama de la estadística, que estudia el comportamiento espacial de un conjunto de entidades. Para acometer dicha tarea, existen una serie de análisis estadísticos, entre los que cabe citar aquellos que analizan el grado de aglomeración espacial de entidades. Medir esta aglomeración, implica definir una escala adecuada de análisis, que se relaciona con cada caso de estudio y el grado de conocimiento de éste.
El análisis de puntos calientes optimizado (Optimized Hot Spot Analysis), puede ayudar a disponer de una escala de referencia para acometer este tipo de análisis. A continuación expondremos un ejemplo de aplicación de este análisis (puntos calientes optimizado), considerando las distintas opciones de agregación de puntos, para comprender mejor qué opción utilizar para un caso de estudio específico.
Herramientas de estadística espacial en ArcGIS PRO
Las herramientas de estadística espacial disponibles en ArcGIS PRO se clasifican en 5 categorías que son:
- Patrones espaciales
- Asignación de cluster
- Mediciones geográficas
- Modelado de relaciones espaciales y…
- Misceláneos (Servicios públicos).
Cada categoría cuenta con una serie de scripts que ejecutan análisis alusivos a la categoría en la cual se ubica.
Las herramientas de asignación de cluster, se utilizan para realizar una comprobación estadística acerca del grado de aglomeración en la distribución espacial de un conjunto de entidades (puntos o polígonos). Dentro de este grupo, se exhibe el análisis de puntos calientes optimizado, que ejecuta un análisis automático para proporcionar los valores que se podrían considerar como óptimos, respecto de la escala de análisis, distancia de banda fija y distancia máxima de cluster.
Se utilizará esta herramienta cuando se desee disponer de una referencia con respecto a estos valores, a la hora de aplicar el análisis de puntos calientes Gi* de Gestis Ord.
Esquema de agregación de puntos
La herramienta Análisis de puntos calientes optimizado, dispone de una variable relativa al esquema de agregación de puntos, que se asigna, cuando no se suministra un campo de análisis. Según la opción utilizada el resultado será diferente, por lo que es recomendable probar todas las opciones, tal como se muestra a continuación:
- Contar incidentes dentro de cuadrícula de red: Crea una malla de polígonos y cuenta el número de eventos que ocurren dentro de cada polígono. En el ejemplo de casos de chikungunya en la ciudad de Valencia-Venezuela, el resultado de aplicar esta opción, sólo presenta un cluster de puntos calientes acotado al sector céntrico de dicha ciudad. La tabla proporciona los valores de escala, distancias y porcentaje de entidades con menos de 8 vecinos.
Tamaño de la celda | Banda de distancia fija | Distancia peak de cluster | Entidades con menos de 8 vecinos |
306 metros | 1539 metros | 1539 metros | 10,7 % |
- Alinear incidentes próximos para crear puntos ponderados: calcula una distancia de alineación que se usa para agregar puntos cercanos. Esta opción no admite el ingreso de un área de delimitación, dado que trabaja estrictamente sobre el conjunto de entidades y la capa derivada, se representa en forma de puntos. El resultado en los casos de chikungunya en la ciudad de Valencia-Venezuela, muestra un cluster de puntos calientes que se propaga desde el centro hacia el sector suroeste de la ciudad. La tabla señala los valores de distancias y porcentaje de entidades con menos de 8 vecinos, como resultado de aplicar la alineación de puntos ponderados.
Agregación de incidentes | Banda de distancia fija | Distancia peak de cluster | Entidades con menos de 8 vecinos |
131 metros | 2212 metros | 2212 metros | 9,4 % |
- Contar incidentes dentro de cuadrícula hexagonal: Crear una malla de hexágonos y cuenta el número de eventos dentro de cada hexágono, dato utilizado como valor de agregación. La malla hexagonal, brinda una estructura de teselas más natural que la red de cuadrícula, con una mayor probabilidad de encontrar un vecino cercano.
El resultado de esta opción en los casos de chikungunya en la ciudad de Valencia-Venezuela, muestra un cluster de puntos calientes acotado al centro de la ciudad y uno más tenue en la parte suroeste de ésta. La tabla indica los valores de escala, distancias y porcentaje de entidades con menos de 8 vecinos, como resultado de aplicar esta cuadrícula hexagonal.
Altura del hexágono | Banda de distancia fija | Distancia peak de cluster | Entidades con menos de 8 vecinos |
306 metros | 1703 metros | No se encontraron | 7,1 % |
- Contar incidentes dentro de cuadrícula hexagonal, e incorporar polígono de delimitación, que en este caso es la poligonal de la ciudad. El resultado en los casos de chikungunya en la ciudad de Valencia-Venezuela, muestra un notorio cluster de puntos calientes que va desde el centro de la ciudad abarcando el sector suroeste de esta (ver mapas). La tabla señala los valores de escala, distancias y porcentaje de entidades con menos de 8 vecinos.
Altura del hexágono | Banda de distancia fija | Distancia peak de cluster | Entidades con menos de 8 vecinos |
306 metros | 951 metros | No se encontraron | 0 % |
Conclusión
Se deberá de utilizar el análisis de puntos calientes optimizado, cuando le resulte difícil establecer una escala de análisis a priori. Pruebe todas las opciones de agregación de puntos, para decidir cuál es el método que brinda el mejor resultado, sobre el patrón espacial de los datos analizados.
Cuando utilices el método de la cuadrícula de red o hexagonal, resultará relevante proporcionar un área límite, como es en este caso el límite urbano de la ciudad de Valencia-Venezuela. En el estudio, al ser conocida el área límite en la cual puede ocurrir el evento analizado, se obtiene un 0% de entidades con menos de 8 vecinos; esto es porque la delimitación del área de estudio, permite que el análisis de puntos calientes optimizado, considere todas las celdas o hexágonos que caen dentro del área delimitada. De lo contrario todas las celdas o hexágonos sin dato se desecharían, lo que puede resultar en un análisis sesgado.
La opción de puntos ponderados (n° 2 en este artículo), no admite la incorporación del área límite de análisis, puesto que trabaja directamente sobre las entidades individuales. Su resultado es una capa de puntos, que puede ser más difícil de interpretar, que las capas de polígonos que derivan de aplicar los métodos de cuadrícula de red o hexagonal.
Al comparar este último análisis con la aplicación de la herramienta de puntos calientes Gi* de Getis Ord, que se explora en nuestro nuevo “Curso de Análisis Espaciales en Salud Ambiental”, se obtienen resultados similares tal y como se observa en los siguientes mapas. Por lo tanto, la opción de contar eventos sobre una cuadrícula hexagonal incorporando un área de delimitación, es el método que proporciona el análisis más acertado y suministra una escala de análisis de 306 metros.
Referencias utilizadas
- https://pro.arcgis.com/es/pro-app/tool-reference/spatial-statistics/optimized-hot-spot-analysis.htm
- https://desktop.arcgis.com/es/arcmap/10.3/tools/spatial-statistics-toolbox/optimized-hot-spot-analysis.htm
- https://pro.arcgis.com/es/pro-app/tool-reference/spatial-statistics/h-whyhexagons.htm
Autora: Virginia Behm Chang
¿Quieres comentarnos algo? Adelante!