本系列配套练习数据下载链接:
链接:https://pan.baidu.com/s/1imKDcw9wZWk_ItR8fwugZw?pwd=mnsj
提取码:mnsj
-
1、概念:
生成空间权重矩阵工具用于构建空间权重矩阵 (.swm) 文件,以表示数据集中各要素间的空间关系。
—————-
空间统计并不是简单地将传统的(非空间)统计方法套用到包含空间坐标(x 和 y)的数据上。它的独特之处在于,空间统计在分析过程中直接融合了数据的空间关系和非空间关系。这意味着,在进行统计分析时,不仅考虑数据本身的数值特性,还要考虑到数据点之间的空间位置和相互关系。
具体来说,空间统计在计算中会明确地使用到诸如面积、距离、长度等空间度量。这些空间度量对于理解数据点的分布、模式和相互关系至关重要。例如,在地理信息系统中,两个地点之间的距离可能直接影响到它们之间的相互作用或影响。对于许多空间统计,这些空间关系是通过空间权重矩阵文件或表正式指定。
空间权重矩阵文件可用于多种空间统计工具的数学计算,包括空间自相关(Global Moran’s I)、热点分析(Getis-Ord Gi*) 和聚类、聚类和异常值分析(Anselin Local Moran’s I)、高/低聚类 (Getis-Ord General G)等。
1)、空间权重矩阵:
空间权重矩阵(Spatial Weight Matrix)是数据空间结构的一种表现形式,用于描述地理空间单元之间的相对位置和关系。它是对数据集要素之间存在的空间关系的一种量化(或者,至少是对此类关系的概念化方法的一种量化)。
它通常表示为一个n×n的矩阵,其中n代表研究区域内地理单元的数量。矩阵中的每个元素反映了对应地理单元之间的空间联系或相互影响程度。这种联系可以是直接的相邻关系,也可以是基于距离、方向或其他空间属性的更复杂关系。
需要注意的是,为了提高性能,生成的空间权重矩阵文件采用二进制文件格式创建,并且要素关系存储为稀疏矩阵,这意味着仅将非零关系写入文件。这样的设计使得即使空间权重矩阵文件包含大量的非零关系,工具也能保持良好的性能。
2)、空间关系的概念化:
-
INVERSE_DISTANCE:反距离。此选项表示一个要素对另一个要素的影响随着距离的增加而减少。距离越近,影响越大;距离越远,影响越小。这种方法常用于模拟如引力模型或空间插值等场景。 -
FIXED_DISTANCE:固定距离。在这个选项下,用户需要指定一个距离阈值。只有当两个要素之间的距离小于或等于这个阈值时,它们才被视为相邻。这种方法简化了空间关系的计算,但可能忽略了距离阈值之外的重要关系。 -
K_NEAREST_NEIGHBORS:K最近邻。此选项表示每个要素会被视为与其最近的K个邻居相邻。K是一个用户定义的参数,代表邻居的数量。这种方法适用于数据分布不均匀的情况,因为它能确保每个要素都有一定数量的邻居,而不受绝对距离的限制。 -
CONTIGUITY_EDGES_ONLY:仅边相邻。在这种方式下,只有当两个多边形要素共享一条边时,它们才被视为相邻。这是严格意义上的邻接关系。 -
CONTIGUITY_EDGES_CORNERS:边和角点相邻。除了共享边的情况外,如果两个多边形在角点处相接,也被视为相邻。这种方法稍微放宽了邻接的定义,允许通过角点相连的多边形也被视为相邻。 -
DELAUNAY_TRIANGULATION:这是一种基于要素质心创建不重叠三角形的网格的方法。在此选项下,如果两个要素使用相同边且与三角形结点关联,则它们被视为相邻。这种方法常用于地形建模和空间插值等场景。 -
SPACE_TIME_WINDOW:时空窗口。该选项同时考虑空间和时间因素来定义相邻关系。需要指定一个空间距离阈值和一个时间间隔阈值,只有当两个要素在空间和时间上都满足这些阈值时,它们才被视为相邻。这对于分析动态变化的空间数据非常有用。 -
CONVERT_TABLE:使用由输入要素类中每个要素相对于其他要素的数字权重组成的表定义空间关系。表中必须包含“输入要素类唯一 ID”、“NID”(相邻要素 ID)和“权重”字段。
-
2、工具:
选择【系统工具箱→Spatial Statistics Tools→空间关系建模→生成空间权重矩阵】工具,在弹出的对话框中进行设置。
-
唯一 ID 字段:与运行该工具后所获得的要素关系关联。因此,每个要素的唯一 ID 值都必须唯一,而且通常应该位于与要素类一同保留的永久性字段中。由于复制或编辑要素类时 FID 和 OBJECTID 字段值可能会发生变化,所以不能直接使用这些字段。
-
相邻要素的数目:该参数可以覆盖“空间关系反距离或固定距离概念化”的阈值距离参数。如果指定的阈值距离为 10 英里,相邻要素数目参数为 3,则所有要素都至少会接收到 3 个相邻要素(即使必须增加距离阈值才能找到它们)。只有在未达到最小相邻要素数时,才增加距离阈值。
-
行标准化:如果每个要素所具有的邻域数目由聚合方案或者采样过程决定,而不是反映所分析的变量的实际空间分布时,建议使用行标准化。选中时,将按行对空间权重执行标准化——每个权重都除以它的行总和。
本篇文章来源于微信公众号: 码农设计师