首页软件基础教程ArcGIS【ArcGIS工具箱】12...

【ArcGIS工具箱】129.聚类分布制图——优化的热点分析

系列配套练习数据下载链接:

链接:https://pan.baidu.com/s/1imKDcw9wZWk_ItR8fwugZw?pwd=mnsj 提取码:mnsj
如有需要请尽快下载。如若失效,我也会在最新发布文章中更新下载链接。




聚类分布制图工具集可通过执行聚类分析来识别具有统计显著性的热点、冷点和空间异常值的位置。这些工具在需要根据一个或多个聚类的位置执行某些行动时特别有用,例如在需要分配更多的警力来处理一组集中出现的入室盗窃案时,或者需要确定疾病爆发的地点以找到疾病根源的线索时。

此外,与之前介绍的“分析模式”工具集只能回答“是否存在空间聚类”这样的问题不同,“聚类分布制图”工具可以更加直观地呈现聚类位置和范围,所解答的问题是“聚类(热点/冷点)的出现位置在哪里”、“空间异常值的出现位置在哪里”以及“哪些要素最相似”。

聚类分布制图工具集包含聚类和异常值分析、分组分析、热点分析、优化的热点分析、优化的异常值分析、相似搜索六个工具。

本次主要介绍优化的热点分析工具。

  • 1、概念:

优化的热点分析工具用于识别具有统计显著性的高值(热点)和低值(冷点)的空间聚类。优化的热点分析工具同样使用Getis-Ord Gi*统计,但增加了自动优化分析参数的功能,即优化的热点分析工具会对数据进行查询,从而获得产生最佳热点结果的设置。它自动聚合事件数据,识别适当的分析范围,并纠正多重测试和空间依赖性。该工具对数据进行查询,以确定可优化热点分析结果的设置。

如果要完全控制这些设置,可以改用热点分析工具。

关于热点分析(Getis-Ord Gi*)工具的相关内容可以查看以下文章:

【ArcGIS工具箱】127.聚类分布制图——热点分析(Getis-Ord Gi*)

优化的热点分析工具的工作流包括以下部分:
1、初始数据评估
在进行分析之前,工具会先仔细检查所提供的数据。这包括输入的地理要素、用于分析的可选字段、定义可能发生事件的区域边界,以及如何处理或聚合事件数据。工具的目标是确保要分析的数据具有足够的样本量和变异性,以便得出有意义的统计结论。
  • 数据要求和错误处理:果输入的数据存在几何损坏、缺少几何信息,或者在指定的分析字段中有空值,这些记录将被视为错误,并且不会被纳入分析。为了确保结果的可靠性,当使用Getis-Ord Gi*统计时,至少需要30个要素。如果要素数量少于30,结果可能不可靠。
  • 事件数据聚合:如果提供了代表事件的数据(没有特定分析字段),工具会对这些事件进行聚合,并使用事件的数量作为分析的值。聚合后,仍然需要至少有30个要素才能进行分析。对于事件数据,也需要超过30个要素才能开始聚合。
  • 分析字段的要求:Gi*统计方法要求每个要素都有一个与之关联的值。这意味着,如果提供了分析字段,该字段中的值应该具有一定的变异性(即不是所有值都相同)。例如,该统计方法不适用于二进制数据(即只有两种可能值的数据)。
  • 位置异常值的检测:位置异常值是指与数据集中的大多数要素相比,与邻近要素的距离远得多的要素。这些异常值可以对空间统计(如平均最近邻距离)产生显著影响。为了识别这些异常值,工具会计算每个要素的平均最近邻距离,并评估这些距离的分布。那些与最近的非重合邻近要素距离超过三个标准差距离的要素被视为位置异常值。
2、事件聚合:
如果没有提供分析字段,工具将聚合所有点以获得点计数,从而用作分析字段。存在以下三种可能的聚合方案:
用于创建加权要素以通过事件点数据进行分析的聚合方法。
  • COUNT_INCIDENTS_WITHIN_FISHNET_POLYGONS/ COUNT_INCIDENTS_WITHIN_HEXAGON_POLYGONS:计算合适的面像元大小,并利用所得结果创建渔网面网格或六边形面网格,该网格将固定在事件点上方,并将计算每个面像元内的点数。如果未提供定义事件潜在发生位置的边界面要素图层,则会删除不含点的像元,而仅分析剩余像元。如果提供边界面要素图层,则保留并分析边界面范围内的所有像元。每个面像元的点计数都将用作分析字段。
  • COUNT_INCIDENTS_WITHIN_AGGREGATION_POLYGONS:此方法需要事件点和预定义的聚合面(如行政区域、邮政编码区域等)。将这些聚合面与事件点进行叠加,然后计算每个聚合面内的事件点数量,并确保这些数量具有足够的差异性以进行分析。如果所有聚合面内的事件数量相同,则该方法不适用。
  • COUNT_INCIDENTS_WITHIN_HEXAGON_POLYGONS需要提供用于将事件聚合到计数的面要素图层。此方法将计算每个面内的点事件数,然后对这些面及其相关计数进行分析。将计算捕捉距离并使用该距离聚合附近的事件点。将为每个聚合点提供一个计数,该计数反映捕捉到一起的事件数量。然后将此事件计数用作分析字段来分析这些聚合点。如果有许多重合点或接近重合的点,并且希望维护原始点数据空间模式的各个方面,则该选项是一项合适的聚合策略。
在很多情况下,可能需要尝试不同的聚合方法,来比较哪种方法更能反映原始点数据的空间模式。渔网和六边形解决方案均可以人工分离点事件聚类,但有时,输出比加权点输出更容易解释。

3、分析范围

优化的热点分析工作流的下一环节将处理加权要素。如果提供了包含分析字段的输入数据,或者事件数据聚合方法已经通过事件计数创建了权重,那么这些权重将被应用到分析中。
在确定合适的分析范围之前,需要明确分析的目标和背景知识。例如,如果研究的是疾病暴发,并且知道疾病传播媒介(如蚊虫)的活动范围是10英里,那么最合适的分析范围就是10英里。
但是,如果没有具体的分析范围,就需要使用一些策略来确定。优化的热点分析工具采用了以下策略来确定分析范围:
  • 增量空间自相关:这个策略通过执行Global Moran’s I统计量来测量不同距离下的空间聚类程度。这个过程会排除位置异常值,并通过返回的z得分来确定聚类的程度。随着距离的增大,z得分通常也会增大,表示聚类程度增强。但在某些特定距离下,z得分可能达到峰值,这个峰值反映了最明显的空间聚类距离。优化的热点分析工具会寻找这个峰值距离作为分析范围。如果有多个峰值,会选择第一个。
  • K近邻平均距离:如果没有找到峰值距离,工具会检查要素的空间分布,并计算每个要素生成K个近邻的平均距离。K的值是输入要素数量的5%(或0.05*N),但会调整在3到30之间。如果生成K个近邻的平均距离超过一个标准距离,分析范围就设定为一个标准距离;否则,分析范围将基于这K个近邻的平均距离。
  • 大型密集数据集的处理:对于包含500个或更多相邻要素的大型数据集,为了节省时间,将跳过增量空间自相关分析。而是直接计算能生成30个相邻要素的平均距离,并将其作为分析范围。
最终确定的分析范围将用于执行热点分析,并相当于Getis-Ord Gi*工具中的距离范围或阈值参数。这个距离是执行热点分析时考虑的空间范围,对于准确识别和分析空间聚类至关重要。
4、热点分析
所有前置检查和参数设置完成之后,接下来就会运行Getis-Ord Gi*统计来进行热点分析。
在进行热点分析时,多重测试和空间依赖性是两个需要特别注意的问题。多重测试指的是在数据分析过程中对同一数据集进行多次统计测试,这可能会增加假阳性(即错误地识别出热点或冷点)的风险。而空间依赖性则指的是地理空间数据点之间的相互影响,这可能会影响统计结果的准确性。
为了校正这些问题,热点分析使用了错误发现率(False Discovery Rate,FDR)校正方法。FDR校正方法是一种在多重假设检验中控制假阳性率的统计技术,它通过调整统计显著性的阈值来减少假阳性的数量。在应用FDR校正后,只有那些真正具有统计显著性的热点或冷点才会被标识出来。
最后,分析结果会写入结果窗口中,其中会汇总被标识为具有统计学意义的热点或冷点的要素数量。这些信息对于理解空间数据的分布模式、识别异常值以及进行进一步的空间分析都非常重要。

5、输出

最后一部分是创建输出要素。如果输入要素表示需要聚合的事件数据,则输出要素将反映聚合的加权要素(渔网面或六边形面像元或为事件点聚合面参数提供的聚合面或加权点)。每个要素都具有 z 得分、p 值和 Gi Bin 结果以及每个要素在计算中所包括的相邻要素数。

  • 2、工具:
1、输入要素为面要素:
加载【行政区划】面要素。属性表中的【2017】字段表示各省市生产总值数据。

选择【系统工具箱→Spatial Statistics Tools→聚类分布制图优化的热点分析】工具,在弹出的对话框中进行设置。
  • 事件数据聚合方法:用于创建加权要素以通过事件点数据进行分析的聚合方法;
  • 定义事件潜在发生位置的边界多边形:代表了事件可能发生的地理区域。通过设置这个参数,用户可以限制热点分析的计算范围,使其仅在指定的边界多边形内进行;
  • 用于将事件聚合到计数的面:用于将事件聚合到计数的面要素。主要是指在进行热点分析前,将离散的事件数据(如点数据)聚合到特定的面要素中,以便进行进一步的空间统计分析。该参数允许用户指定如何将事件数据分配到各个地理区域(面)内,并统计每个区域内的事件数量;
  • 像元大小:设置用于聚合点数据的格网的大小。选择渔网格网或者六边形格网时定义;
  • 距离范围:在进行热点分析时考虑的邻近要素之间的最大距离。该参数对于确定哪些要素应该被包括在分析中,以及它们之间的空间关系如何影响分析结果至关重要。

在工具执行期间,用于生成可优化热点分析结果的计算设置报告在结果窗口中:

以下分别是热点分析(Getis-Ord Gi*)工具和优化的热点分析工具的计算结果,可以看到两者还是有明显区别的:

热点分析工具
优化的热点分析工具

2、输入要素为点要素:

加载【POI】点要素,以及【区界】面要素。

选择【系统工具箱→Spatial Statistics Tools→聚类分布制图优化的热点分析】工具,在弹出的对话框中进行设置。

本次不提供分析字段,该工具会将聚合所有点以获得点计数,用作分析字段。

将【区界】设置为定义事件潜在发生位置的边界多边形参数,以限制热点分析的计算范围,使其仅在指定的边界多边形内进行。




本篇文章来源于微信公众号: 码农设计师

RELATED ARTICLES

欢迎留下您的宝贵建议

Please enter your comment!
Please enter your name here

- Advertisment -

Most Popular

Recent Comments