本系列配套练习数据下载链接:
链接:https://pan.baidu.com/s/1imKDcw9wZWk_ItR8fwugZw?pwd=mnsj
提取码:mnsj
-
1、概念:
探索性回归工具对输入的候选解释变量的所有可能组合进行评估,以便根据指定的指标找出能够最好地解释因变量的普通最小二乘法OLS模型。
—————-
-
2、工具:
-
权重矩阵文件:用于定义输入要素之间空间关系的空间权重的文件。此文件用于评估回归残差之间的空间自相关。可以使用生成空间权重矩阵文件工具来创建此文件。未提供空间权重矩阵文件的情况下,将根据每个要素的 8 个最相邻像元对残差的空间自相关进行评估。空间权重矩阵文件仅用于分析模型残差中的空间结构,不用于构建或校准任何 OLS 模型
-
解释变量的最大数量:将对解释变量数不超过此处输入值的所有模型进行评估。例如,如果解释变量的最小数量是 2,解释变量的最大数量是 3,工具会对包含两个解释变量的任一组合的所有模型进行评估,还会对包含三个解释变量的任一组合的所有模型进行评估。
-
解释变量的最小数量:此值表示所评估模型的解释变量的最小数量。例如,如果解释变量的最小数量是 2,解释变量的最大数量是 3,探索性回归工具会对包含两个解释变量的任一组合的所有模型进行评估,还会对包含三个解释变量的任一组合的所有模型进行评估。
-
可接受的最小校正 R 平方:视为合格模型的最小校正可决系数值。如果模型已通过所有其它搜索条件,但“校正可决系数”值小于此处输入的值,则不会在输出报表文件中将其显示为“合格模型”。此参数的有效值范围是 0.0 至 1.0。默认值为 0.5,表示合格模型将解释因变量中至少 50% 的变化。
-
最大系数 p 值边界:对于所评估的每个模型,OLS 会计算解释变量系数 p 值。此处输入的边界 p 值表示模型中所有系数所需的置信度,需要达到此置信度才能认为模型满足条件。p 值较小表示置信度较强。此参数有效值的范围是 1.0 至 0.0,默认值是 0.05,表示合格模型只包含其系数在统计学上处于 95% 置信度(p 值小于 0.05)的解释变量。要放宽此默认值,则应输入较大的 p 值边界,例如 0.1。如果得到的合格模型较多,则您可能希望使此搜索条件更为严格,那么可以将默认 p 值边界从 0.05 减小为 0.01 或者更小的值。
-
最大 VIF 值边界:此值表示可接受的模型解释变量之间的冗余(多重共线性)。当 VIF(方差膨胀因子)值高于 7.5 时,多重共线性会使模型变得不稳定;因此,此处的默认值是 7.5。如果您想让合格模型具有更少的冗余,则应为此参数输入较小的值,如 5.0。
-
可接受的最小 Jarque Bera p 值:Jarque-Bera 诊断检验所返回的 p 值将表示模型残差是否呈正态分布。如果 p 值在统计学上具有显著性(小),则模型残差不呈现正态分布,模型有偏差。合格模型应具有较大的 Jarque-Bera p 值。默认可接受的最小 p 值是 0.1。只有返回的 p 值大于此最小值的模型才被认为是合格的。如果查找无偏合格模型很困难,并决定放宽此条件,则可以输入更小的最小 p 值,如 0.05。
-
可接受的最小空间自相关 p 值:对于通过所有其他搜索条件的模型,探索性回归工具将使用 Global Moran’s I 对模型残差进行空间聚类检查。当此诊断检验的 p 值在统计学上具有显著性(p值小)时,表示该模型很可能缺少关键的解释变量(即不能说明整个情况)。对于此诊断检验,合格模型应具有较大的 p 值。默认的最小 p 值是 0.1,只有返回的 p 值大于此最小值的模型才被认为是合格的。如果对于此诊断检验,查找正确指定的模型很困难,并决定放宽此搜索条件,则可以输入更小的最小值,如 0.05。
-
1. 基于解释变量数量的最佳模型:
-
2. 探索性回归全局汇总:
3. 变量显著性的汇总:
-
4. 多重共线性的汇总:
报表的多重共线性的汇总节可与变量显著性的汇总节结合使用,以便了解为改善性能可将哪些备选解释变量从分析中移除。多重共线性的汇总节说明了具备较高多重共线性的模型中各解释变量出现的次数,以及同时包含在这些模型中的其他解释变量。若两个(或更多)解释变量经常同时出现在多重共线性较高的模型中,则表示这些变量的作用可能相同。
5. 其他诊断的汇总:
2)、可选表格:
如果提供了输出结果表的值,则将创建包含符合最大 p 值系数边界和最大 VIF 值边界条件的所有模型的表格。即使没有通过模型,输出表中也可能包含一些模型。
本篇文章来源于微信公众号: 码农设计师