本文数据可以通过以下链接获取:
链接:https://pan.baidu.com/s/1zNM6yINkA5QSPvO6trlUTw
提取码:9z8r
- 打开之前
字段拆分与字段合并
操作最后保存的data_new.sav
文件,本次我们将数据中的性别进行重新编码(男–>0 , 女–>1)。
- 单击【转换→可视分箱】选项,弹出可视分箱对话框(第一步),将年龄变量移至
要分箱的变量
框中,单击继续。
- 在弹出可视分箱对话框(第二步),在
分箱话变量
栏中输入年龄段
,然后单击生成分割点
按钮。
- 在弹出的
生成分割点
对话框中,选择等宽区间
并设置第一个分割点位置
、分割点数
以及宽度
,这些需要根据所分析的数据以及分析目的确定,设置完成后单击应用,返回可视分箱对话框(第二步)。另外,可以在可视分箱对话框(第二步)对话框中的网格
中直接输入自定义的分割点,达到不等距分割的目的。
- 在可视分箱对话框(第二步)中,单击
生成标签
按钮,将生成对应的区间范围标签,单击确定,即可得到年龄段
变量。
至此可以看出,可视化分箱操作与上一篇重新编码功能有相似之处。