您的位置 首页 > 数码极客

如何把数据按照区间段分类赋值

前言

我们知道在SPSS里面,在设置变量的时候,数据是被分为三种类型的,很多人几乎没有注意到果这个情况。那么在处理特定的问题的时候,反而需要解决这个问题。SPSS将数据分为三类:名义变量,有序变量和尺度变量,对应的是应用于定性资料(计数资料、无序分类资料)、等级资料(有序分类资料)和定量资料(计量资料)。

尺度变量,说白了也就是对象采用定量测量方法获取的,如身高、体重等。

名义变量,一般是按某种属性分的,如性别、血型等。

有序变量,则是指按照一定的数量级分类的,如疾病的轻中重。

对于尺度变量的统计学描述通常要使用整理频数分布表,这个在我们的统计学教材一开始就体现了。计算它的集中趋势和离散趋势的方法。

如何制作频数表

区间数据频数分段

我们尝试采用可视化分组方法对某数据进行分类,这里我有手头现有数据,某学校的学生身高。

变量设置情况

数据情况

我们的目的是要将身高进行频数分段

执行频数分组命令

我们选择transform---visual binning命令,将会弹出对话框如下

选择身高作为频数分组变量

接下来是可视化的分组界面

可视化分组界面

这个对话框里面的内容相当丰富,我们可以直观的看到直方图,当然这个分组可以自动分组,也可以手动分组,自动分组的话,数据可能不是很规整,但快速,手动的话,可以将频数组段设置的更规范一些。我们先按照自动分组来看看。

选择身高变量--输入binned variable,这个是频数分组结果变量,一定要输入的。我们输入XSG (新身高)

新变量和分组的范围包含与否

调整组距

我们调整组距,按照等宽的方式分组,并且将最低设置为100,共分11组,组距为3

调整后

确认后就得到上图,是不是变得很整齐了。

新变量

提示将分组的组数创建一个新的变量

最终得到

结果

是不是显示出每个学生身高的数据所在的分组位置(即第几个组段),这样一个频数分布就做好了,手动大家可以探索一下。

后记

频数组段的区分是很有用的方法,在对尺度变量的数据进行分组很容易,这样以便很好的用作统计分析。

好了,手打很辛苦,版权需尊重,我欢迎转载,但注明出处,记得关注我。

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

“如何把数据按照区间段分类赋值”边界阅读