您的位置 首页 > 娱乐休闲

产品运营数据分析 spss如何进行分组

当我们的样本量过大,譬如以前讲过的,EXCEL2010最大只支持1048576行、16384列,尤其是当行数大于30万,一般的办公电脑处理都比较吃力,所以推荐做大数据量处理,还是用SPSS。

今天继续分享SPSS的数据分组,在SPSS里面,这个功能路径是:【转化——重新编码为相同变量】、【转化——重新编码为不同变量】,常用的是第二个,不会覆盖原有的变量数据。

第一步,数据录入

继续沿用之前的EXCEL数据文档,把数据拷贝到SPSS软件,设定好变量名称,如下图:

数据视图:

变量视图

这里注意将【PV】这个变量定义为【数值型】,选择了【逗号】表示用千分位区分;第二步,进入编码功能

第三步,选择编码变量这里选择【页面PV】,点击红圈中的箭头,选入右边的变量框;

第四步,定义输出变量

这里定义的新变量名是【PV_G】,标签是【PV分组】;

第五步,设定旧值和新值

入口是上图中的【旧值和新值】,进入后,看到下面的界面,左右两大部分,左边是原有的旧值设定,右边是编码后产生的新值;

开始编码,编码标准,按照昨天的分类,如下图:

指定旧值范围

第一组,是0-10万,大于等于0,小于10万,因此,旧值部分是:从最小值到99999;

注意这里的输出变量名称是【0-10万】,下面有个勾选【输出变量为字符串】,并指定宽度,默认是8,我们定义为12,为何不是8,后面看下结果,就知道了。

定义好之后,点击【添加】,旧值和新值就定义好了,依次定义各个分组的数值。

最后一组,我们通常定义为【范围,从值到最高】,不至于遗漏数据,正如第一组,我们会定义为【范围,从最低值】。

定义好旧值新值,点击【继续】,返回设定页面,这时候,【确定】按钮激活,点击后,编码完成。

第六步,编码完成

如图,数据分组后的界面,注意这里有两个分组变量,第一个是【PV_G】,这是字符串宽度为8的时候,第二个是【PV_GROUP】,字符串是宽度为12,区别和原因,大家自己想想就明白。数据分组后的变量视图

更多精彩内容,请关注互联网分析沙龙微信:techxue 每天为您推送最新、最热干货!

互联网分析沙龙——互联网人的实战分享平台,一个为您提供专业的商业模式、产品、数据、用户、电子商务、社会化媒体、移动互联网等深度分析的信息网站!请在微信公众账号中搜索「techxue」,或用手机扫描左方二维码,即可获得互联网分析沙龙每日精华内容推送和最优搜索体验,并参与编辑活动。

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

“如何用spss将数据分组,如何对数据进行分组,如何将一组数据分组,spss如何导入数据”边界阅读