作者:陆勤
摘要:介绍玩数据的流程和搭建R语言工作环境。
文章《R语言玩数据:R语言和数据》介绍了R语言是什么?数据是什么?为什么用R语言玩数据?等基本问题,本文总结玩数据的流程,介绍R语言玩数据的工作环境构建。
玩数据流程
做任何事情都有相对应的方法论,玩数据也不例外。
IBM的CRISP-DM可以作为玩数据的流程,如图:
业务理解:清楚业务问题和目标
数据理解:深入了解用于数据分析和挖掘的数据
数据准备:对待挖掘数据进行合并,汇总,排序,样本选取等操作
建立模型:根据前期准备的数据选取合适的模型
模型评估:使用在商业理解阶段设立的业务成功标准对模型进行评估
结果部署:使用挖掘后的结果提升业务的过程
玩数据的工作环境
选择R语言玩数据,首先要安装R软件,它是一款开源软件,根据自己的操作系统和机器的位数,下载和安装相应的软件。
R软件下载网址:
首页如下图
点击红色矩形框,进入R软件下载页面
R软件安装成功后,启动软件,如下图
R控制台显示了一些告知信息,包括R的版本,R的简介,R几个常用函数的作用。
安装好R软件后,推荐安装R的集成开发工具RStudio软件。
RStudio软件的下载网址:
如下图
点击红色矩形框,下载RStudio软件
RStudio软件安装成功后,启动软件,如下图
上面的软件界面做了如下设置
说明:先安装R软件,后安装RStudio软件
R软件和RStudio软件安装好后,玩数据的环境也就搭建好了,后续就可以利用这个工作环境用R语言玩数据了。
参考资料:
1 R官网
2 RStudio官网
3 使用IBM SPSSModeler 进行数据挖掘之数据理解
您在阅读中,有什么建议或者想法,请留言,也可以加微信luqin360交流。