您的位置 首页 > 数码极客

在sas中导入的数据在sas中不能全面显示如何解决

吵着放弃SAS已经两年了,结果每天打开电脑outlook,lync之后,打开的软件仍然是SAS(排在统计大杀器Excel前面)。所以还是想用SAS做专栏技术类文章的头一篇。

文章基本基于我在知乎的SAS第一次回答:考虑从事 SAS 程序员工作,有哪些需要注意的点? - 畅斌的回答 - 知乎 。稍微加了一些我最新的体会。

首先说,SAS并不是一个user friendly的软件。但是其最主要优势体现在处理大量甚至海量的数据的时候。Excel实现简单且结果立刻可见,是做数据和统计的永恒神器,关于Excel做分析尤其是做可视化的结果的各种方法,在知乎上有许多经典的帖子,不妨搜搜看看。但是当日常处理数据最小的几十万行,几十上百列,这样的文件是Excel没有办法处理的。

SAS有两种基础的step:1. data step偏重于数据的处理和生成(manipulation);2.proc step则提供了SAS各种功能强大的统计分析工具。SAS不同版本的演进主要集中在interface和各种工具的开发。现在的SAS既可以满足programmer在简单的环境中纯粹用scripts实现从底层到reporting的各种功能。也可以在开发工具中用简单地拖拽和设计来实现一个复杂的流程。但是,所有过程的本质还是两种最基础的step,所以:无论最后是在什么样的SAS环境中,对于基本的scripts的理解仍然非常重要。

关于SAS对于统计知识的要求不同的人的看法是不一样的,我想主要原因是大多数的SAS重度使用者还是统计学的背景为主(包括生物统计这一主力军),无形中增大了隐形的门槛。但是很多人用SAS的工作其实对统计的要求并不是特别的深,可以做到理解SAS相关proc的原理即可。而且许多实际的工作中最常用的统计方法其实很简单。如果阅读和理解SAS相关的procedures没有问题,统计知识就不会成为做学好SAS的困难。如果参加过SAS官方的各级培训,会发现即使到了中高级的statistics的SAS Training,需要的统计知识仍然没有离开最最基础的一些统计概念。当然,毫无统计背景的人无论如何也应该理解基本的统计知识, 包括各类假设检验,以及能够读懂一个标准的procedure (reg,logistic,univariable等)的结果的大部分内容。

我想SAS最大的一个缺点就是价格,高昂的价格基本上决定了大多数创业公司或者中小企业没有办法承担每年不菲的开销。SAS的主要客户还是大型的公司,但是其实行业上面倒是并不局限于银行或者healthcare,因为只要是需要处理分析大量数据的工作,SAS都是选择。具体说,我在参加SAS培训时,遇到的同学背景很广泛,商业银行,投资银行,餐饮行业,政府部门,大学等等。而我自己的经历也是因为熟练掌握了SAS,才从energy demand forecasting跳到了credit risk modelling这样一个全新的领域。

关于SAS的certificate和官方的training,我的体会是相关的note和考核的内容对于熟练掌握SAS还是很不错的材料。如果在时间精力和财力允许的情况下,通过培训或者认证可以让自己在短时间里有一定的收获。至于在找工作里面,能够熟练掌握SAS的人的确具有非常大的优势:但是实际的工作经验的价值远远高于certificate。另外,如果不是去商业银行或者healthcare大型企业这些非常非常传统的SAS客户,Python,SQL,Hive,R的技能都比SAS要抢手了。尤其是现在热门的fintech公司,几乎没有哪个还在用SAS作为主要工具了。这些变化显然值得注意。大家关注的最多的还是用工具解决问题的能力,而不仅仅是一个工具熟练度的问题。

End.

作者:畅斌

来源:知乎

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

“在sas中导入的数据在sas中不能全面显示如何解决”边界阅读