sas数据集
1 SAS数据集的结构
SAS数据集是关系型的,他包含两个部分:描述部分(变量)和数据部分(观察值)
2 SAS数据集的形式
SAS系统中共有两种类型的数据集:
1、SAS 数据文件(SAS datafiles)
2、SAS 数据视窗(SAS dataviews)—— 只有描述部分,没有数据部分
3 数据集的名字
SAS数据集名字包括三个部分,即:
Libref.da
1、Libref(库标记)──这是SAS数据库的逻辑名字
2、data-set-name(数据集名字)──这是SAS数据集的名字
3、membertype(成员类型)──SAS数据集名字的这一部分用户使用时不必给出。SAS 数据文件的成员类型是DATA;SAS数据视窗的成员类型是VIEW
例如:data=m.abc,其中m为库标记,abc为数据集名字
4 SAS数据集存储方式
SAS数据集储存方式有两种:永久的和临时的,这取决于该数据集附属的数据库是永久的还是临时的
1、对永久数据集命名
假设你想创建一个数据集名为groot的永久数据集,你首先要确定这个数据集储存在哪里,然后使用LIBNAME语句来定义库标记;若选择marvel作为库标记,那么在DATA语句中你应该这样命名SAS数据:
libname marvel 'd:\sas\mydata';/*库标记'(路径)'*/
data marvel.groot;/*库标记.文件名*/
2、对临时数据集命名
临时数据集通常只需要规定数据集名字,系统会自动使用work作为库标记,但每次运行结束后这些文件会被删掉;
如果你执行DATA步但不想创建SAS数据集,可在DATA语句里规定关键字_NULL_作为这个数据集的名字
5 SAS数据集的索引
根据使用关键变量的值组成索引的关键字个数的多少分为:简单索引和复合索引
1、简单索引
简单索引是用一个关键变量的值来对观测定位,假设我要创建关键字段name为索引,如下:
libname marvel 'd:\sas\mydata';/*库标记'(路径)'*/
proc datasets movie=marvel;/*用movie=marvel指明库标记marvel*/
modify groot;/*说明在指定路径下要修改的数据集为groot*/
index create name;/*真正建立索引的语句,name被指定为关键变量*/
contents data=groot/*打印groot数据集的内容资料*/
run;
2、复合索引
引用两个或以上的变量的值来确定观测位置,当创建这个索引时必须规定一个唯一的索引名,如下:
libname marvel 'd:\sas\mydata';/*库标记'(路径)'*/
proc datasets movie=marvel;/*用movie=marvel指明库标记marvel*/
modify groot;/*说明在指定路径下要修改的数据集为groot*/
index create info=(name age skill);/*真正建立索引的语句,name,age,skill被指定为关键变量*/
contents data=groot/*打印groot数据集的内容资料*/
run;
info变量是建立复合索引时,必须由用户自行规定一个唯一的索引名,小括号内的数据集变量的次序表示复合索引的关键字次序,即name是第一关键字,age是第二关键字,skill是第三关键字。
6 联系和删除库标记的方法
A、可以使用LIBNAME语句把库标记与路径联系起来.例如:
libname marvel 'd:\sas\mydata';
B、也可以使用LIBNAME语句删除这个库标记,例如:
libname marvel clear ;
库标记是在SAS系统中用来标识SAS系统一组文件的方式,它是一个临时的名字,使得我们在每一个SAS系统作业或会话中与SAS数据库联系在一起。
风控圈小助手
带你去见新朋友
这里有三大社群:互金反欺诈、风险研习社、风控圈。
QQ资料群:102755159
技术交流微信群,请扫描小助手二维码邀请进入:
风控圈公众号
长按扫描二维码关注