Lesson 1 数据集的建立

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Lesson 1 数据集的建立相关的知识,希望对你有一定的参考价值。

参考技术A

程序的基本组成

1 数据步

2 过程步

1 在SAS直接输入

注意事项

2 引用外部数据

文件--导入数据

SAS中的变量只有两种类型:字符型(character)和数值型(numeric)。

日期是被看作是数值型,所有日期型变量被作为是输入日期与1960年1月1日之差。如1980-1-1, SAS会认为这个值是7305。

不同类型的变量在input语句输入时需要指定相应的格式

包括数值与日期

如果你想让SAS有选择地读取你的数值,可以在变量后加上w.d的格式。其中,w表示数值的位数(包括小数点),如2.3的位数是3;d表示数值的小数点位数。

输入格式是给SAS读的,输出是给使用者读的。

见上述。使用 input input搭配informat 。不想改变输入值,不要在输入格式中定义宽度。

大致同输入格式。在data步,在input语句与cards之间使用 format

完整的格式应该是$ < w. >。

必须在变量名后加"$";w表示字节数(1个中文占2个字节)。

结果为:

w.d 的理解:

comma w.d 可将数值的整数部分自右向左每三位用逗号隔开,当数值位数较多时,这是比较标准的表示方式。

例如,输出格式为 comma7.1 时。

日期有两种类型:数字、日期格式。

日期型变量输入格式与输出格式大致相同,但 输出格式允许 在宽度值前加一个字母,表示日期的分隔符号。 但不能用于date7.或date9.等格式。

日期格式

分隔符号

invalue 输入看“ 原值

value 输出看“ 新值

结果为:

说明一下,"09.99%"的理解是:

所得结果为:

原因是 指定宽度后,空格也成为字符的一部分 。修改方式如下:

缺失值用 “ . ”表示。

结果为

用do循环输入数据

其中的语句若使用input,则必须加上output。

例如1-12月是连续加1的规律。

未使用do循环时:

由于count具有加1的规律,使用do循环后:

用@符号

产生新变量前,对其进行宽度限定,使用length

无length语句:

有length语句:

SAS数据都是存放在资源管理器的逻辑库中。逻辑库中有SAS自带的6个文件夹,用来存放不同类型的数据。
理论上,我们在用data语句起名字时,还需要告诉SAS建立的数据集是放在哪个文件夹里。如,data sasuser.fh;表示建立数据集fh,放在sasuser这个文件夹,再如data work.fh;表示建立数据集fh,放在work这个文件夹。
SAS默认,如果data语句中没有加文件夹名字,就是 默认为存放到临时文件夹work 中,也就是说,data fh;与data work.fh;是完全等同的。当关闭sas时work内的数据集将清空。

相当于把建立的数据集存放到硬盘的一个文件夹中。具体主要包括三个步骤:

方式一:菜单中新建
[1]在本地硬盘建立一个文件夹作为数据集存放处(假设路径为g盘目录下的mysasfile文件夹)
[2]逻辑库处右键新建新库并命名(假设是mydir),路径浏览选择上述文件夹
[3]编辑器处添加数据集

方式二:编辑器中新建,并与逻辑库关联
[1]同上
[2]编辑器中新建新库,并添加数据集

方式三:编辑器中新建

调用硬盘上的SAS数据集
[1]首先要知道硬盘上的文件夹位置及名称
[2]]利用libname语句读取相应位置的文件夹中的文件

MIT Introduction to Computer Science and Programming (Lesson one )

MIT Introduction to Computer Science and Programming (Lesson one )


这篇文是记载 MIT 计算机科学及编程导论 第一集 的笔记

Lesson one : Goals of the course;what is computation;introduction to data types,operators,and variables

一 讲解课程的任务、课程目标

目标

  • 像一个计算机科学家一样思考
  • 都能够读写程序
  • tacking technical problems

技巧

  • 学会写小规模的程序,来培养自己的计算思维
  • 学习读别人代码,并且应用来写出自己风格的代码
  • 了解计算机的基础以及局限

二 There is no best language

  • they all are description diferent things, having said that , some of them are bettr suited for something than others.
  • Matlab is great for doing things with vactors and mathices.
  • C is better to control date networks (术业有专攻,每个不同的语言都有它的用武之地)
  • high level VS low level Language
  • General VS targeted Language
  • compiled VS interpreted Language
  • python is High , general-purpose, interpreted language

三 statics , string ,numbers , some others etc…

  • 代码风格可以使我们避开简单的语义错误
  • 一些简单的代码

以上是关于Lesson 1 数据集的建立的主要内容,如果未能解决你的问题,请参考以下文章

GlobalMapper精品教程025:影像数据集的建立与巧妙使用

求救!100分奉上,Arcgis网络数据集的建立,我没有数据源,上哪去弄啊??

1 一元数据集的分布

DataSet数据集的用法

从SQL服务器为数据集的每一行发送电子邮件。

机器学习1-关于回归问题的准确性评价