append 命令— 追加数据集

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了append 命令— 追加数据集相关的知识,希望对你有一定的参考价值。

参考技术A

append 将存储在磁盘上的Stata格式数据集附加到内存中数据集的末尾。 如果指定了任何没有扩展名的文件名,则假定为.dta .Stata还可以将来自两个数据集的观察结果合并为一个。参考 [D] merge .参考 [U] 22 Combining datasets 有关append,merge和joinby的比较.

将mydata2.dta追加到mydata1.dta,内存中没有数据

如上所述,但mydata1.data在内存中

如上所述,并生成 generate(newv)以指示源数据集

如上所述,但不要从mydata2.dta复制值标签或注释

仅保留mydata2.dta中的v1,v2和v3

您可以用双引号括起文件名,也可以不用。如果文件名包含空格或其他特殊字符,则必须用双引号括起文件名。

generate(newvar): newvar标志着结果观察的来源。
keep(varlist): 防止指定变量追加数据集。
nolabel: 不要从磁盘上的数据集复制值标签定义
nonotes: 不要从磁盘上的数据集复制备注
force: 强制将字符串追加到数字或数字到字符串,没有出现错误。
generate(newvar) 指定要创建的变量的名称,该变量将标记观察源。 来自master dataset,的观察(append命令之前的内存中的数据),该变量将包为0。 来自第一个using dataset,的观察值,该变量将为1; 来自第二个using dataset的观测值该变量将为2; 等等。
keep(varlist) 指定要using dataset保留的变量。 如果未指定keep(),则保留所有变量。
keep(varlist)中的varlist与标准Stata varlists的不同之处在于两种方式:varlist中的变量名称可能不会缩写,除非使用通配符,并且您可能不会引用一系列变量,例如price-weight。
nolabel 可防止Stata将磁盘数据集中的值标签定义复制到内存中的数据集中。 即使您未指定此选项,也不会从磁盘数据集中定义标签定义替换已在内存中的定义。
nonotes 可防止using dataset中的注释合并到结果中。 默认设置是合并using dataset中尚未出现在主数据中的注释。
force 允许将字符串变量附加到数值变量,反之亦然,从而导致using dataset中缺少值。 如果省略,追加会发出错误消息; 如果指定,追加发出警告消息。

append append将存储在磁盘上的Stata格式数据集附加到内存中数据集的末尾。 如果指定文件名没有扩展名的,则假定为.dta格式。
Stata还可以将两个数据集中的观测值合并为一个; 参见[U] 22组合数据集以进行追加,合并和连接的比较。 see [D] merge . See [U] 22 Combining datasets for a comparison of append , merge , and joinby .

我们有两个想要合并的数据集存储在磁盘上。 第一个数据集,称为even.dta。 第二个数据集名为odd.dta。 数据集是

我们将even data 附加到odd data的末尾。 因为odd data已经存在于内存中(我们刚刚在上面使用过它们),所以我们键入append using even。 结果是:

两个数据集中的变量顺序无关紧要。 Stata总是按名称附加变量:

假设我们在内存中包含变量educ的数据集,并且我们之前已经给出了一个标签变量educ“Education Level”命令,与educ相关联的变量标签是“Education Level”。 我们现在附加一个名为newdata.dta的数据集,该数据集还包含一个名为educ的变量,但其变量标签为“Ed”。 。 附加两个数据集后,educ变量仍标记为“Education Level”。See [U] 12.6.2 Variable labels.

假设educ变量的值标有名为educlbl的值标签。 进一步假设在newdata.dta中,educ的值也由名为educlbl的值标签标记。因此,在内存中有一个educlbl定义,而newdata.dta中有另一个定义(尽管可能是等效的)。 附加新数据后,您将看到以下内容:

如果内存中的一个标签和磁盘上的另一个标签具有相同的名称,则追加警告您问题并坚持当前在内存中的定义,忽略磁盘文件中的定义。

Memcached append 命令

Memcached append 命令用于向已存在 key(键) 的 value(数据值) 后面追加数据 。

语法:

append 命令的基本语法格式如下:

append key flags exptime bytes [noreply]
value

参数说明如下:

  • key:键值 key-value 结构中的 key,用于查找缓存值。
  • flags:可以包括键值对的整型参数,客户机使用它存储关于键值对的额外信息。
  • exptime:在缓存中保存键值对的时间长度(以秒为单位,0 表示永远)
  • bytes:在缓存中存储的字节数
  • noreply(可选): 该参数告知服务器不需要返回数据
  • value:存储的值(始终位于第二行)(可直接理解为key-value结构中的value)

实例

实例如下:

  • 首先我们在 Memcached 中存储一个键 w3cschool,其值为 memcached。
  • 然后,我们使用 get 命令检索该值。
  • 然后,我们使用 append 命令在键为 w3cschool 的值后面追加 "redis"。
  • 最后,我们再使用 get 命令检索该值。
set w3cschool 0 900 9
memcached
STORED
get w3cschool
VALUE w3cschool 0 14
memcached
END
append w3cschool 0 900 5
redis
STORED
get w3cschool
VALUE w3cschool 0 14
memcachedredis
END

输出

如果数据添加成功,则输出:

STORED

输出信息说明:

  • STORED:保存成功后输出。
  • NOT_STORED:该键在 Memcached 上不存在。
  • CLIENT_ERROR:执行错误。

以上是关于append 命令— 追加数据集的主要内容,如果未能解决你的问题,请参考以下文章

附加唯一 ID 的 Spark 数据集

Azure 机器学习工作室将行追加到数据集

pandas.concat 和 numpy.append 的大型数据集的内存错误

pandas.concat 和 numpy.append 的大型数据集的内存错误

pandas读取多个excel文件并拼接(append)起来形成最终的dataframe与标签文件连接(join)形成最终学习数据集

.NET 3.5 未能加载文件或程序集“Microsoft.Web.Infrastructure”(解决后追加50-200悬赏)