data.table 包中的 := (按引用传递)运算符同时修改另一个数据表对象

Posted

技术标签:

【中文标题】data.table 包中的 := (按引用传递)运算符同时修改另一个数据表对象【英文标题】::= (pass by reference) operator in the data.table package modifies another data table object simultaneously 【发布时间】:2011-12-23 05:55:13 【问题描述】:

在测试我的代码时,我发现了以下内容:如果我将 data.table DT1 分配给 DT 并在之后更改 DTDT1 会随之更改。所以DTDT1 似乎是内部链接的。这是预期的行为吗?尽管我不是编程专家,但这对我来说似乎是错误的,并且使用简单的 R 变量或data.frame 对其进行测试,我无法重现该行为。这里发生了什么?

DF <- data.frame(ID=letters[1:5],
                  value=1:5)
DF1 <- DF
all.equal(DF1, DF)
[1] TRUE
DF[1, "value"] <- DF[1, "value"]*2
all.equal(DF1, DF)
[1] "Component 2: Mean relative difference: 1"

library(data.table)
data.table 1.7.1  For help type: help("data.table")
DT <- data.table(ID=letters[1:5],
                  value=1:5)
DT1 <- DT
all.equal(DT1, DT)
[1] TRUE
DT[, value:=value*2]
     ID value
[1,]  a     2
[2,]  b     4
[3,]  c     6
[4,]  d     8
[5,]  e    10
all.equal(DT1, DT)
[1] TRUE

【问题讨论】:

【参考方案1】:

data.table 中的这段文档会有所帮助。 ? data.table::copy

没有返回值。 data.table 通过引用进行修改。如果需要副本,请先获取副本(使用 DT2=copy(DT))。在 := 用于通过引用对列进行子分配之前,copy() 有时也可能很有用。

【讨论】:

以上是关于data.table 包中的 := (按引用传递)运算符同时修改另一个数据表对象的主要内容,如果未能解决你的问题,请参考以下文章

通过引用传递函数时处理 R data.table 中的无效 selfref

R 3.6.0 中的 data.table 包中是不是存在内存泄漏?

在java中怎样在有名包中引用无名包中的类

为啥 `data.table::unique` 不起作用?

在函数中通过引用向 data.table 添加新列并不总是有效

如何在不导入所有函数的情况下在包中使用 data.table?