data.table 包中的 := (按引用传递)运算符同时修改另一个数据表对象
Posted
技术标签:
【中文标题】data.table 包中的 := (按引用传递)运算符同时修改另一个数据表对象【英文标题】::= (pass by reference) operator in the data.table package modifies another data table object simultaneously 【发布时间】:2011-12-23 05:55:13 【问题描述】:在测试我的代码时,我发现了以下内容:如果我将 data.table DT1
分配给 DT
并在之后更改 DT
,DT1
会随之更改。所以DT
和DT1
似乎是内部链接的。这是预期的行为吗?尽管我不是编程专家,但这对我来说似乎是错误的,并且使用简单的 R 变量或data.frame
对其进行测试,我无法重现该行为。这里发生了什么?
DF <- data.frame(ID=letters[1:5],
value=1:5)
DF1 <- DF
all.equal(DF1, DF)
[1] TRUE
DF[1, "value"] <- DF[1, "value"]*2
all.equal(DF1, DF)
[1] "Component 2: Mean relative difference: 1"
library(data.table)
data.table 1.7.1 For help type: help("data.table")
DT <- data.table(ID=letters[1:5],
value=1:5)
DT1 <- DT
all.equal(DT1, DT)
[1] TRUE
DT[, value:=value*2]
ID value
[1,] a 2
[2,] b 4
[3,] c 6
[4,] d 8
[5,] e 10
all.equal(DT1, DT)
[1] TRUE
【问题讨论】:
【参考方案1】:data.table
中的这段文档会有所帮助。 ? data.table::copy
没有返回值。 data.table 通过引用进行修改。如果需要副本,请先获取副本(使用 DT2=copy(DT))。在 := 用于通过引用对列进行子分配之前,copy() 有时也可能很有用。
【讨论】:
以上是关于data.table 包中的 := (按引用传递)运算符同时修改另一个数据表对象的主要内容,如果未能解决你的问题,请参考以下文章
通过引用传递函数时处理 R data.table 中的无效 selfref
R 3.6.0 中的 data.table 包中是不是存在内存泄漏?