熔化成两个可变列

Posted

技术标签:

【中文标题】熔化成两个可变列【英文标题】:melt to two variable columns 【发布时间】:2010-12-05 10:03:54 【问题描述】:

我在数据框中有以下变量:

[1] "Type"   "I.alt"  "idx06"  "idx07"  "idx08" "farve1" "farve2"

如果我这样做:

dm <- melt(d, id=c("Type","I.alt"))

我得到了这些变量:

"Type"     "I.alt"    "variable" "value"   

其中“idx06”、“idx07”、“idx08”、“farve1”、“farve2”用“variable”表示。

但我真正想要的是这样的:

"Type"     "I.alt"    "variable" "value" "variable2" "value2"

其中“farve1”和“farve2”分别用 variable2 和 value2 表示。

我想这样做的原因是,如果值下降,我想要线条颜色为绿色,如果值上升,则线条颜色为红色。 编辑:Shane 展示了如何通过合并的两个熔体来重塑数据。但我的策略似乎从一开始就构思错误——一句话就错了。请参阅我对 Shane 解决方案的评论。

ggplot(dm, aes(x=variable,y=value,group=Type,col=variable2, label=Type,size=I.alt))+
geom_line()+
geom_text(data=subset(dm, variable=="idx08"),hjust=-0.2, size=2.5)+
theme_bw()+
scale_x_discrete(expand=c(0,1))+
opts(legend.position="none")

我认为我需要铸造熔化的框架 - 但我想不通。 数据:

d <- structure(list(Type = structure(c(8L, 21L, 23L, 20L, 6L, 14L, 
3L, 24L, 2L, 28L, 32L, 22L, 15L, 29L, 1L, 17L, 18L, 33L, 25L, 
13L, 30L, 11L, 26L, 9L, 12L, 4L, 5L, 27L, 16L, 19L, 10L, 31L, 
7L), .Label = c("Alvorligere vold", "Andre strafferetlige særlove", 
"Andre tyverier", "Bedrageri", "Brandstiftelse", "Butikstyverier m.v.", 
"Dokumentfalsk", "Færdselslovovertræd. i øvrigt", "Færdselsuheld med spiritus", 
"Falsk forklaring i øvrigt", "Forbr. mod off. myndighed m.v.", 
"Freds- og ærekrænkelser", "Hæleri", "Hærværk", "Indbrud i bank, forretn. m.v.", 
"Indbrud i fritidshuse, garager mv", "Indbrud i villaer, lejligheder mv", 
"Love vedr. forsvaret og lign.", "Love vedr. spil, bev., næring", 
"Lov om euforiserende stoffer", "Mangler ved køretøj", "Røveri", 
"Simpel vold", "Spiritus- og promillekørsel", "Trusler", "Tyv./brugstyv. af andet", 
"Tyv./brugstyv. af cykel", "Tyv./brugstyv. af indr. køretøj", 
"Tyv/brugstyv. af knallert", "Tyveri fra bil, båd m.v.", "Ulovlig omgang med hittegods", 
"Våbenloven", "Vold o.l. mod off. myndighed"), class = "factor"), 
I.alt = c(16137L, 9519L, 5930L, 5502L, 4887L, 3582L, 3101L, 
1738L, 1660L, 1649L, 1551L, 1412L, 1338L, 1164L, 1154L, 1057L, 
931L, 907L, 857L, 724L, 681L, 644L, 641L, 505L, 450L, 419L, 
405L, 328L, 324L, 324L, 320L, 281L, 262L), idx06 = c(1, 1, 
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1), idx07 = c(0.972675591417568, 
0.766866371450899, 0.931743805516597, 0.813047711781889, 
0.88728323699422, 0.96420233463035, 0.855743544078362, 1.03710247349823, 
0.751470588235294, 0.90443686006826, 0.808403361344538, 0.902834008097166, 
0.718181818181818, 0.904555314533623, 1.02717391304348, 0.68957345971564, 
1.10324483775811, 0.93030303030303, 0.805309734513274, 0.843003412969283, 
0.74914089347079, 0.824786324786325, 1.04060913705584, 1.09150326797386, 
0.977941176470588, 0.892405063291139, 0.966666666666667, 
0.828125, 0.696, 0.813559322033898, 0.697841726618705, 0.88235294117647, 
0.62280701754386), idx08 = c(0.986612873647533, 0.712685595207085, 
0.840579710144927, 0.865628042843233, 0.93757225433526, 0.823346303501945, 
0.905609973285841, 1.03356890459364, 0.689705882352941, 0.909556313993174, 
0.798319327731092, 0.955465587044534, 0.714545454545455, 
0.620390455531453, 1.10869565217391, 0.815165876777251, 0.64306784660767, 
0.818181818181818, 0.722713864306785, 0.627986348122867, 
0.59106529209622, 0.927350427350427, 1.21319796954315, 1.20915032679739, 
1.33088235294118, 0.759493670886076, 1.40833333333333, 0.734375, 
0.896, 0.932203389830508, 0.60431654676259, 0.872549019607843, 
0.675438596491228), farve1 = c("green", "green", "green", 
"green", "green", "green", "green", "red", "green", "green", 
"green", "green", "green", "green", "red", "green", "red", 
"green", "green", "green", "green", "green", "red", "red", 
"green", "green", "green", "green", "green", "green", "green", 
"green", "green"), farve2 = c("red", "green", "green", "red", 
"red", "green", "red", "green", "green", "red", "green", 
"red", "green", "green", "red", "red", "green", "green", 
"green", "green", "green", "red", "red", "red", "red", "green", 
"red", "green", "red", "red", "green", "green", "red")), .Names = c("Type", 
"I.alt", "idx06", "idx07", "idx08", "farve1", "farve2"), class = "data.frame", row.names = c(NA, -33L))

【问题讨论】:

【参考方案1】:

这并不能回答您关于演员阵容的问题,但您当然可以进行子集化并进行两次融合,然后进行合并:

dm1 <- melt(d[,c("Type","I.alt","idx06","idx07","idx08")], id=c("Type","I.alt"))
dm2 <- melt(d[,c("Type","I.alt","farve1","farve2")], id=c("Type","I.alt"))
colnames(dm2) <- c("Type", "I.alt", "variable2", "value2")
dm <- merge(dm1, dm2)

或者,等效地,进行一次融合(就像您目前正在做的那样),然后将融合的数据帧子集两次(idx &lt;- variable %in% c("idx06","idx07","idx08")作为一个,!idx 作为另一个)并合并该输出。

无论哪种方式,你都会得到你想要的:

> head(dm)
              Type I.alt variable    value variable2 value2
1 Alvorligere vold  1154    idx08 1.108696    farve1    red
2 Alvorligere vold  1154    idx08 1.108696    farve2    red
3 Alvorligere vold  1154    idx07 1.027174    farve1    red
4 Alvorligere vold  1154    idx07 1.027174    farve2    red
5 Alvorligere vold  1154    idx06 1.000000    farve1    red
6 Alvorligere vold  1154    idx06 1.000000    farve2    red

【讨论】:

谢谢你 Shane - 我想我最喜欢你的二熔解决方案。显然真的很盲目 - 当一个友好的灵魂展示它时。然而——我的策略从一开始就存在缺陷。我想要的是改变颜色的情节线(所有“上升”的线段都应该是红色的,所有“下降”的线段应该是绿色的)。这就是为什么我最初做 d$farve1 idx06,"red","green")) d$farve2 idx07,"red", “绿色”))知道如何实现这一目标吗? 恐怕我不是 ggplot 专家(无论如何想像力)。我会考虑一下的。或者,您可能想提出一个关于“如何根据方向制作具有不同颜色段的线图”或类似内容的新问题...... 亲爱的 Shane,我认为您提出一个新问题是正确的。我已经将此标记为已回答:-) - 再次感谢。

以上是关于熔化成两个可变列的主要内容,如果未能解决你的问题,请参考以下文章

仅熔化矩阵中的最高值

Oracle 10g 从两个不同的行和列聚合成一行

如何在可变列数据上设置 SQLite 连接

加入两个表来生成图形,但它们没有公共列

pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个dataframe(split dataframe based on column value threshold

oracle 更新一个列 原来的字段为 ‘你好么’ 更新成 ‘你好’ 为啥 会变成‘你好 ’即多了两个空格。