如何用R中的样本组制作特定行的箱线图

Posted

技术标签:

【中文标题】如何用R中的样本组制作特定行的箱线图【英文标题】:how to make boxplot of specific row with group of sample in R 【发布时间】:2021-11-13 06:59:10 【问题描述】:

我是R中的新手,想请教帮我制作分组的箱线图我有2个文件,文件1是样本的值(基因表达)test.txt

gene group1.1 group1.2 group2.1 group2.2
a1 12 13 12 12
a2 2 3 25 31
a3 24 30 34 22
a4 10 11 23 24

文件 2 是样本设计 design.txt

file condition
group1.1 group1
group1.2 group1
group2.1 group2
group2.2 group2

我想用一个特定的行在 R 中制作箱线图,例如:a1 并有 2 个组 1 和 2;输出看起来像 boxplot-a1

我怎样才能做到这一点,直接从 2 个文件?我觉得我做的很蠢

dt1 <- read.delim("test.txt", sep="\t", header = TRUE)
dg <- read.delim("design.txt", sep="\t", header = TRUE)

我通过复制和转置来制作新文件:

gene name group expression
a1 Group1.1 group1 12
a1 Group1.2 group1 13
a1 Group2.1 group2 12
a1 Group2.2 group2 12.5
a2 Group1.1 group1 2
a2 Group1.2 group1 3
a2 Group2.1 group2 25
a2 Group2.2 group2 31
    dt <- read.delim("test_t.csv", sep="\t", header = TRUE)

    a1 <- dt[dt$gene %in% "a1",]
    ggplot(a1, aes(x=a1$group, y=a1$expression)) + 
       labs(title = "Expression A1", x = "Group", y = "Expression") +
       stat_boxplot(geom = "errorbar", width = 0.15) + 
        geom_boxplot()

非常感谢您的帮助!

【问题讨论】:

这是一个从 R 开始并绘制 r4ds.had.co.nz/data-visualisation.html 的好地方 感谢您的建议。我会多练习 【参考方案1】:

有了这样的数据,值得先把chr类型的变量转换成因子。

library(tidyverse)

df = read.table(
  header = TRUE,text="
  gene  name    group   expression
a1  Group1.1    group1  12
a1  Group1.2    group1  13
a1  Group2.1    group2  12
a1  Group2.2    group2  12.5
a2  Group1.1    group1  2
a2  Group1.2    group1  3
a2  Group2.1    group2  25
a2  Group2.2    group2  31") %>% 
  as_tibble() %>% 
  mutate(
    gene = gene %>% fct_inorder(),
    name = name %>% fct_inorder(),
    group = group %>% fct_inorder()
  )

现在您可以为gene 变量的一个值制作箱线图

df %>% filter(gene == "a1") %>% 
  ggplot(aes(gene, expression))+
  geom_boxplot()

同时用于两个值

df %>%
  ggplot(aes(gene, expression, fill=gene))+
  geom_boxplot()

【讨论】:

我很高兴能帮上忙。请记住,在 Stack Overflow 上,您可以通过选择已批准的解决方案来表示感谢。 我知道了,非常感谢 Marek Fiołka

以上是关于如何用R中的样本组制作特定行的箱线图的主要内容,如果未能解决你的问题,请参考以下文章

如何在R中的箱线图中添加连接点的线?

使用ggplot2画基因表达样本的箱线图

如何在r中的箱线图之间创建单独的线图

如何在具有多个组的箱线图顶部创建单独的线

制作一个ggplot箱线图,其中每列都是它自己的箱线图

使用 lapply 制作变量列表的箱线图