重新编码连续变量_summary

Posted

技术标签:

【中文标题】重新编码连续变量_summary【英文标题】:Recode continuous variable_summary 【发布时间】:2021-01-18 20:02:00 【问题描述】:

enter image description here

从连续变量重新编码为分类变量后。新分类变量的摘要没有显示它是如何按我们经常看到的级别汇总分类的。

请帮忙!

【问题讨论】:

将您的变量resize转换为一个因子将在调用summary()时向您显示级别。 请不要将数据/代码添加为图像。阅读how to ask a good question 以及如何提供reproducible example。 【参考方案1】:

试试这个

A4 <- within(A4, resize <- factor(Size > 1000, c("S", "L")))

【讨论】:

【参考方案2】:

cut 正是这样做的。

A4$resize <- cut(A4$Size, breaks = c(-Inf, 1000, Inf), labels = c("S", "L"))

【讨论】:

【参考方案3】:

我们可以使用findInterval

A4$resize <- with(A4, c('S', 'L')[findInterval(Size, 1000)])

或使用case_when

library(dplyr)
A4 %>%
   mutate(resize = case_when(Size > 1000 ~ "S", TRUE ~ "L"))

【讨论】:

以上是关于重新编码连续变量_summary的主要内容,如果未能解决你的问题,请参考以下文章

刷题_牛客_字符串编码

R语言进行变量编码(recode):把dataframe中连续变量基于条件表达式转化为多个类别的离散变量(分类变量)使用attach函数绑定数据

重新编码数据框变量时,分配没有按预期工作?

根据 R 中的一系列分类变量重新编码数值变量

R语言使用回归模型解决单因素方差分析问题(ANOVA as regression)方差分析和回归都是同广义线性模型的特例因子转化为数值的过程中(分类变量编码为连续变量自定义设置contrast)

MiniZinc决策变量非连续范围