如何将原始数据框中的列添加到报废数据?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何将原始数据框中的列添加到报废数据?相关的知识,希望对你有一定的参考价值。

我有两列“名称”和“链接”,表示公司名称和废品链接。如何放回名称列,以便每一行报废数据都有一个具有相应公司名称的列?

List.Of.Tabs <- map(pages, ~ {
  name <- .x[1]
  link <- .x[2]
  webpage <- read_html(link)
  tbls <- html_nodes(webpage, "table")
  tbls_ls <- html_table(tbls,fill = TRUE)
  pos1 <- possibly(function(tbls) bind_rows(tbls) %>% 
                   filter_all(any_vars(. %in% c("Ireland", "Japan")))
                   , otherwise = NA)
  pos1(tbls_ls)

结果应该是这样的:

results <- data.frame(subsidiaries = c('Microsoft Japan','Microsoft Ireland'), 
                      country = c('Japan', 'Ireland'),
                      name = c('Microsoft','Microsoft'))
答案

基于代码,我们可能需要mutate(即在第一行代码中从已创建的'name'创建'name'列)

List.Of.Tabs <- map(pages, ~ {
  name <- .x[1]
  link <- .x[2]
  webpage <- read_html(link)
  tbls <- html_nodes(webpage, "table")
  tbls_ls <- html_table(tbls,fill = TRUE)
  pos1 <- possibly(function(tbls) bind_rows(tbls) %>% 
                   filter_all(any_vars(. %in% c("Ireland", "Japan"))) %>%
                   mutate(name = name) # changed here
                   , otherwise = NA)
  pos1(tbls_ls)

  })

以上是关于如何将原始数据框中的列添加到报废数据?的主要内容,如果未能解决你的问题,请参考以下文章

使用pyspark,spark + databricks时如何将完全不相关的列添加到数据框中

如何对一个数据框中的列值求和并将结果添加为另一个数据框中的列?

如何使用嵌套字典列表展平熊猫数据框中的列

如何将文本文件中的原始数据加载到熊猫数据框中?

PYTHON 如何使用 numpy.where 添加包含下一行数据框中的数据的列?

如何将当前行的负值转移到数据框中的前一行?