如何使用此代码仅获取我想移动到新数据框的列? [复制]

Posted

技术标签:

【中文标题】如何使用此代码仅获取我想移动到新数据框的列? [复制]【英文标题】:How to get only the colums I want to move to new dataframe with this code? [duplicate] 【发布时间】:2019-10-27 09:41:42 【问题描述】:

我正在尝试从 csv 文件中仅选择 2 列:BodyCreatedDateCreatedDate 看起来像这样:2018-08-07T12:36:11.000ZBody 只是正在完成的工作的文本。一些Body 单元格是空的,所以我只想要其中包含数据的单元格。

我已经尝试使用下面的代码只获取 2 个所需的列:

import pandas as pd
df = pd.read_csv("file.csv")
df1= df['CreatedDate'].map(str) + ' ' + df['Body'].map(str)
print(df1)

我将整个df 打印两次。我看到了:

[10 行 x 15 列] & [15 行 x 10 列]

在每张印刷品的底部。我希望只看到我选择的 2 个列。为什么我会在控制台上看到所有 df 两次?

【问题讨论】:

【参考方案1】:

indexing a dataframe 有很多选项。这个特定的可以在一行上完成。

import pandas as pd
# read the csv into df
df = pd.read_csv("file.csv")
# take only the rows where 'Body' has a value and only columns ['Body', 'CreatedDate']
df = df.loc[df['Body'].notnull(),['Body', 'CreatedDate']]
print(df)

您可能还想阅读pandas.DataFrame.dropna。

【讨论】:

做到了!谢谢!

以上是关于如何使用此代码仅获取我想移动到新数据框的列? [复制]的主要内容,如果未能解决你的问题,请参考以下文章

如何仅获取特定行的列均值?

如何检查来自不同数据框的列值?

如何计算不同数据框的列之间的数值差异?

Python Dash 数据表应仅显示选定的列

如何获取列中值的不同百分比并将它们相加以分配到新的 SQL 列中?

如何将 numpy 数组存储在 Pandas 数据框的列中?