元组的熊猫数据框?

Posted

技术标签:

【中文标题】元组的熊猫数据框?【英文标题】:Pandas dataframe of tuples? 【发布时间】:2017-07-07 21:08:27 【问题描述】:

我有一个 pandas 数据框,我通过调用从列表(从 spark rdd 创建)创建:

newRdd = rdd.map(lambda row: Row(row.__fields__ + ["tag"])(row + (tagScripts(row), ))).collect() 然后df = pd.DataFrame(newRdd)

我的数据最终看起来像一个元组数据框,如下所示:

0  (2017-06-21, Sun, ATL, 10)
1  (2017-06-21, Sun, ATL, 11)
2  (2017-06-21, Sun, ATL, 11)

但我需要它看起来像一个带有列标题的标准表格:

date       dayOfWeek    airport   val1  
2017-06-11    Sun         ATL     11     

老实说,我对此一无所知,需要一些帮助。我尝试了很多不同的东西,但似乎没有任何效果。任何帮助将不胜感激。感谢您的宝贵时间。

【问题讨论】:

你能告诉我们newRdd的格式是什么吗?也许显示它的打印... 是列表对象类型 然后一旦转换成pandas数据框类型 好吧,它是一个列表,但是这个列表的元素是什么? rdd 转换后的元素是元组类型 【参考方案1】:

你可以这样做:

df = pd.DataFrame([*df.A],columns = ['date','dayOfWeek','airport','val1','val2','val3','val4','val5','val6'])

我假设您已经拥有的数据框中的列名是A

您可以检查here 进行元组解包。

希望这对您有所帮助。有任何问题请告诉我。

【讨论】:

以上是关于元组的熊猫数据框?的主要内容,如果未能解决你的问题,请参考以下文章

将命名元组嵌套字典到熊猫数据框

如何将元组列表转换为 pandas 数据框,以便每个元组的第一个值代表一列?

拆分两个元素的元组并添加到熊猫数据框[重复]

将元组字典拆分为熊猫数据框

如何遍历值是元组的字典熊猫,并找到第一个 True 和 False 值

从以元组为键的字典中获取熊猫数据框