元组的熊猫数据框?
Posted
技术标签:
【中文标题】元组的熊猫数据框?【英文标题】:Pandas dataframe of tuples? 【发布时间】:2017-07-07 21:08:27 【问题描述】:我有一个 pandas 数据框,我通过调用从列表(从 spark rdd 创建)创建:
newRdd = rdd.map(lambda row: Row(row.__fields__ + ["tag"])(row + (tagScripts(row), ))).collect()
然后df = pd.DataFrame(newRdd)
我的数据最终看起来像一个元组数据框,如下所示:
0 (2017-06-21, Sun, ATL, 10)
1 (2017-06-21, Sun, ATL, 11)
2 (2017-06-21, Sun, ATL, 11)
但我需要它看起来像一个带有列标题的标准表格:
date dayOfWeek airport val1
2017-06-11 Sun ATL 11
老实说,我对此一无所知,需要一些帮助。我尝试了很多不同的东西,但似乎没有任何效果。任何帮助将不胜感激。感谢您的宝贵时间。
【问题讨论】:
你能告诉我们newRdd的格式是什么吗?也许显示它的打印... 是列表对象类型 然后一旦转换成pandas数据框类型 好吧,它是一个列表,但是这个列表的元素是什么? rdd 转换后的元素是元组类型 【参考方案1】:你可以这样做:
df = pd.DataFrame([*df.A],columns = ['date','dayOfWeek','airport','val1','val2','val3','val4','val5','val6'])
我假设您已经拥有的数据框中的列名是A
。
您可以检查here 进行元组解包。
希望这对您有所帮助。有任何问题请告诉我。
【讨论】:
以上是关于元组的熊猫数据框?的主要内容,如果未能解决你的问题,请参考以下文章
如何将元组列表转换为 pandas 数据框,以便每个元组的第一个值代表一列?