我如何通过索引号创建特定间隔列的数据框

Posted

技术标签:

【中文标题】我如何通过索引号创建特定间隔列的数据框【英文标题】:How i can create dataframe of specific interval columns by index number 【发布时间】:2019-12-31 15:26:09 【问题描述】:

我有 130 列的数据框,我想让每 10 列的 df 从第 0 列开始,然后是第 3 列,然后想添加 10

例如:

df.columns = [0,3,13,23,33,43,53,63,73,83,93,103,113,123] 

【问题讨论】:

【参考方案1】:

这是使用切片的一种方法

例如:

columns = list(range(0, 131))     #sample column --> df.columns.tolist() 
result = [columns[0]] + columns[3::10]
print(result)

输出:

[0, 3, 13, 23, 33, 43, 53, 63, 73, 83, 93, 103, 113, 123]

创建新的 DF

new_df = df[result].copy()

【讨论】:

感谢您的支持,您能否建议我下一步应该如何制作数据框。我正在尝试 new_df = pd.DataFrame(df, columns = result) 但它显示的是 NaN 值 ***.com/questions/34682828/… new_df = df[result].copy() 再次给出错误,可能是按可排序名称而不是按索引编号复制 是的...我得到了预期的答案...非常感谢您的努力

以上是关于我如何通过索引号创建特定间隔列的数据框的主要内容,如果未能解决你的问题,请参考以下文章

Python:如何快速创建仅包含大型 Excel 工作表中特定列的 pandas 数据框?

根据索引在熊猫数据框中查找特定列的值[重复]

如何通过选择特定时间间隔内的时间来索引 pandas DataFrames?

如何根据特定列的值重新排列数据框的行

如何计算另一列中特定值的列的平均值?

如何使用Scala计算Spark中数据框中列的开始索引和结束索引之间的行的平均值?