如何基于单个值拆分大型数据帧,1130.07 [重复]

Posted

技术标签:

【中文标题】如何基于单个值拆分大型数据帧,1130.07 [重复]【英文标题】:How to split the large dataframe based on a single value, 1130.07 [duplicate] 【发布时间】:2021-11-27 04:15:15 【问题描述】:

这个数据框包含几个不同的数据集。它们都被合并到一个大数据框中,我想根据 1130.07 的强度值将它们分成不同的列。

数据框示例如下所示:

    intensity   wavelength
0   192.94  685.00
1   193.21  685.00
2   193.48  685.00
3   193.76  680.00
4   194.03  706.00
... ... ...
145915  1129.10 701.00
145916  1129.34 699.00
145917  1129.59 684.00
145918  1129.83 696.00
145919  1130.07 700.00

【问题讨论】:

您要拆分为小于 1130.07 和大于 1130.07 吗?你确定行数是一样的吗? 在 1130.07 拆分,是的。行都是一致的! 【参考方案1】:

首先创建一个布尔掩码m,然后根据这个掩码分配两个新的数据帧:

m = df.intensity < 1130.07
df1 = df[m]
df2 = df[~m]

【讨论】:

以上是关于如何基于单个值拆分大型数据帧,1130.07 [重复]的主要内容,如果未能解决你的问题,请参考以下文章

根据列中的共同值将大数据框拆分为数据框列表

在单个多核机器上索引大型 dask 数据帧时的内存使用情况

如何将数据帧拆分为多个数据帧,其中每个数据帧包含相等但随机的数据[重复]

在 R 中拆分大型数据框并输出到单个 Excel 工作簿中的单独工作表中

使用行分隔符拆分 Spark 数据帧

如何根据多列的值拆分数据框