如何根据 pandas-python 中带有空格的图像拆分列中的值

Posted

技术标签:

【中文标题】如何根据 pandas-python 中带有空格的图像拆分列中的值【英文标题】:How can i split the values in the column as per the image attached with spaces in pandas-python 【发布时间】:2020-05-08 09:00:12 【问题描述】:

我有一个数据集,其中包含.txt 格式的文件中的原始数据,单列中有很多值。

我想将 6 个值拆分,单独拆分成单独的列。

index
0     1 1 
1     2
2     3 2 2 4 2 2 2 3 3 (single column)
3     5
4     1
5     6
6     6 7 7 7 6 6 8 8 8 8 (single column)

【问题讨论】:

docs.python.org/2/library/stdtypes.html#str.split 可能会有所帮助。 请你解释一下,我是 python 新手 您能否举例说明文件内容的外观? 我无法上传图片让我试着解释一下想象 excel o 1 1 1 2 2 3 322456843 这就是它的样子 不要上传图片,编辑您的原始帖子并复制并粘贴一小部分具有代表性的文件内容。 【参考方案1】:

您可以使用系列(列)的str.split() method 将字符串拆分为多个单词,可能会将它们变成单独的列。

你可以使用类似的东西:

df = series.str.split(expand=True)

或者,假设它们位于名为“values”的列中(您似乎没有提及列名,并且不确定您是如何阅读 .txt 文件的):

df = df["values"].str.split(expand=True)

您的列将以从 0 开始的数字命名。

您在列中的数据仍将存储为字符串。如果需要,您可以将它们转换为整数(或浮点数),但如果您需要整数,您可能需要处理列中的缺失值,将它们替换为 0 或 -1 等标记值。

例如,使用整数并将没有值的列设置为 0:

df = df.fillna(0).astype(int)

【讨论】:

我试过了,但是 dataftame 太长了,所以它给了我 10.2 gb 的内存问题 我现在做到了,我必须在特定列中进行值配对,例如 3 2 2 4 2 2 到 [3,2][2,2][2,4][4,2 ][2,2] 在整个数据集中你能告诉我它是如何实现的吗 @P_data 请不要在 cmets 中提问。如果您有一个新问题,请发布一个新问题。非常具体地说明您拥有什么以及您需要什么。还要展示您尝试过的内容以及它如何不起作用或它如何无法达到您想要的效果。如果这个答案对您有帮助,请点赞,如果它回答了您的这部分问题,请接受它,帮助您取得进步。 好吧抱歉我是python新手,这里也不知道,谢谢帮助

以上是关于如何根据 pandas-python 中带有空格的图像拆分列中的值的主要内容,如果未能解决你的问题,请参考以下文章

如何在 python 中导入名称中带有空格的文件?

如何检查批处理脚本中带有空格的路径中文件的大小

如何scp名称中带有空格的目录[重复]

如何克隆文件名中带有冒号的文件

网址中带有空格的 mod_rewrite

将 URL 回显到网络驱动器上名称中带有空格的文件