查找列中的所有非整数

Posted

技术标签:

【中文标题】查找列中的所有非整数【英文标题】:Find all non-integers in column 【发布时间】:2017-09-04 01:24:35 【问题描述】:

我的大型 CSV 文件中有一些损坏的行,其中一些数据值由于缺少换行符而发生偏移。这会导致值出现在错误的列标题中。例如。如果我的表中存在三列,, , , 损坏后,我开始看到像 , , . 的值。

有没有办法让我删除所有行,例如我连续看到一个非整数,我知道实际上应该是一个 Int?

【问题讨论】:

您应该提供输入数据帧和预期的输出数据帧。 【参考方案1】:

您可以做的是循环遍历这些行,当lines.split(",").count() 不等于您想要的时,您可以将其过滤掉。像这样的:

import scala.io.Source
val n = 5 //or how many columns you require
Source.fromFile(input_file).getLines().toSeq.map(_.split(",")).filter(_.count == n)

这应该做你想要的:)

【讨论】:

以上是关于查找列中的所有非整数的主要内容,如果未能解决你的问题,请参考以下文章

在列中查找值,填充'直到非空白单元格

从不同表的另一列中的一列中查找所有值

如何用 0 替换 varchar 列中的所有非数字值

Excel VBA代码查找列中的最大单元格值并删除其下方的所有行

PSQL - 查找所有值并根据另一列中的非唯一值使其唯一

删除数据框列中的非字母str