拆分文本处理器中异常的数组边界

Posted

技术标签:

【中文标题】拆分文本处理器中异常的数组边界【英文标题】:Array bound of exception in Split Text Processor 【发布时间】:2017-04-11 10:54:51 【问题描述】:

我正在使用 nifi 1.1.1 包。我通过引用下面的链接在源代码中应用了补丁文件,因为当标头计数大于 0 时拆分流文件时面临“目标不能在源中”。 https://issues.apache.org/jira/browse/NIFI-3255。 应用补丁后,如果标题行数为 0 或大于 1,则拆分文本处理器工作正常。 如果我们只有较少的行数,拆分文本处理器中的这些更改就可以工作。 例如: 如果流文件包含 1000 行,则可以拆分。 如果输入文件包含超过 20000 行,则它不会拆分数据并导致“ArrayIndexOutOfBoundsException”异常。 在这里,我附上了面对的图像。 任何人都请指导我解决该问题的方法。 https://i.stack.imgur.com/UNKI0.png

【问题讨论】:

【参考方案1】:

经过一番挖掘,您似乎在 1.1 版本的 Nifi 中遇到了问题。

正如here 所讨论的,升级到 Nifi 1.2 或更高版本应该可以解决问题。

【讨论】:

以上是关于拆分文本处理器中异常的数组边界的主要内容,如果未能解决你的问题,请参考以下文章

将文本拆分到pandas数据框中:处理不同维度的文本。

将文本拆分到pandas数据框中:处理不同维度的文本。

我们应该在训练/测试拆分之前还是之后预处理文本数据? [关闭]

真·富文本编辑器的演进之路-富文本Span的边界探究

文本预处理 Text Preprocessing

文本标签的基本属性