在 DataFlow 中字段包含名称文件的子字符串的列

Posted

技术标签:

【中文标题】在 DataFlow 中字段包含名称文件的子字符串的列【英文标题】:field a colums with the substring of the namefile in DataFlow 【发布时间】:2020-05-01 08:35:13 【问题描述】:

我想用 File 的名称填写一个列名ManagingCountryCode,这个列只存在于我的输出(BD)中 我试过做一个这样的子字符串,但总是错的!

我选择了将文件名存储在列中的选项 [

【问题讨论】:

我在 blob 存储中的同一个文件 X 中有 3 个具有相同 shema 的文件(x1,x2,x3)我像输入一样导入文件 X 我想添加一个列(文件名)并用之后的 NamesFiles (x1,x2,x3) 与派生列我可以使用子字符串将文件名映射到列 Y 所以在我的 Y 中将有 (1,2,3) ..希望更清楚。 您可以单击“验证”并复制并粘贴表达式给出的验证错误吗?另外,你的文件名是什么样的?你能分享一些例子吗?您是否要仅获取文件名而不获取文件扩展名? 是的,只需将我的文件命名为不同的国家/地区,文件名包含此信息,因此在 coulums 国家/地区,我想将 (NameFile) 的子字符串拆分,但首先我必须定义列文件名和我不知道怎么回事! 我找到了一个选项,我可以选择将我的文件名存储在列中,但我不知道如何添加它 【参考方案1】:

就像我说的那样,我将 filesName 存储在 filenamecolum 中,这是 (SourceOption) 中的一个选项,之后我没有得到下面的错误(在图片中),因为他可以定义什么是 'fileName',之后我添加映射简单,我将新列与输出文件中的其他列映射。

【讨论】:

以上是关于在 DataFlow 中字段包含名称文件的子字符串的列的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 Stream 为 Spring Cloud Dataflow 中的子任务设置全局属性 - Task-Launcher-Dataflow

替换数据库文本字段中所有出现的子字符串

使用 ClickHouse 提取和求和字符串内的子字段的值

使用 osx 终端从外部硬盘驱动器中提取具有特定名称的子文件夹。

SQL Regex - 用另一个字段的子字符串替换

将具有特定(相同)名称的子文件夹复制到目标