通配符不能在 wholeTextFiles 中使用

Posted

技术标签:

【中文标题】通配符不能在 wholeTextFiles 中使用【英文标题】:wildcard can’t be used in wholeTextFiles 【发布时间】:2019-12-07 10:28:58 【问题描述】:

我尝试将文件夹/子文件夹中的 XML 文件保存为 WholeText 文件,但是当我尝试使用时

sc.wholeTextFiles("folder/*/*.xml")

我收到一个错误:

llegalArgumentException: 'java.net.URISyntaxException: 预期 索引处特定于方案的部分

我正在使用数据块

【问题讨论】:

'java.net.URISyntaxException - 蟒蛇?斯卡拉? 在这两个数据块中我都遇到了同样的错误 该错误似乎与您的路径架构有关。您的文件在哪里? (hdfs, storage,.. ?) @blackbishop,它在 dbfs 中 您是否在路径中添加了dbfs:? (sc.wholeTextFiles("dbfs:/folder/*/*.xml")) 【参考方案1】:

确定问题的路径原因。问题是其中一个文件夹中的“:”导致了这个问题。参考 github.com/apache/spark/pull/4368

【讨论】:

以上是关于通配符不能在 wholeTextFiles 中使用的主要内容,如果未能解决你的问题,请参考以下文章

Spark:sc.textFiles() 与 sc.wholeTextFiles() 的区别

用于maya的Python:为什么我不能在与通配符的串联中使用变量?

AngularJS $http:当凭据标志为真时,不能在 Access-Control-Allow-Origin 中使用通配符

浏览器中复制不能复制的文档并使用word通配符进行高级替换整理

为啥多态函数不能在 Scala 中接受通配符(存在)类型?

spark学习四