hadoop 输入路径用正则表达式被默认处理为多个参数的问题

Posted Nucky_yang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hadoop 输入路径用正则表达式被默认处理为多个参数的问题相关的知识,希望对你有一定的参考价值。

运行命令  

hadoop jar   wordcount.jar   com.WordCount  /inpath/*{beijing,shanghai,guangzhou}*   /outpath/

这个/inpath/*{beijing,shanghai,guangzhou}* 地址,hadoop自己会解析为多个参数,判定第二个参数,不是输出路径

解决方式:

hadoop jar   wordcount.jar   com.WordCount  /inpath/‘{*beijing*,*shanghai*,*guangzhou*}‘   /outpath/

这样就可以了。

 

以上是关于hadoop 输入路径用正则表达式被默认处理为多个参数的问题的主要内容,如果未能解决你的问题,请参考以下文章

Hadoop MapReduce 多路径输入与多个输入

利用notepad++正则表达式将 多个空格 替换为一个逗号

利用notepad++正则表达式将 多个空格 替换为一个逗号

正则表达式替换可能会或可能不会被引用的字符串

正则 : 分组与引用

jmeter实现登录并设置token为全局变量