提取 HDFS 文件夹或文件详细信息
Posted
技术标签:
【中文标题】提取 HDFS 文件夹或文件详细信息【英文标题】:Extract HDFS folder or file details 【发布时间】:2019-12-16 10:16:10 【问题描述】:为了使用 hive 在任何时间点查找 HDFS
目录中存在的文件数,我创建了一个 hive 外部表。谁能帮我提取HDFS
中存在的目录的文件详细信息,因为INPUT__FILE__NAME
或hdfs dfs -stat
不符合我的目的,我希望将所有-ls
放入csv
文件中。
【问题讨论】:
【参考方案1】:不建议使用 ls 的输出,它不是为此而设计的。话虽如此,这不是正常的 ls ,所以也许别无选择。
你可以像这样把它的输出放到一个文件中:
hadoop fs -ls /path > output.txt
【讨论】:
【参考方案2】:还可以使用hdfs在所有数据库中查找表:
hive数据库的路径是:
/apps/hive/仓库/ 所以,通过使用 hdfs :
hdfs dfs -find /apps/hive/warehouse/ -name t*
或
hadoop fs -ls /路径
【讨论】:
以上是关于提取 HDFS 文件夹或文件详细信息的主要内容,如果未能解决你的问题,请参考以下文章
如何告诉 Windows 资源管理器不要请求特定文件夹中的文件详细信息和缩略图?
仅限于通过 R 和 cURL 使用 Mailchimp API v3 提取详细信息(如电子邮件活动)?
转android出现注: 某些输入文件使用或覆盖了已过时的 API。 注: 有关详细信息, 请使用 -Xlint:deprecation 重新编译。 注: 某些输入文件使用了未经检查或不安全的操作(代