提取 HDFS 文件夹或文件详细信息

Posted

技术标签:

【中文标题】提取 HDFS 文件夹或文件详细信息【英文标题】:Extract HDFS folder or file details 【发布时间】:2019-12-16 10:16:10 【问题描述】:

为了使用 hive 在任何时间点查找 HDFS 目录中存在的文件数,我创建了一个 hive 外部表。谁能帮我提取HDFS 中存在的目录的文件详细信息,因为INPUT__FILE__NAMEhdfs dfs -stat 不符合我的目的,我希望将所有-ls 放入csv 文件中。

【问题讨论】:

【参考方案1】:

不建议使用 ls 的输出,它不是为此而设计的。话虽如此,这不是正常的 ls ,所以也许别无选择。

你可以像这样把它的输出放到一个文件中:

hadoop fs -ls /path > output.txt

【讨论】:

【参考方案2】:

还可以使用hdfs在所有数据库中查找表:

hive数据库的路径是:

/apps/hive/仓库/ 所以,通过使用 hdfs :

hdfs dfs -find /apps/hive/warehouse/ -name t*

hadoop fs -ls /路径

【讨论】:

以上是关于提取 HDFS 文件夹或文件详细信息的主要内容,如果未能解决你的问题,请参考以下文章

如何告诉 Windows 资源管理器不要请求特定文件夹中的文件详细信息和缩略图?

如何从文件属性中获取详细信息? [复制]

文件或文件夹的详细信息

linux命令stat,查看文件详细信息

仅限于通过 R 和 cURL 使用 Mailchimp API v3 提取详细信息(如电子邮件活动)?

转android出现注: 某些输入文件使用或覆盖了已过时的 API。 注: 有关详细信息, 请使用 -Xlint:deprecation 重新编译。 注: 某些输入文件使用了未经检查或不安全的操作(代