如何在 PIG 中将 XLSX 文件转换为 CSV 文件?

Posted

技术标签:

【中文标题】如何在 PIG 中将 XLSX 文件转换为 CSV 文件?【英文标题】:How to Convert XLSX file to CSV file in PIG? 【发布时间】:2016-09-09 08:46:13 【问题描述】:

我们如何使用 PIG SCRIPT 将 covert a xlsx 文件转换为 csv 文件。 我发现有 CSVExcelStorage 来存储已经转换的 xlsx 到 csv 文件。

STORE x INTO '<destFileName>'
USING CSVExcelStorage(['<delimiter>' [,'YES_MULTILINE' | 'NO_MULTILINE' [,'UNIX' | 'WINDOWS' | 'UNCHANGED']]]);
Eg:

STORE res INTO '/tmp/result.csv'
USING CSVExcelStorage(',', 'NO_MULTILINE', 'WINDOWS');

我认为在此之前我们需要将 xlsx 文件转换为 csv。

那么我们如何使用 pig 来做到这一点。

任何帮助。

【问题讨论】:

Load xlsx file into Pig的可能重复 【参考方案1】:

参考:CSVExcelStorage

用法:

STORE x INTO '<destFileName>'
USING CSVExcelStorage(['<delimiter>' [,'YES_MULTILINE' | 'NO_MULTILINE' [,'UNIX' | 'WINDOWS' | 'UNCHANGED']]]);

例如:

STORE res INTO '/tmp/result.csv'
USING CSVExcelStorage(',', 'NO_MULTILINE', 'WINDOWS');

其中 CRLF 是换行符 (0x0d 0x0a: \r\n),逗号是字段分隔符。

【讨论】:

我认为它是用于存储 csv 文件。但在此之前,我们必须将 xlsx 文件转换为 csv 正确。我想使用 pig 将 xlsx 文件转换为 csv 文件。就像使用 PIG 将 xml 文件转换为 csv...[链接]acadgild.com/blog/converting-xml-into-csv-using-pig/...I 想要将 xlsx 文件转换为 csv。任何建议 这确实不会将 xlsx 转换为 csv。正如您从添加的链接中看到的那样,它加载了一个 CSV(使用 excel 在制作 csv 时使用的格式标准)。正如我链接的问题中所述,pig 无法直接读取 xlsx 文件。

以上是关于如何在 PIG 中将 XLSX 文件转换为 CSV 文件?的主要内容,如果未能解决你的问题,请参考以下文章

在 python 中将多个 excel '.xlsx' 转换为 '.csv' 文件时,我得到了额外的列?

如何在 GWT 中将 JSONObject 转换为 .csv?

将 xlsx 转换为 CSV [关闭]

如何使用 shell 脚本将 xlsx 文件转换为 csv 文件?

在 Pig 中将输出存储到 CSV 文件

Python如何读取xlsx文件并转换为csv而不写入目录[关闭]