如何在 PIG 中将 XLSX 文件转换为 CSV 文件?
Posted
技术标签:
【中文标题】如何在 PIG 中将 XLSX 文件转换为 CSV 文件?【英文标题】:How to Convert XLSX file to CSV file in PIG? 【发布时间】:2016-09-09 08:46:13 【问题描述】:我们如何使用 PIG SCRIPT 将 covert a xlsx
文件转换为 csv
文件。
我发现有 CSVExcelStorage 来存储已经转换的 xlsx 到 csv 文件。
STORE x INTO '<destFileName>'
USING CSVExcelStorage(['<delimiter>' [,'YES_MULTILINE' | 'NO_MULTILINE' [,'UNIX' | 'WINDOWS' | 'UNCHANGED']]]);
Eg:
STORE res INTO '/tmp/result.csv'
USING CSVExcelStorage(',', 'NO_MULTILINE', 'WINDOWS');
我认为在此之前我们需要将 xlsx 文件转换为 csv。
那么我们如何使用 pig 来做到这一点。
任何帮助。
【问题讨论】:
Load xlsx file into Pig的可能重复 【参考方案1】:参考:CSVExcelStorage
用法:
STORE x INTO '<destFileName>'
USING CSVExcelStorage(['<delimiter>' [,'YES_MULTILINE' | 'NO_MULTILINE' [,'UNIX' | 'WINDOWS' | 'UNCHANGED']]]);
例如:
STORE res INTO '/tmp/result.csv'
USING CSVExcelStorage(',', 'NO_MULTILINE', 'WINDOWS');
其中 CRLF 是换行符 (0x0d 0x0a: \r\n),逗号是字段分隔符。
【讨论】:
我认为它是用于存储 csv 文件。但在此之前,我们必须将 xlsx 文件转换为 csv 正确。我想使用 pig 将 xlsx 文件转换为 csv 文件。就像使用 PIG 将 xml 文件转换为 csv...[链接]acadgild.com/blog/converting-xml-into-csv-using-pig/...I 想要将 xlsx 文件转换为 csv。任何建议 这确实不会将 xlsx 转换为 csv。正如您从添加的链接中看到的那样,它加载了一个 CSV(使用 excel 在制作 csv 时使用的格式标准)。正如我链接的问题中所述,pig 无法直接读取 xlsx 文件。以上是关于如何在 PIG 中将 XLSX 文件转换为 CSV 文件?的主要内容,如果未能解决你的问题,请参考以下文章
在 python 中将多个 excel '.xlsx' 转换为 '.csv' 文件时,我得到了额外的列?
如何在 GWT 中将 JSONObject 转换为 .csv?