通过 Excel 使用 UTF-8 BOM 打开 CSV

Posted

技术标签:

【中文标题】通过 Excel 使用 UTF-8 BOM 打开 CSV【英文标题】:Opening CSV with UTF-8 BOM via Excel 【发布时间】:2013-12-15 01:01:45 【问题描述】:

我通过java创建带有数据的csv文件。我遇到了以下众所周知的问题:葡萄牙语中的字母在 Excel 中以错误的方式显示(双击打开时)。

我通过 UTF-16LE+BOM 解决了这个问题,但 excel 开始将制表符识别为列分隔符而不是逗号。

所以我寻找另一个解决方案并看到很多帖子,其中人们说只需添加 UTF-8 BOM 并以 UTF-8 写入文件就可以为 Excel 2007 及更高版本完成工作。我在我的工作计算机上尝试了最简单的示例,但它失败了。但是当我在家里的电脑上尝试这个时,它就像一个魅力。

两台计算机都安装了相同版本的 java 和操作系统 Windows 7。 我很迷惑。谁能说出是什么导致了这种奇怪的行为?

您可以在下面查看我最简单的示例:

String filename = "D:/check/test_with_bom.csv";
        FileOutputStream fos = new FileOutputStream(filename);
        byte[] bom = new byte[]  (byte)0xEF, (byte)0xBB, (byte)0xBF ; 
        fos.write(bom);
        OutputStreamWriter osw = new OutputStreamWriter(fos , "UTF-8");
        PrintWriter printWriter = new PrintWriter(osw);

        printWriter.print("Hello,Olá,ão,ção");
        printWriter.close();

【问题讨论】:

Excel 版本是否相同? 你为什么要创建那个过时的PrintWriter?在Writer 上调用write 比在PrintWriter 上调用print 更难吗? Robin Green,我猜是的 - 两台机器都有 2007 Excel。我看到的明显区别是在工作机器上我有俄语 excel。 Holger,将 print 更改为 write 不会改变结果。这只是一个测试样本,我写它是为了证明这种方法的可能性。 【参考方案1】:

您应该知道 Excel 不会“打开”csv 文件。它使用默认值即时将它们转换为 Excel 文件。这些默认值可能因您的区域设置而异。正因为如此,it's never a good idea to let Excel open csv files using the defaults,因为你永远无法确定你最终会得到什么。

更安全的方法是使用“从文本导入”方法,并明确指定分隔符、编码等...但是,请注意,在 Excel 中“另存为 csv”是一个更糟糕的主意,因为它确实不允许您指定编码、分隔符或任何其他详细信息。访问。

在美国 Windows 版本的 Excel 中,默认的列分隔符是逗号。在欧洲 Windows 版本中,逗号是为十进制符号保留的,为了避免冲突,默认情况下使用分号作为列分隔符。

如果您 -rely- -rely- -have- 使用 CSV,您可以考虑在 csv 文件的顶部添加 "sep=," indicator。但是,请注意,这可能会导致其他应用程序出现问题。

【讨论】:

是的,我知道通过 excel 打开它们不是一个好主意,但是客户希望通过双击在 excel 中打开 csv 并希望逗号作为列分隔符。无论如何,我停止使用 UTF-8 BOM。你说的是区域设置,你到底是什么意思?感谢您的意见。 嘿,我在答复中添加了两段。但是,当使用 CSV 时,客户端将添加或更改数据并保存文件,请务必向他们解释在 CSV 文件上使用“保存”的限制,而不是明确执行导出。

以上是关于通过 Excel 使用 UTF-8 BOM 打开 CSV的主要内容,如果未能解决你的问题,请参考以下文章

#yyds干货盘点#害,这恼人的BOM头

哪种编码可以在 Mac 和 Windows 上使用 Excel 正确打开 CSV 文件?

javacsv生成的csv用excel打开中文乱码

关于csv文件的BOM头

mysql问题处理记录

csv文件乱码