为 iso-8859-2 发送正确的字符集标头

Posted

技术标签:

【中文标题】为 iso-8859-2 发送正确的字符集标头【英文标题】:Sending correct charset header for iso-8859-2 【发布时间】:2014-02-01 20:11:45 【问题描述】:

我在通过 php 中的标头发送正确的字符集信息时遇到问题。

在我的代码中,我创建了一个 ISO-8859-2 编码的 CSV 字符串。我使用以下代码(简化)将其输出到浏览器:

$csv = 'iso-8859-2 encoded string, Łukasz Szukała';

header('Content-Type: text/csv; charset=ISO-8859-2');
header('Content-Disposition: attachment; filename=report.csv');

echo $csv;

结果文件被检测为 ISO-8859-1,当使用编辑器打开它时(我使用的是 Notepad++),因此显示不正确。

将字符串转换为 UTF-8 可以正常工作:

$csv = 'iso-8859-2 encoded string, Łukasz Szukała';
$csv = iconv('ISO-8859-2', 'UTF-8', $csv);

header('Content-Type: text/csv; charset=UTF-8');
header('Content-Disposition: attachment; filename=report.csv');

echo $csv;

在这种情况下,我什至可以完全省略字符集部分。

但是,我需要对文件进行 ISO-8859-2 编码,但我不明白为什么标头信息不会导致文件被检测为 ISO-8859-2。我还根据 IANA (http://www.iana.org/assignments/character-sets/character-sets.xhtml) 尝试了不同的别名,但我无法在任何浏览器中使用它。

非常感谢任何有价值的意见。

【问题讨论】:

【参考方案1】:

除了您希望 Notepad++ 检测文件的 字符集 之外,您所做的一切都是正确的。 严格来说 ISO-8859-2 不是编码而是字符集。

编辑器(任何)打开的文件只是没有标题的纯文本,您发送到浏览器。所以编辑器可以检测到是单字节编码,但是检测不到字符集,所以用默认系统字符集打开。

请参阅my answer 了解编码检测

您的文件仍然具有正确的编码,但 Notepad++ 只是显示不正确。 UTF-8 编码是另一回事,因为它没有字符集并且总是正确显示(我认为)。

【讨论】:

是的,我刚刚发现,一旦文件保存在本地,任何标题信息都会丢失。

以上是关于为 iso-8859-2 发送正确的字符集标头的主要内容,如果未能解决你的问题,请参考以下文章

Java 邮件字符集 ISO-8859-2 不起作用

Python 中 ISO-8859-2 和 UTF-8 之间的转换

python怎么解码ISO-8859-2格式.并转换为utf-8

如何在连接字符串中将 Access DB 从 ISO-8859-2 更改为 UTF-8?

Informix JDBC ISO-8859-2 编码问题

将 utf-8 转换为 iso-8859-2(抛光)