为 iso-8859-2 发送正确的字符集标头
Posted
技术标签:
【中文标题】为 iso-8859-2 发送正确的字符集标头【英文标题】:Sending correct charset header for iso-8859-2 【发布时间】:2014-02-01 20:11:45 【问题描述】:我在通过 php 中的标头发送正确的字符集信息时遇到问题。
在我的代码中,我创建了一个 ISO-8859-2 编码的 CSV 字符串。我使用以下代码(简化)将其输出到浏览器:
$csv = 'iso-8859-2 encoded string, Łukasz Szukała';
header('Content-Type: text/csv; charset=ISO-8859-2');
header('Content-Disposition: attachment; filename=report.csv');
echo $csv;
结果文件被检测为 ISO-8859-1,当使用编辑器打开它时(我使用的是 Notepad++),因此显示不正确。
将字符串转换为 UTF-8 可以正常工作:
$csv = 'iso-8859-2 encoded string, Łukasz Szukała';
$csv = iconv('ISO-8859-2', 'UTF-8', $csv);
header('Content-Type: text/csv; charset=UTF-8');
header('Content-Disposition: attachment; filename=report.csv');
echo $csv;
在这种情况下,我什至可以完全省略字符集部分。
但是,我需要对文件进行 ISO-8859-2 编码,但我不明白为什么标头信息不会导致文件被检测为 ISO-8859-2。我还根据 IANA (http://www.iana.org/assignments/character-sets/character-sets.xhtml) 尝试了不同的别名,但我无法在任何浏览器中使用它。
非常感谢任何有价值的意见。
【问题讨论】:
【参考方案1】:除了您希望 Notepad++ 检测文件的 字符集 之外,您所做的一切都是正确的。 严格来说 ISO-8859-2 不是编码而是字符集。
编辑器(任何)打开的文件只是没有标题的纯文本,您发送到浏览器。所以编辑器可以检测到是单字节编码,但是检测不到字符集,所以用默认系统字符集打开。
请参阅my answer 了解编码检测
您的文件仍然具有正确的编码,但 Notepad++ 只是显示不正确。 UTF-8 编码是另一回事,因为它没有字符集并且总是正确显示(我认为)。
【讨论】:
是的,我刚刚发现,一旦文件保存在本地,任何标题信息都会丢失。以上是关于为 iso-8859-2 发送正确的字符集标头的主要内容,如果未能解决你的问题,请参考以下文章
Python 中 ISO-8859-2 和 UTF-8 之间的转换
python怎么解码ISO-8859-2格式.并转换为utf-8