MATLABUTF-8编码文本输出

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MATLABUTF-8编码文本输出相关的知识,希望对你有一定的参考价值。

参考技术A 计算机中的文本往往有多种编码格式:

一般而言,UTF-8码对中文支持较好,latex、pandoc的文本转换都需要utf-8码,但是MATLAB默认编码形式为ANSI。

问题:如何设置MATLAB,使之输出的文本编码为UTF-8码。

在打开文件,准进行写入操作时,指定编码形式。

如此可以输出UTF-8码的 report.md 文件。

如何确定输出文本的编码样式究竟是哪种呢?

如此可以显示编码的类型。

从 UTF-8 编码的 XML 源生成 ISO-8859-1 编码的文本输出

【中文标题】从 UTF-8 编码的 XML 源生成 ISO-8859-1 编码的文本输出【英文标题】:Producing ISO-8859-1-encoded text output from a UTF-8-encoded XML source 【发布时间】:2014-04-26 00:46:51 【问题描述】:

我在使用 XSLT(使用 Oxygen 运行转换)时遇到了困难。

例如,当源包含短划线时,Oxygen 会抛出错误,“Output character not available in this encoding (decimal 8211)”。

破折号是 ISO-8859-1 字符集中可用的字符,处理器知道源是用 UTF-8 编码的(来自其 XML 声明)。我的 XSLT 包含

<xsl:output method="text" encoding="ISO-8859-1"/>

那么为什么不简单地将 UTF-8 编码的字符替换为 ISO-8859-1 编码的字符呢?我可以理解为什么 Unicode 中可用但 ISO-8859-1 中不可用的字符可能会导致问题,但为什么两者都可用?

有直接的解决方案吗?

感谢您的任何建议。

【问题讨论】:

您使用哪个版本的 XSLT?您也可以显示您的 XML 输入吗? 【参考方案1】:

据我所知,ISO-8859-1 不包含 Unicode 字符 8211/U2013,只有 Windows-1252 包含。所以 oXygen 或其 XSLT 处理器对这个错误是正确的。

【讨论】:

是的,你是对的 - 看起来我被误导了。当我添加替换功能时: 转换成功完成并用连字符替换了破折号.

以上是关于MATLABUTF-8编码文本输出的主要内容,如果未能解决你的问题,请参考以下文章

原创python中文编码问题:控制窗口能输出中文,到文本文件里乱码

处理 C 中的特殊字符(UTF-8 编码)

Hadoop中文编码乱码相关问题

如何在 Linux 中将文件编码转换为 UTF-8

如何解决 Python print 输出文本显示 gbk 编码错误

为啥 IE 无法显示 UTF-8 编码的文本?