MATLABUTF-8编码文本输出
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MATLABUTF-8编码文本输出相关的知识,希望对你有一定的参考价值。
参考技术A 计算机中的文本往往有多种编码格式:一般而言,UTF-8码对中文支持较好,latex、pandoc的文本转换都需要utf-8码,但是MATLAB默认编码形式为ANSI。
问题:如何设置MATLAB,使之输出的文本编码为UTF-8码。
在打开文件,准进行写入操作时,指定编码形式。
如此可以输出UTF-8码的 report.md 文件。
如何确定输出文本的编码样式究竟是哪种呢?
如此可以显示编码的类型。
从 UTF-8 编码的 XML 源生成 ISO-8859-1 编码的文本输出
【中文标题】从 UTF-8 编码的 XML 源生成 ISO-8859-1 编码的文本输出【英文标题】:Producing ISO-8859-1-encoded text output from a UTF-8-encoded XML source 【发布时间】:2014-04-26 00:46:51 【问题描述】:我在使用 XSLT(使用 Oxygen 运行转换)时遇到了困难。
例如,当源包含短划线时,Oxygen 会抛出错误,“Output character not available in this encoding (decimal 8211)”。
破折号是 ISO-8859-1 字符集中可用的字符,处理器知道源是用 UTF-8 编码的(来自其 XML 声明)。我的 XSLT 包含
<xsl:output method="text" encoding="ISO-8859-1"/>
那么为什么不简单地将 UTF-8 编码的字符替换为 ISO-8859-1 编码的字符呢?我可以理解为什么 Unicode 中可用但 ISO-8859-1 中不可用的字符可能会导致问题,但为什么两者都可用?
有直接的解决方案吗?
感谢您的任何建议。
【问题讨论】:
您使用哪个版本的 XSLT?您也可以显示您的 XML 输入吗? 【参考方案1】:据我所知,ISO-8859-1 不包含 Unicode 字符 8211/U2013,只有 Windows-1252 包含。所以 oXygen 或其 XSLT 处理器对这个错误是正确的。
【讨论】:
是的,你是对的 - 看起来我被误导了。当我添加替换功能时:以上是关于MATLABUTF-8编码文本输出的主要内容,如果未能解决你的问题,请参考以下文章
原创python中文编码问题:控制窗口能输出中文,到文本文件里乱码