使用格式化将 ASCII 文本转换为 Unicode [关闭]

Posted

技术标签:

【中文标题】使用格式化将 ASCII 文本转换为 Unicode [关闭]【英文标题】:Converting ASCII text to Unicode with formatting [closed] 【发布时间】:2011-10-17 12:30:48 【问题描述】:

linux系统下是否有免费的工具,可以通过保持原始文本格式将ascii文本转换为unicode?

【问题讨论】:

"Unicode" 不是编码。 ASCII 文本已经是 Unicode。你想解决什么问题? 描述一下你对“ascii text”和“unicode”的理解。事实上,任何“ascii 文本”都已经是(UTF-8 编码的)Unicode,因为 ASCII 是 UTF-8 的子集。 因为 ArmASCII 是 UTF-8/16 的子集 【参考方案1】:

iconv 可以在不同的编码之间转换,如果这就是你的意思的话。

【讨论】:

另一种可能是使用 Far Manager 的内置文本编辑器:选择所有文本,剪切 (Ctrl+X),将编码 (Shift-F8) 更改为 UTF-8,粘贴 (Ctrl+V )。保存存档。 (我在 VirtualBox 下运行 Far,但你也可以使用 Wine) @18446744073709551615 您可以自己回答而不是评论,但这不是一个很好的回答,因为问题要求使用 Linux 工具。 不,我不能:它已关闭。而我在Linux下。 任何需要 Wine 或 VirtualBox 的工具都很难被视为 Linux 工具。【参考方案2】:

当然,它叫cat

cat myasciifile > myunicodefile

现在myunicodefile 由 unicode 代码点组成,采用流行的 UTF8 编码进行编码。请注意,这假定 myasciifile 仅包含合法的 ASCII 字符(即在 0-127 范围内)。

对此的替代方法是cp

【讨论】:

以上是关于使用格式化将 ASCII 文本转换为 Unicode [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

字符编码:ASCII,Unicod和UTF-8

jsp中如何将US7ASCII 转换为GBK字符

EBCDIC 到 ASCII 无法正常工作

将扩展的 ASCII 字符串转换为印地语文本

EBCDIC 到 ASCII 转换

编码格式