perl输出中文有乱码

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了perl输出中文有乱码相关的知识,希望对你有一定的参考价值。

测试文件的时候发现输出中文有乱码,所以学习了一下perl的Encode原理。现做一下总结:
perl的基础知识:在Perl看来, 字符串只有两种形式。一种是octets, 即8位序列, 也就是我们通常说的字节数组。另一种utf8编码的字符串, perl管它叫string。 也就是说: Perl只认识两种编码: Ascii(octets)和utf8(string)。

所以输出时候出现乱码,应该把utf8编码转为用户能够接受的形式。例如中文用gb2312.

my $s=":<中文关键词>=英国皇家学会;;《哲学汇刊》;;物理科学;;科学传播.";

$a=$s=~/>=(.+)$/;

print encode(‘gb2312‘,$1)."\n"; #输出英国皇家学会;;《哲学汇刊》;;物理科学;;科学传播.

以上是关于perl输出中文有乱码的主要内容,如果未能解决你的问题,请参考以下文章

Perl读取Excel文件并解决中文乱码问题

python打印输出汉字,有一部分出现乱码怎么解决?

codeblocks输出结果中有乱码,是啥原因?

python输出到文件乱码如何解决

关于VS2017编译UE4项目,输出窗口有乱码的解决方案

c语言程序输出的数据后面多了一些乱码