ruby字符串的encoding,force_encoding,encode,encode!转码(编码转换)
Posted 鞋带松了
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ruby字符串的encoding,force_encoding,encode,encode!转码(编码转换)相关的知识,希望对你有一定的参考价值。
ruby1.9开始对字符串编码支持已经比较完善,我们可以直接通过使用String类的实例方法encoding, force_encoding, encode, encode!进行相关的编码操作。
学习记录用。转载自网络,详细看参考链接
encoding
ruby1.9中为每个字符串对象增加了encoding信息
force_encoding
某些情况下这个附加编码信息可能不正确我们可以修正它
注意:force_encoding方法只是改变了字符串对象的编码信息,并没有改变字符串对象实际存储的内容。
encode、encode!
在ruby1.9之前如我我们需要编码转换则需要使用一些外部库, 现在我们可以直接使用String对象的实例方法encode, encode!进行操作
详细的api请参考这里
1.9.3p392 :009 > x=\'我还是不懂\' => "我还是不懂" 1.9.3p392 :010 > x.encoding => #<Encoding:UTF-8> 1.9.3p392 :011 > x.bytes.to_a => [230, 136, 145, 232, 191, 152, 230, 152, 175, 228, 184, 141, 230, 135, 130] 1.9.3p392 :012 > y=x.encode \'gbk\',\'utf-8\' => "\\xCED2\\xBBB9\\xCAC7\\xB2BB\\xB6AE" 1.9.3p392 :013 > y.encoding => #<Encoding:GBK> 1.9.3p392 :014 > y.bytes.to_a => [206, 210, 187, 185, 202, 199, 178, 187, 182, 174] 1.9.3p392 :015 > x.encode! \'gbk\',\'utf-8\' => "\\xCED2\\xBBB9\\xCAC7\\xB2BB\\xB6AE" 1.9.3p392 :016 > x.encoding => #<Encoding:GBK> 1.9.3p392 :017 > x.bytes.to_a => [206, 210, 187, 185, 202, 199, 178, 187, 182, 174] 1.9.3p392 :018 >
可以看到encode改变了编码信息同时也改变了字符串对象存储的内容
参考 :http://blog.bccn.net/%E9%9D%99%E5%A4%9C%E6%80%9D/15131
总结
- encdoing用来查看字符串的编码信息。
- force_encoding用来修正字符串编码信息,注意是修正。
- encode, encode!用来转码字符串。
以上是关于ruby字符串的encoding,force_encoding,encode,encode!转码(编码转换)的主要内容,如果未能解决你的问题,请参考以下文章
text Ruby编码#memo #ruby #encoding
Ruby:如何自动添加“# encoding: UTF-8”?
ruby `encode': "\xC3" 从 ASCII-8BIT 到 UTF-8 (Encoding::UndefinedConversionError)