python实战之编码问题:中文!永远的痛
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python实战之编码问题:中文!永远的痛相关的知识,希望对你有一定的参考价值。
编码的思维图谱:
也就是说文件没有编码之说,事实上都是按二进制格式保存在硬盘中的。不过在写入读取时须使用相应的编码进行处理,以便操作系统配合相关软件/字体,绘制到屏幕中给人看。所以关键问题是得知道原先这些字串数据是使用什么编码来编译的!可是在 Unicode之前都是使用类似对比表的形式来组织编码的,无法从串数据流本身统一解出不同的文
字来。
unicode是编码方式,万国码,详细的实现方式:utf-8 utf-16
在逻辑上 unicode是没有编码格式的。
进行I/O输出一定要做encode(‘utf-8‘)这样类似的操作
只是unicode在python 是内部函数。
ust r i ng = uni code( st r eam , ‘ gbk‘ )这个的意思就是先转换成unicode,再转换成你想要的编码
以上是关于python实战之编码问题:中文!永远的痛的主要内容,如果未能解决你的问题,请参考以下文章
3-Python3从入门到实战—基础之数据类型(数字-Number)