python 第一周(第三天) 我的python成长记 一个月搞定python数据挖掘!(04)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 第一周(第三天) 我的python成长记 一个月搞定python数据挖掘!(04)相关的知识,希望对你有一定的参考价值。

字符串 str 和 unicode

str 字节流

unicode 字符流  (中文,英文,等等)  => 如何转换成计算机中的01代码呢?

  出现了编码 ascii,  iso88591, utf8(unicode压缩之后的), unicode(用四个字节编码一个字符), utf32, gb2312 等等

那么gbk如何转换成utf8呢?

gbk -> unicode ->  utf8

 

解码,编码

unicode -> utf8 编码

gbk-> unicode 解码

 

解决编码问题:

import sys
print sys.stdin.encoding
print sys.stdout.encoding
x = raw_input(u‘请输入名字:‘.encode(sys.stdout.encoding))# 先对字符串‘请输入名字:‘进行unicode解码,再用sys.stdout.encoding方式进行编码
f = open(‘1.txt‘,‘w‘)
f.write(x.decode(sys.stdin.endcoding).encode(‘utf-8‘)) # 先对输入的字符以sys.stdin.endcoding方式解码,再用utf-8进行编码
f.close()

字典 dict

对key进行hash成一个数字, 当成数组的下标,时间复杂度是常数

key是不可变的,  数字,符串,元组是可以作为key的,列表是不能做key的  可以hash的就可以作为key

key in dict 判断字典中是否有key

常见操作:

 

for key, value in x.items():
print key , ‘=‘, value
print x.get(‘name ‘,‘不存在‘)
print x.setdefault(‘naem‘,‘20‘)
print  x.keys(), x.values()
x.update({1:‘a‘,2:‘b‘,3:‘c‘})  #参数中的字典会更新x的值,没有则插入,有则覆盖
x.clear()


集合:
集合是无序的,不重复的,元素是不可变的,不支持索引和切片操作
可变集合 set
不可变集合frozenset
创建集合: 用工厂函数 set() 和 fronzenset() 入参一般是list
集合运算: | & - ^ |= < > s.isdisjoint(t)
     并 交 差 对称差集 并 是否为子集 是否为超集 是否有交集



 

以上是关于python 第一周(第三天) 我的python成长记 一个月搞定python数据挖掘!(04)的主要内容,如果未能解决你的问题,请参考以下文章

python学习第三天第一部分

python 第三天

python第三天

第三天

python第三天:字符编码文件操作函数

Python该怎么入门?