python--数据类型的补充和编码

Posted 2020-12-13 水晶冰洛

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了python--数据类型的补充和编码相关的知识，希望对你有一定的参考价值。

## 01 今日内容大纲

1. 基础数据类型的补充
2. 数据类型之间的转换
3. 编码的进阶




## 03 具体内容

+ 数据类型的补充

  + str

    ```python
    # str ：补充的方法练习一遍就行。
    # s1 = ‘taiBAi‘
    # capitalize 首字母大写，其余变小写
    # print(s1.capitalize())
    # swapcase  大小写翻转
    # print(s1.swapcase())
    # title
    # msg= ‘taibai say3hi‘
    # print(msg.title()) #每个单词的首字母大写
    
    s1 = ‘barry‘
    # 居中
    # print(s1.center(20))
    # print(s1.center(20,‘*‘))
    
    # find :通过元素找索引，找到第一个就返回，找不到 返回-1
    # index:通过元素找索引，找到第一个就返回，找不到 报错
    # print(s1.find(‘a‘))
    # print(s1.find(‘r‘))
    # print(s1.find(‘o‘))
    # print(s1.index(‘o‘))
    ```

  + 元组

    ```python
    # tuple
    # 元组中如果只有一个元素，并且没有逗号，那么它不是元组，它与改元素的数据类型一致。 ***
    # tu1 = (2,3,4)
    # tu1 = (2)
    # tu1 = (‘太白‘)
    # tu1 = ([1,2,3])
    # tu1 = (1,)
    # print(tu1,type(tu1))
    # tu = (1,2,3,3,3,2,2,3,)
    # # count 计数
    # print(tu.count(3))
    # tu = (‘太白‘, ‘日天‘, ‘太白‘)
    # # index
    # print(tu.index(‘太白‘))
    
    ```

    

  + 列表

    ```python
    # l1 = [‘太白‘, ‘123‘, ‘女神‘, ‘大壮‘]
    # count pass
    # index
    # print(l1.index(‘大壮‘))
    # sort  **
    # l1 = [5, 4, 3, 7, 8, 6, 1, 9]
    # # l1.sort()  # 默认从小到大排序
    # # l1.sort(reverse=True)  # 从大到小排序  **
    # l1.reverse()  # 反转  **
    # print(l1)
    # 列表可以相加
    # l1 = [1, 2, 3]
    # l2 = [1, 2, 3, ‘太白‘, ‘123‘, ‘女神‘]
    # print(l1 + l2)
    
    # 列表与数字相乘
    # l1 = [1, ‘daf‘, 3]
    # l2 = l1*3
    # print(l2)
    
    l1 = [11, 22, 33, 44, 55]
    # 索引为奇数对应的元素删除（不能一个一个删除，此l1只是举个例子，里面的元素不定）。
    #  *** 重要
    # 正常思路：
    # 先将所有的索引整出来。
    # # 加以判断，index % 2 == 1： pop（index）
    # for index in range(len(l1)):
    #     if index % 2 == 1:
    #         l1.pop(index)
    # print(l1)
    # 列表的特性：
    # l1 = [11, 22, 33, 44, 55]
    # 最简单的：
    # del l1[1::2]
    # print(l1)
    # l1 = [11, 22, 33, 44, 55]
    # # 倒序法删除元素
    # for index in range(len(l1)-1,-1,-1):
    #     if index % 2 == 1:
    #         l1.pop(index)
    # print(l1)
    
    # 思维置换
    # l1 = [11, 22, 33, 44, 55]
    # new_l1 = []
    # for index in range(len(l1)):
    #     if index % 2 ==0:
    #         new_l1.append(l1[index])
    # # print(new_l1)
    # l1 = new_l1
    # print(l1)
    
    # 循环一个列表的时，最好不要改变列表的大小，这样会影响你的最终的结果。
    
    ```

    

  + 字典

    ```python 
    # 字典的补充
    # update ***
    # dic = {‘name‘: ‘太白‘, ‘age‘: 18}
    # # dic.update(hobby=‘运动‘, hight=‘175‘)
    # # dic.update(name=‘太白金星‘)
    # dic.update([(1, ‘a‘),(2, ‘b‘),(3, ‘c‘),(4, ‘d‘)])  # 面试会考
    # print(dic)
    # dic1 = {"name":"jin","age":18,"sex":"male"}
    # dic2 = {"name":"alex","weight":75}
    # dic1.update(dic2)  # 更新，有则覆盖，无责添加
    # print(dic1)  # {‘name‘: ‘alex‘, ‘age‘: 18, ‘sex‘: ‘male‘, ‘weight‘: 75}
    # print(dic2)
    
    # fromkeys
    # dic = dict.fromkeys(‘abc‘, 100)
    # dic = dict.fromkeys([1, 2, 3], ‘alex‘)
    # 坑：值共有一个,面试题
    # dic = dict.fromkeys([1,2,3],[])
    # dic[1].append(666)
    # print(dic)
    dic = {‘k1‘: ‘太白‘, ‘k2‘: ‘barry‘, ‘k3‘: ‘白白‘, ‘age‘: 18}
    # 将字典中键含有‘k‘元素的键值对删除。
    # for key in dic:
    #     if ‘k‘ in key:
    #         dic.pop(key)
    # print(dic)
    
    # 循环一个字典时，如果改变这个字典的大小，就会报错。
    # l1 = []
    # for key in dic:
    #     if ‘k‘ in key:
    #         l1.append(key)
    # print(l1)
    # for i in l1:
    #     dic.pop(i)
    # print(dic)
    
    # for key in list(dic.keys()):  # [‘k1‘, ‘k2‘, ‘k3‘,‘age‘]
    #     if ‘k‘ in key:
    #         dic.pop(key)
    # print(dic)
    
    ```

    

+ 数据类型的转换

  ```python
  # 0,‘‘(),[],{},set(),None  转换成bool值为False
  ```

  

+ 数据类型的分类（了解）

  

+ 编码的进阶

  + **ASCII码：包含英文字母，数字，特殊字符与01010101对应关系。**

  　　a  01000001  一个字符一个字节表示。

  + **GBK：只包含本国文字（以及英文字母，数字，特殊字符）与0101010对应关系。**

  　　a  01000001  ascii码中的字符：一个字符一个字节表示。

  　　中 01001001 01000010  中文：一个字符两个字节表示。

  + **Unicode**：**包含全世界所有的文字与二进制0101001的对应关系。**

  　　a  01000001 01000010 01000011 00000001        

  　　b  01000001 01000010 01100011 00000001        

  　　中 01001001 01000010 01100011 00000001

  + **UTF-8:包含全世界所有的文字与二进制0101001的对应关系（最少用8位一个字节表示一个字符）。**

  　    a   01000001  ascii码中的字符：一个字符一个字节表示。

  　　To 01000001 01000010   (欧洲文字：葡萄牙，西班牙等)一个字符两个字节表示。

  　　中  01001001 01000010 01100011  亚洲文字；一个字符三个字节表示。

  

  1. 不同的密码本之间能否互相识别？不能。

  2. 数据在内存中全部是以Unicode编码的，但是当你的数据用于网络传输或者存储到硬盘中，必须是以非Unicode编码（utf-8,gbk等等）。

  英文：

  str： ‘hello ‘

  ?    内存中的编码方式： Unicode

  ?    表现形式： ‘hello‘

  bytes ： 

  ?    内存中的编码方式： 非Unicode

  ?    表现形式：b‘hello‘

中文：

?    str： 

?        内存中的编码方式： Unicode

?        表现形式：‘中国‘

?    bytes ： 

?        内存中的编码方式： 非Unicode  # Utf-8

?        表现形式：b‘xe4xb8xadxe5x9bxbd‘  

?    

```python
# str ---> bytes
# s1 = ‘中国‘
# b1 = s1.encode(‘utf-8‘)  # 编码
# print(b1,type(b1))  # b‘xe4xb8xadxe5x9bxbd‘
# # b1 = s1.encode(‘gbk‘)  # 编码  # b‘xd6xd0xb9xfa‘ <class ‘bytes‘>
# # bytes---->str
# b1 = b‘xe4xb8xadxe5x9bxbd‘
# s2 = b1.decode(‘utf-8‘)  # 解码
# print(s2)

```

```python
# gbk ---> utf-8
b1 = b‘xd6xd0xb9xfa‘
s = b1.decode(‘gbk‘)
# print(s)
b2 = s.encode(‘utf-8‘)
print(b2)  # b‘xe4xb8xadxe5x9bxbd‘

```



## 04 今日总结

+ 数据类型的补充： list（sort,revrse,列表的相加，乘，循环问题），dict （update 循环问题） ***
+ 编码的进阶：
  + bytes为什么存在？ 
  + str  --->bytes(Unicode ---> 非Unicode)  
  + gbk  <-----> utf-8

1. 数据类型的补充

+ str：pass
+ tuple：
+ (1) ----> int (‘alex‘) ----> str
+ count index
+ list:
+ sort sort(reverse= True) reverse()
+ 列表相加列表与数字相乘：
+ 循环列表的问题
+ dict:
+ update 更新，增加值，修改值，创建字典，将一个字典的所有键值对覆盖添加到另一个字典。
+ dict.fromkeys(iterable,value) # 面试经常考
+ 循环字典的问题。
+ 数据类型的转换：0,{},[],set(),‘‘,None

2. 编码的进阶：

? ASCII, gbk,Unicode,utf-8 big5........

1. 所有的编码本（除去Unicode之外）不能直接互相识别。

2. 在内存中所有的数据必须是unicode编码存在，除去bytes。

int

bool

tuple str bytes

list

dict

set

![1557279191961](C:UsersoldboyAppDataRoamingTypora ypora-user-images1557279191961.png)

![1557279203738](C:UsersoldboyAppDataRoamingTypora ypora-user-images1557279203738.png)

? str bytes

? 称呼：文字文本字节文本

? ‘‘ "" """ """ ‘‘‘ ‘‘‘ b‘‘ b"" ........

? Unicode 非Unicode

以上是关于python--数据类型的补充和编码的主要内容，如果未能解决你的问题，请参考以下文章