day12-20180426笔记

Posted Ivan_yyq

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了day12-20180426笔记相关的知识,希望对你有一定的参考价值。

笔记:Python模块hashlib、io、json、requests

 

一、hashlib加密模块

适用于python2

import hashlib
# m = hashlib.md5()
# src = "123456"
# m.update(src)
# print(m.hexdigest())

摘要算法简介

Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等。

什么是摘要算法呢?摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。

举个例子,你写了一篇文章,内容是一个字符串‘how to use python hashlib - by Michael‘,并附上这篇文章的摘要是‘2d73d4f15c0db7f5ecb321b6a65e5d6d‘。如果有人篡改了你的文章,并发表为‘how to use python hashlib - by Bob‘,你可以一下子指出Bob篡改了你的文章,因为根据‘how to use python hashlib - by Bob计算出的摘要不同于原始文章的摘要。

可见,摘要算法就是通过摘要函数f()对任意长度的数据data计算出固定长度的摘要digest,目的是为了发现原始数据是否被人篡改过。

摘要算法之所以能指出数据是否被篡改过,就是因为摘要函数是一个单向函数,计算f(data)很容易,但通过digest反推data却非常困难。而且,对原始数据做一个bit的修改,都会导致计算出的摘要完全不同。

我们以常见的摘要算法MD5为例,计算出一个字符串的MD5值:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2018/4/27 14:30
# @Author : yangyuanqiang
# @File : demon1.py


import hashlib

md5 = hashlib.md5()
md5.update(how to use md5 in python hashlib?.encode(utf-8))
print(md5.hexdigest())

以上实例输出的结果

d26a53750bc40b38b65a520292f69306

md5在线解密破解:http://www.cmd5.com/

如果数据量很大,可以分块多次调用update(),最后计算的结果是一样的:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2018/4/27 14:30
# @Author : yangyuanqiang
# @File : demon1.py


import hashlib

md5 = hashlib.md5()
md5.update(how to use md5 in .encode(utf-8))
md5.update(python hashlib?.encode(utf-8))
print(md5.hexdigest())

以上实例输出的结果

d26a53750bc40b38b65a520292f69306

 

MD5是最常见的摘要算法,速度很快,生成结果是固定的128 bit字节,通常用一个32位的16进制字符串表示。

摘要算法在很多地方都有广泛的应用。要注意摘要算法不是加密算法,不能用于加密(因为无法通过摘要反推明文),只能用于防篡改,但是它的单向计算特性决定了可以在不存储明文口令的情况下验证用户口令。

 

二、io模块

StringIO

很多时候,数据读写不一定是文件,也可以在内存中读写。

StringIO顾名思义就是在内存中读写str。

要把str写入StringIO,我们需要先创建一个StringIO,然后,像文件一样写入即可:

>>> from io import StringIO
>>> f = StringIO()
>>> f.write(hello)
5
>>> f.write( )
1
>>> f.write(world!)
6
>>> print(f.getvalue())
hello world!

 

getvalue()方法用于获得写入后的str。

要读取StringIO,可以用一个str初始化StringIO,然后,像读文件一样读取:

from io import StringIO

f = StringIO("Hello!\nHi!\nGoodbye!")
while True:
    s = f.readline()
    if s == ‘‘:
        break
    print(s.strip())

以上实例输出的结果

Hello!
Hi!
Goodbye!

 

from io import StringIO

stringIO = StringIO()
stringIO.write("hello world!")
stringIO.write("lalalalla, wo shi mai bao de xiao hang jia")
print(stringIO.getvalue())
stringIO.truncate(0)
print(stringIO.getvalue())

以上实例输出的结果

hello world!lalalalla, wo shi mai bao de xiao hang jia

 

BytesIO

StringIO操作的只能是str,如果要操作二进制数据,就需要使用BytesIO。

BytesIO实现了在内存中读写bytes,我们创建一个BytesIO,然后写入一些bytes:

from io import BytesIO

f = BytesIO()
print(f.write(中文.encode(utf-8)))
print(f.getvalue())

以上实例输出的结果

6
b\xe4\xb8\xad\xe6\x96\x87

请注意,写入的不是str,而是经过UTF-8编码的bytes。

和StringIO类似,可以用一个bytes初始化BytesIO,然后,像读文件一样读取:

from io import BytesIO

f = BytesIO(b\xe4\xb8\xad\xe6\x96\x87)
print(f.read())

以上实例输出的结果

b\xe4\xb8\xad\xe6\x96\x87

 

StringIO和BytesIO是在内存中操作str和bytes的方法,使得和读写文件具有一致的接口

 

三、json模块

 

以上是关于day12-20180426笔记的主要内容,如果未能解决你的问题,请参考以下文章

DAY9-字符串笔记整理2018-1-19

apriori片段代码

day06-jsp

学习笔记:python3,代码片段(2017)

LeetCode刷题笔记-数据结构-day12

LeetCode刷题笔记-数据结构-day12