Web框架的原理
Posted 平凡之路
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Web框架的原理相关的知识,希望对你有一定的参考价值。
Web框架本质
我们可以这样理解:所有的Web应用本质上就是一个socket服务端,而用户的浏览器就是一个socket客户端。 这样我们就可以自己实现Web框架了。
socket服务端
#!/usr/bin/env python3
# _*_ coding:utf-8 _*_
import socket
# 实例化socket对象
sk = socket.socket()
# 绑定IP和端口
sk.bind((\'127.0.0.1\',9000))
# 监听
sk.listen()
while True:
# 等待连接
conn,addr = sk.accept()
# 接收数据
data = conn.recv(1024)
print(data)
# 发送数据
conn.send(b\'ok\')
# 断开连接
conn.close()
socket客户端(浏览器访问)
用户在浏览器中输入网址(ip:port),浏览器连接socket服务端 建立连接,发送数据,那浏览器会发送什么数据?怎么发?这个谁来定? 你这个网站是这个规定,他那个网站按照他那个规定,那互联网还能玩么?
所以,必须有一个统一的规则,让大家发送消息、接收消息的时候都有个格式依据,不能随便写。
这个规则就是HTTP协议,以后浏览器发送请求信息也好,服务器回复响应信息也罢,都要按照这个规则来。
HTTP协议主要规定了客户端和服务器之间的通信格式,那HTTP协议是怎么规定消息格式的呢?
让我们首先打印下我们在服务端接收到的消息是什么。
b\'GET / HTTP/1.1\\r\\nHost: 127.0.0.1:9000\\r\\nConnection: keep-alive\\r\\nCache-Control: max-age=0\\r\\nUpgrade-Insecure-Requests: 1\\r\\nUser-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/73.0.3683.103 Safari/537.36\\r\\nAccept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3\\r\\nAccept-Encoding: gzip, deflate, br\\r\\nAccept-Language: zh-CN,zh;q=0.9\\r\\n\\r\\n\'
将\\r\\n替换成换行看得更清晰点:
b\'GET / HTTP/1.1 Host: 127.0.0.1:9000 Connection: keep-alive Cache-Control: max-age=0 Upgrade-Insecure-Requests: 1 User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3 Accept-Encoding: gzip, deflate, br Accept-Language: zh-CN,zh;q=0.9 \'
然后我们再看一下我们访问博客园官网时浏览器收到的响应信息是什么。
响应相关信息可以在浏览器调试窗口的Network标签页中看到。
点击view source之后显示如下图:
我们发现收发的消息需要按照一定的格式来,这里就需要了解一下HTTP协议了。
HTTP协议对收发消息的格式要求
每个HTTP请求和响应都遵循相同的格式,一个HTTP包含Header和Body两部分,其中Body是可选的。
HTTP响应的Header中有一个 Content-Type
表明响应的内容格式。它的值如text/html; charset=utf-8。
text/html则表示是网页,charset=utf-8则表示编码为utf-8。
HTTP请求的格式:
HTTP响应的格式:
自定义web框架
上面知道了服务端和客户端传输要遵循HTTP协议,想让浏览器能显示我们web框架返回的信息,那我们就要按照HTTP协议的格式来发送响应。
基础版
#!/usr/bin/env python3 # _*_ coding:utf-8 _*_ import socket # 实例化socket对象 sk = socket.socket() # 绑定IP和端口 sk.bind((\'127.0.0.1\',9000)) # 监听 sk.listen() while True: # 等待连接 conn,addr = sk.accept() # 接收数据 data = conn.recv(1024) # 发送数据 conn.send(b\'HTTP/1.1 200 OK\\r\\n\\r\\n\') conn.send(b\'<h1>ok</h1>\') # 断开连接 conn.close()
根据不同的路径返回不同的内容
从请求相关数据里面拿到请求URL的路径,然后拿路径做一个判断,返回相应的页面
#!/usr/bin/env python3 # _*_ coding:utf-8 _*_ import socket # 实例化socket对象 sk = socket.socket() # 绑定IP和端口 sk.bind((\'127.0.0.1\',9000)) # 监听 sk.listen() while True: # 等待连接 conn,addr = sk.accept() # 接收数据 data = conn.recv(1024) # 获取到要访问的url路径 data = data.decode(\'utf-8\') url = data.split()[1] print(url) # 发送数据 # 因为要遵循HTTP协议,所以回复的消息也要加状态行 conn.send(b\'HTTP/1.1 200 OK\\r\\n\\r\\n\') # 根据不同的路径返回不同内容 if url == \'/index/\': conn.send(b\'<h1> index </h1>\') elif url == \'/home/\': conn.send(b\'<h1> home </h1>\') else: conn.send(b\'<h1> 404 not found </h1>\') # 断开连接 conn.close()
根据不同的路径返回不同的内容--函数版
#!/usr/bin/env python3 # _*_ coding:utf-8 _*_ import socket # 实例化socket对象 sk = socket.socket() # 绑定IP和端口 sk.bind((\'127.0.0.1\',9000)) # 监听 sk.listen() # 将返回不同的内容部分封装成函数 def index(url): ret = \'<h1>index %s</h1>\' %url return ret.encode(\'utf-8\') def home(url): ret = \'<h1>index %s</h1>\' %url return ret.encode(\'utf-8\') while True: # 等待连接 conn,addr = sk.accept() # 接收数据 data = conn.recv(1024) # 获取到要访问的url路径 data = data.decode(\'utf-8\') url = data.split()[1] print(url) # 发送数据 # 因为要遵循HTTP协议,所以回复的消息也要加状态行 conn.send(b\'HTTP/1.1 200 OK\\r\\n\\r\\n\') # 根据不同的路径返回不同内容 if url == \'/index/\': ret = index(url) elif url == \'/home/\': ret = home(url) else: ret = b\'<h1> 404 not found </h1>\' conn.send(ret) # 断开连接 conn.close()
根据不同的路径返回不同的内容--函数进阶版
看起来上面的代码写了一个函数,那肯定可以写多个函数,不同的路径对应执行不同的函数拿到结果,但是我们要一个个判断路径很麻烦。
下面定义一个函数与路径对应的列表。
#!/usr/bin/env python3 # _*_ coding:utf-8 _*_ import socket # 实例化socket对象 sk = socket.socket() # 绑定IP和端口 sk.bind((\'127.0.0.1\',9000)) # 监听 sk.listen() # 将返回不同的内容部分封装成函数 def index(url): ret = \'<h1>index %s</h1>\' %url return ret.encode(\'utf-8\') def home(url): ret = \'<h1>index %s</h1>\' %url return ret.encode(\'utf-8\') def web(url): ret = \'<h1>web %s</h1>\' %url return ret.encode(\'utf-8\') # 定义 路径与函数对应关系的一个列表 list1 = [ (\'/index/\',index), (\'/home/\',home), (\'/web/\',web), ] while True: # 等待连接 conn,addr = sk.accept() # 接收数据 data = conn.recv(1024) # 获取到要访问的url路径 data = data.decode(\'utf-8\') url = data.split()[1] print(url) # 发送数据 # 因为要遵循HTTP协议,所以回复的消息也要加状态行 conn.send(b\'HTTP/1.1 200 OK\\r\\n\\r\\n\') func = None for f in list1: if f[0] == url: func = f[1] break # 如果url没匹配上,func变量还是None if func: ret = func(url) else: ret = b\'<h1>404 not found</h1>\' conn.send(ret) # 断开连接 conn.close()
返回具体的HTML文件
从文件读取,发送给浏览器。
#!/usr/bin/env python3 # _*_ coding:utf-8 _*_ import socket # 实例化socket对象 sk = socket.socket() # 绑定IP和端口 sk.bind((\'127.0.0.1\',9000)) # 监听 sk.listen() # 将返回不同的内容部分封装成函数 def index(url): with open(\'index.html\',"rb") as f: data = f.read() return data def home(url): with open(\'home.html\',"rb") as f: data = f.read() return data def web(url): with open(\'web.html\',"rb") as f: data = f.read() return data # 定义 路径与函数对应关系的一个列表 list1 = [ (\'/index/\',index), (\'/home/\',home), (\'/web/\',web), ] while True: # 等待连接 conn,addr = sk.accept() # 接收数据 data = conn.recv(1024) # 获取到要访问的url路径 data = data.decode(\'utf-8\') url = data.split()[1] print(url) # 发送数据 # 因为要遵循HTTP协议,所以回复的消息也要加状态行 conn.send(b\'HTTP/1.1 200 OK\\r\\n\\r\\n\') func = None for f in list1: if f[0] == url: func = f[1] break # 如果url没匹配上,func变量还是None if func: ret = func(url) else: ret = b\'<h1>404 not found</h1>\' conn.send(ret) # 断开连接 conn.close()
让网页动态起来
使用时间戳来模拟动态的数据,使用字符串替换来实现这个需求。
#!/usr/bin/env python3 # _*_ coding:utf-8 _*_ import socket import time # 实例化socket对象 sk = socket.socket() # 绑定IP和端口 sk.bind((\'127.0.0.1\',9000)) # 监听 sk.listen() # 将返回不同的内容部分封装成函数 def index(url): with open(\'index.html\',"rb") as f: data = f.read() return data def home(url): with open(\'home.html\',"rb") as f: data = f.read() return data def web(url): with open(\'web.html\',"rb") as f: data = f.read() return data def timer(url): now = time.strftime(\'%Y-%m-%d %H:%M:%S\') with open(\'timer.html\',"r",encoding=\'utf-8\') as f: data = f.read() data = data.replace(\'@@time@@\',now) return data.encode(\'utf-8\') # 定义 路径与函数对应关系的一个列表 list1 = [ (\'/index/\',index), (\'/home/\',home), (\'/web/\',web), (\'/timer/\',timer), ] while True: # 等待连接 conn,addr = sk.accept() # 接收数据 data = conn.recv(1024) # 获取到要访问的url路径 data = data.decode(\'utf-8\') url = data.split()[1] # 发送数据 # 因为要遵循HTTP协议,所以回复的消息也要加状态行 conn.send(b\'HTTP/1.1 200 OK\\r\\n\\r\\n\') func = None for f in list1: if f[0] == url: func = f[1] break # 如果url没匹配上,func变量还是None if func: ret = func(url) else: ret = b\'<h1>404 not found</h1>\' conn.send(ret) # 断开连接 conn.close()
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Title</title> </head> <body> <!-- 自己定一个占位符 @@time@@ --> <h1> 现在的时间是: @@time@@ </h1> <script> window.location.reload() </script> </body> </html>
服务器程序和应用程序
对于真实开发中的python web程序来说,一般会分为两部分:服务器程序和应用程序。
服务器程序负责对socket服务端进行封装,并在请求到来时,对请求的各种数据进行整理。
应用程序则负责具体的逻辑处理。为了方便应用程序的开发,就出现了众多的Web框架,例如:Django、Flask、web.py 等。不同的框架有不同的开发方式,但是无论如何,开发出的应用程序都要和服务器程序配合,才能为用户提供服务。
这样,服务器程序就需要为不同的框架提供不同的支持。这样混乱的局面无论对于服务器还是框架,都是不好的。对服务器来说,需要支持各种不同框架,对框架来说,只有支持它的服务器才能被开发出的应用使用。
这时候,标准化就变得尤为重要。我们可以设立一个标准,只要服务器程序支持这个标准,框架也支持这个标准,那么他们就可以配合使用。一旦标准确定,双方各自实现。这样,服务器可以支持更多支持标准的框架,框架也可以使用更多支持标准的服务器。
WSGI(Web Server Gateway Interface)就是一种规范,它定义了使用Python编写的web应用程序与web服务器程序之间的接口格式,实现web应用程序与web服务器程序间的解耦。
常用的WSGI服务器有uwsgi、Gunicorn。而Python标准库提供的独立WSGI服务器叫wsgiref,Django开发环境用的就是这个模块来做服务器。
wsgiref
#!/usr/bin/env python3 # _*_ coding:utf-8 _*_ """ WSGI(Web Server Gateway Interface)就是一种规范, 它定义了使用Python编写的web应用程序与web服务器程序之间的接口格式, 实现web应用程序与web服务器程序间的解耦。 常用的WSGI服务器有uwsgi、Gunicorn。 而Python标准库提供的独立WSGI服务器叫wsgiref,Django开发环境用的就是这个模块来做服务器。 """ """ 利用wsgiref模块来替换我们自己写的web框架的socket server部分: 根据URL中不同的路径返回不同的内容--函数进阶版 返回HTML页面 让网页动态起来 wsgiref模块版 """ import time from wsgiref.simple_server import make_server def index(url): with open("index.html","r",encoding="utf8") as f: data = f.read().encode("utf8") return data def home(url): with open("home.html","r",encoding="utf8") as f: data = f.read().encode("utf8") return data def timer(url): with open("timer.html","r",encoding="utf8") as f: data = f.read() data = data.replace(\'@@time@@\',time.strftime("%Y-%m-%d %H:%M:%S")).encode("utf8") return data list1 = [ ("/index/",index), ("/home/",home), ("/timer/",timer), ] def run_server(environ,start_response): start_response("200 OK",[(\'Content-Type\',\'text/html;charset=utf8\'),]) url = environ[\'PATH_INFO\'] # 取得用户输入的url路径 func = None for f in list1: if f[0] == url: func = f[1] break if func: response = func(url) else: response = b\'404 not found\' return [response, ] if __name__ == \'__main__\': httpd = make_server(\'0.0.0.0\', 9090,run_server) print(\'run server 0.0.0.0:9090 \') httpd.serve_forever()
jinja2
上面的代码实现了一个简单的动态,我完全可以从数据库中查询数据,然后去替换我html中的对应内容,然后再发送给浏览器完成渲染。 这个过程就相当于HTML模板渲染数据。 本质上就是HTML内容中利用一些特殊的符号来替换要展示的数据。 我这里用的特殊符号是我定义的,其实模板渲染有个现成的工具: jinja2
下载jinja2:
pip install jinja2
#!/usr/bin/env python3 # _*_ coding:utf-8 _*_ from jinja2 import Template from wsgiref.simple_server import make_server def index(url): # 读取HTML文件内容 with open(\'index2.html\',\'r\',encoding=\'utf8\') as f: data = f.read() template = Template(data) #生成模板文件 ret = template.render({\'name\': \'alex\', \'hobby_list\': [\'抽烟\', \'喝酒\', \'烫头\']}) # 把数据填充到模板中 return bytes(ret,encoding=\'utf8\') def home(url): with open(\'home.html\',\'rb\') as f: data = f.read() return data # 定义一个url和实际要执行的函数的对应关系 list1 = [ ("/index/", index), ("/home/", home), ] def run_server(environ,start_response): start_response("200 OK",[(\'Content-Type\',\'text/html;charset=utf8\'),]) url = environ[\'PATH_INFO\'] # 取得用户输入的url路径 func = None for f in list1: if f[0] == url: func = f[1] break if func: response = func(url) else: response = b\'404 not found\' return [response, ] if __name__ == \'__main__\': httpd = make_server(\'0.0.0.0\', 9090text 来自Codyhouse框架的Browserlist片段源代码