Python之数据流(stream)

Posted 不想秃头的晨晨

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python之数据流(stream)相关的知识,希望对你有一定的参考价值。

大家好!我是晨晨💓
希望大家多多支持我!
为了感谢每一个关注我的小可爱:💓文章留言“学习”即可获取晨晨精心准备的学习大礼包书籍教程,都是无偿分享滴💓
最后——如果文章有帮助到你,记得“关注”、“点赞”、“评论”三连哦~
————————————————

本文参考Python官方文档:https://docs.python.org/zh-cn/3.8/library/asyncio-stream.html#examples

本文参考Python官方文档针对官方文档示例进行解析,解析不完整只为了便于理解

流是用于处理网络连接的高级async/await-ready原语。流允许发送和接收数据,而不需要使用回调或低级协议和传输。

Stream函数

下面的高级 asyncio 函数可以用来创建和处理流:coroutine asyncio. open_connection

(host=None, port=None, *, loop=None, limit=None, ssl=None, family=0, proto=0, flags=0, sock=None, local_addr=None, server_hostname=None, ssl_handshake_timeout=None)

建立网络连接并返回一对 (reader, writer)对象。

返回的 reader 和 writer 对象是 StreamReaderStreamWriter 类的实例。

注意:使用ayncio.open_connection()方法创建和处理流时只有在await时才返回reader和writer对象

为了方便测试我们在本地搭建一个nginx服务器,首页index.html内容为“Hello World”
示例:

import asyncio
async def wget(host):
    connect = asyncio.open_connection(host,80)
    print(type(connect))
    reader,writer = await connect
    print(type(reader),type(writer))
        
async def main():
    # 获取表头主机列表
    hosts = ['192.168.1.100']
   # 根据主机列表获取一个tasks列表
    tasks = [asyncio.create_task(wget(host)) for host in hosts]
    # 等待任务列表执行结果
    await asyncio.gather(*tasks)
 
# 运行
asyncio.run(main() 

运行输出如下:

<class 'coroutine'>
<class 'asyncio.streams.StreamReader'> <class 'asyncio.streams.StreamWriter'>
Exception ignored in: <function _ProactorBasePipeTransport.__del__ at 0x00000236AA956F70>
Traceback (most recent call last):
  File "C:\\ProgramData\\Anaconda3\\lib\\asyncio\\proactor_events.py", line 116, in __del__
    self.close()
  File "C:\\ProgramData\\Anaconda3\\lib\\asyncio\\proactor_events.py", line 108, in close
    self._loop.call_soon(self._call_connection_lost, None)
  File "C:\\ProgramData\\Anaconda3\\lib\\asyncio\\base_events.py", line 719, in call_soon
    self._check_closed()
  File "C:\\ProgramData\\Anaconda3\\lib\\asyncio\\base_events.py", line 508, in _check_closed
    raise RuntimeError('Event loop is closed')
RuntimeError: Event loop is closed

解析:运行报错是因为获取了writer对象但是并没有写数据

打印类型可以看到
完善代码使用writer对象发送请求至服务器,然后reader对象就可以收取服务器发送过来的数据

# asyncio.open_connection创建数据流 start
import asyncio
async def wget(host):
    connect = asyncio.open_connection(host,80)
    print(type(connect))
    reader,writer = await connect
    print(type(reader),type(writer))
    # 定义请求头部,格式是固定格式
    header = 'GET / HTTP/1.0\\r\\n Host:0\\r\\n\\r\\n'.format(host)
    # 通过writer对象往http服务器发送请求,请求是二进制格式的需要使用encode()方法编码
    writer.write(header.encode('utf-8'))
    # writer.write方法需要与drain()方法一起使用
    await writer.drain()
    # 阻塞获取服务器发送过来的所有数据,read()方法一次性获取所有数据,数据多可以使用readline()方法一行行获取
    data = await reader.read()
    # 打印获取的数据,获取数据为二进制格式不加decode()解码则打印原始数据
    print(data.decode())
    # 关闭writer需要和writer.wait_closed()一起使用,这里可以省略
    writer.close()
    await writer.wait_closed()
        
async def main():
    hosts = ['192.168.1.100']
    tasks = [asyncio.create_task(wget(host)) for host in hosts]
    await asyncio.gather(*tasks)
 
asyncio.run(main())
# asyncio.open_connection创建数据流 end

输出如下:

<class 'coroutine'>
<class 'asyncio.streams.StreamReader'> <class 'asyncio.streams.StreamWriter'>
HTTP/1.1 200 OK
Server: nginx/1.14.0
Date: Sat, 30 Oct 2021 09:37:17 GMT
Content-Type: text/html
Content-Length: 12
Last-Modified: Fri, 29 Oct 2021 07:41:00 GMT
Connection: close
ETag: "617ba58c-c"
Accept-Ranges: bytes
 
Hello World

本次代码演示了连接http服务器并且向服务器发送一个GET请求,服务器收到GET请求以后把数据返回给客户,然后通过reader对象获取到服务器发送过来的数据。

注意:本次发送的是一个GET请求,格式是固定的

本次发送的完整数据为

'GET / HTTP/1.0\\r\\n Host:192.168.1.100\\r\\n\\r\\n'

对应关系如下图

拆分解析如下

GET / HTTP/1.0\\r\\n Host:192.168.1.100\\r\\n\\r\\n
GET #请求方法为GET
 # 空格
/ # 请求URL为/即根目录
HTTP/1.0 # 协议版本
\\r\\n # 回车符和换行符
Host # 头部字段为Host
: # 固定格式的符号:
192.168.1.100 # Host的值,即本次请求的主机值
\\r\\n # 请求头部的回车符和换行符
\\r\\n # 最后的回车符和换行符

使用流的TCP回显客户端和服务器

使用流的TCP回显客户端

tcp_stream_client.py
import asyncio
 
# 回显客户端协程函数,传递参数message发送给服务器端,服务器端接收信息原样返回
async def tcp_echo_client(message):
    # 创建reader,writer对象分别用于接收和发送信息
    reader,writer = await asyncio.open_connection('127.0.0.1',8888)
    print(f'Send:message!r')
    # 往服务器端写信息,需要编码后发送
    writer.write(message.encode())
    # await writer.drain()
    # 从服务器端读取信息读取100个字节
    data = await reader.read(100)
    # 打印解码后的信息
    print(f'Received:data.decode()!r')
    print('Close the connection')
    # 关闭
    writer.close()
    # await writer.wait_closed()
 
asyncio.run(tcp_echo_client('Hello World!'))

注意:这里没有使用writer.drain()writer.wait_closed()也可以

使用流的TCP回显服务器端

tcp_stream_server.py
import asyncio
 
# 启动服务后当客户端建立新连接时调用该函数
# 接受参数为reader,writer
# reader是类StreamReader的实例,而writer是类StreamWriter的实例
# 即客户端和服务器端的reader和writer是一一对应的,分别用于接收对方数据流和往对方发送数据流
async def handle_echo(reader, writer):
    # 服务器从客户端读取信息
    # 即客户端通过writer往服务器写的信息
    data = await reader.read(100)
    # 信息解码
    message = data.decode()
    # 该方法获取客户端的ip地址信息
    addr = writer.get_extra_info('peername')
 
    print(f"Received message!r from addr!r")
 
    print(f"Send: message!r")
    # 服务器端把从客户端读取的信息又发送给客户端
    writer.write(data)
    await writer.drain()
    # 关闭连接
    print("Close the connection")
    writer.close()
 
async def main():
    # start_server()方法启动套接字服务,返回一个server对象
    # 当一个新的客户端连接被建立时,回调函数会被调用。该函数会接收到一对参数(reader,writer)
    # reader是类StreamReader的实例,而writer是类StreamWriter的实例
    # client_connected_cb 即可以是普通的可调用对象也可以是一个 协程函数; 如果它是一个协程函数,它将自动作为 Task 被调度。
    server = await asyncio.start_server(handle_echo, '127.0.0.1', 8888)
    # 以下方法可以获取启动的ip地址和端口信息返回一个元组其实即使start_server方法传递的ip和端口信息('127.0.0.1',8888)
    addr = server.sockets[0].getsockname()
    print(f'Serving on addr')
    # 启动服务端
    # Server对象是异步上下文管理器。当用于async with语句时,异步上下文管理器可以确保Server对象被关闭
    # 并且在async with完成后不接受新的连接。
    async with server:
        # server_forver()方法
        # 开始接受连接,直到协程被取消。server_forever任务的取消将导致服务器被关闭
        await server.serve_forever()
 
asyncio.run(main())

打开两个窗口,先启动服务器端
服务器端开启了8888端口等待客户端连接

运行客户端

运行客户端的时候客户端和服务器端建立了连接才启动协程函数handle_echo
服务器端接收的信息为


你们的支持是我最大的动力!!记得三连哦~

关注小编获取更多精彩内容!

制作不易,记得一键三连哦!!

以上是关于Python之数据流(stream)的主要内容,如果未能解决你的问题,请参考以下文章

Python之数据流(stream)

大数据Hadoop Streaming编程实战之C++PhpPython

慕课网实战Spark Streaming实时流处理项目实战笔记十五之铭文升级版

Python基础实战之猜年龄游戏

Nginx之数据流代理stream模块简介和使用

Java函数式编程之Stream流编程