如何读取子进程标准输出的第一个字节,然后在 Python 中丢弃其余字节?
Posted
技术标签:
【中文标题】如何读取子进程标准输出的第一个字节,然后在 Python 中丢弃其余字节?【英文标题】:How to read the first byte of a subprocess's stdout and then discard the rest in Python? 【发布时间】:2011-07-26 14:08:26 【问题描述】:我想读取子进程的标准输出的第一个字节,以了解它已经开始运行。之后我想丢弃所有进一步的输出,这样我就不必担心缓冲区了。
最好的方法是什么?
澄清:我希望子进程继续与我的程序一起运行,我不想等待它终止或类似的事情。理想情况下,有一些简单的方法可以做到这一点,而无需诉诸 threading
、fork
ing 或 multiprocessing
。
如果我忽略输出流,或.close()
它,如果发送的数据多于缓冲区容纳不下的数据,则会导致错误。
【问题讨论】:
我的回答不正是你想要的吗?启动子进程,读取第一个字节,然后继续并行运行进程... 据我所知,它会继续将stdout
和stderr
读入缓冲区,浪费内存。我不确定,但是如果缓冲区填满,这也可能导致子进程阻塞。我想避免这种情况。
他的解决方案不会阻塞,因为它从不读取超过第一个字节的任何内容。但你不知道它什么时候完成。 wait
不会读取任何内容,但可能会阻塞(如果程序写入过多并开始等待操作系统读取管道)。我的communicate
不会,它会读取内容,占用内存。但是您不阅读就无法知道该过程何时结束...让我提供另一种解决方案
@Jeremy 我修改了我的示例以证明没有浪费任何内存。使用进程监视器运行并观察进程的内存使用情况。它永远不会上升。
我已经测试过了,第二个进程阻塞了一次,第一个进程中的stdout
缓冲区已满。
【参考方案1】:
这似乎可行,但感觉不习惯。
#!/usr/bin/env python3.1
import threading
import subprocess
def discard_stream_while_running(stream, process):
while process.poll() is None:
stream.read(1024)
def discard_subprocess_pipes(process, out=True, err=True, in_=True):
if out and process.stdout is not None and not process.stdout.closed:
t = threading.Thread(target=discard_stream_while_running, args=(process.stdout, process))
t.start()
if err and process.stderr is not None and not process.stderr.closed:
u = threading.Thread(target=discard_stream_while_running, args=(process.stderr, process))
u.start()
if in_ and process.stdin is not None and not process.stdin.closed:
process.stdin.close()
示例/测试用法
if __name__ == "__main__":
import tempfile
import textwrap
import time
with tempfile.NamedTemporaryFile("w+t", prefix="example-", suffix=".py") as f:
f.write(textwrap.dedent("""
import sys
import time
sys.stderr.write(" byte(s) read through stdin.\\n"
.format(len(sys.stdin.read())))
# Push a couple of MB/s to stdout, messages to stderr.
while True:
sys.stdout.write("Hello Parent\\n" * 1000000)
sys.stderr.write("Subprocess Writing Data\\n")
time.sleep(0.5)
"""))
f.flush()
p = subprocess.Popen(["python3.1", f.name],
stdout=subprocess.PIPE,
stdin=subprocess.PIPE)
p.stdin.write("Hello Child\n".encode())
discard_subprocess_pipes(p) # <-- Here
for s in range(16, 0, -1):
print("Main Process Running For", s, "More Seconds")
time.sleep(1)
【讨论】:
你不是在等待第一个字节被读取。虽然:p.poll() is None
在Popen()
之后表示子进程 正在 运行。如果这就是你所需要的,那么你应该use DEVNULL
-based solution instead。【参考方案2】:
如果您使用的是 Python 3.3+,则可以使用 stdout
和 stderr
的特殊值 DEVNULL
来丢弃子进程输出。
from subprocess import Popen, DEVNULL
process = Popen(["mycmd", "myarg"], stdout=DEVNULL, stderr=DEVNULL)
或者,如果您使用的是 Python 2.4+,您可以使用以下方法进行模拟:
import os
from subprocess import Popen
DEVNULL = open(os.devnull, 'wb')
process = Popen(["mycmd", "myarg"], stdout=DEVNULL, stderr=DEVNULL)
但是这并没有让您有机会读取标准输出的第一个字节。
【讨论】:
换句话说......它没有回答问题。 它回答了帖子标题中的问题。因此,我认为这对其他在互联网搜索中到达此页面的人会很有用。 这会干扰subprocess.check_call
吗?我不这么认为,因为退出状态是由wait
给出的,但是,为了确定。
此技术也适用于 check_call,因为它采用与 Popen 相同的参数。
DEVNULL
对我不起作用。我正在使用 Python 3.2.3以上是关于如何读取子进程标准输出的第一个字节,然后在 Python 中丢弃其余字节?的主要内容,如果未能解决你的问题,请参考以下文章