持久的子进程管道 - 没有读取标准输出

Question

我有一个处理链，沿着这些方向：

以前的一种方法是

cat input | preprocess.sh | transform.py | postprocess.sh

这适用于处理批量输入数据。

但是，我现在发现自己需要在Python中将其实现为服务器功能 - 我需要能够接受单个数据项，运行管道并快速将其吐出。

我只是在Python中调用的中心步骤，所以这是最简单的部分。后处理也相对容易。

问题在于：预处理代码由4个不同的脚本组成，每个脚本将数据输出到下一个脚本，其中两个脚本需要从磁盘加载模型文件才能工作。这种加载速度相对较慢，对我的执行时间来说也很糟糕。因此，我认为我需要以某种方式将它们保存在内存中，写入它们的stdins并读取输出。

但是，我发现对于我的链中的每个链接，我都不能写入stdin并在不关闭stdout的情况下读取stdin，这会使该方法无用，因为我必须重新打开该过程并再次加载模型。

请注意，对于链中的每个链接，这不是我的脚本的问题

cat input_data | preprocessing_script_i.sh

返回Bash中的内容。

这是我到目前为止尝试过的事情：

有没有办法从Python做到这一点？这是否有可能，因为我开始怀疑这一点？可以重新实现这个管道（不触及元素，因为对我的用例来说不太可行）在另一种语言中为我解决这个问题？

Answer 1

另一答案

Answer 2

另一答案