kubeflow ParallelFor 使用之前的 containerop 输出

Posted

技术标签:

【中文标题】kubeflow ParallelFor 使用之前的 containerop 输出【英文标题】:kubeflow ParallelFor using the previous containerop output 【发布时间】:2020-04-02 13:52:37 【问题描述】:

我可以使用

创建一个静态 for 循环
with dsl.ParallelFor([1,2,3]) as item:
   ....

如何使用container_op.output 作为ParallelFor 的输入? 假设第一个容器输出一个整数n,然后我想运行ParallelFor n次。

这样的尝试不起作用:

container_op = ContainerOp(...)
with dsl.ParallelFor(container_op.output) as item:
   ....

我正在尝试刺激并行 python range(n) 函数。

【问题讨论】:

【参考方案1】:

对支持withItem(静态循环)和withParams(动态循环)的更改分多个部分完成,但它们现在都可用。参考PR。

确保您的 KPF 版本为 0.1.31 或更高版本。

可以循环遍历之前的container_op 的输出,如下所示

echo_op = dsl.ContainerOp(
        name='echo',
        image='library/bash:4.4.23',
        command=['sh', '-c'],
        arguments=['echo "[1,2,3]"> /tmp/output.txt'],
        file_outputs='output': '/tmp/output.txt')

with dsl.ParallelFor(echo_op.output) as item:
        iterate_op = dsl.ContainerOp(
        name='iterate',
        image='library/bash:4.4.23',
        command=['sh', '-c'],
        arguments=[f"echo item > /tmp/output.txt"],
        file_outputs='output': '/tmp/output.txt')

确保您的输出 YAML 看起来像这样:

        name: for-loop-for-loop-3c29048d-1
        template: for-loop-for-loop-3c29048d-1
        withParam: 'tasks.echo.outputs.parameters.echo-output'

【讨论】:

谢谢。是否可以在ParallelFor 中压缩两个输出并将它们提供给第二个组件?

以上是关于kubeflow ParallelFor 使用之前的 containerop 输出的主要内容,如果未能解决你的问题,请参考以下文章

kubeflow--使用图形界面

轻松扩展机器学习能力:如何在Rancher上安装Kubeflow

是否可以将 kubeflow 组件与 tensorflow 扩展组件混合使用?

Kubeflow 与其他选项 [关闭]

Kubeflow安装及代码架构解读

使用Kubeflow构建机器学习流水线