Keras fit_generator中的max_queue_size, workers, use_multiprocessing设置

Posted mishidemudong

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Keras fit_generator中的max_queue_size, workers, use_multiprocessing设置相关的知识,希望对你有一定的参考价值。

Keras Model.fit_generator中这三个参数的说明

max_queue_size:

    maximum size of the internal training queue which is used to "precache" samples from the generator

    预缓存的最大队列数量

workers:

    number of threads generating batches in parallel. Batches are computed in parallel on the CPU and passed on the fly onto the GPU for neural network computations

    获取batch时的“线程”并行数

use_multiprocessing:

    whether to use process-based threading

    是否使用 基于进程的线程,猜测是选择进程并行还是线程并行

在fit_generator的demo设置中多采用max_queue_size=10, workers=1, use_multiprocessing=False
max_queue_size

keras训练时会持续创建batch直到缓存队列达到max_queue_size的设置或者训练结束时。使用缓存的好处是在GPU运算快时,避免GPU等待CPU生成batch而浪费时间。
workers

workers是CPU准备数据的并行数,和max_queue_size相似,如果GPU在等数据,调大workers和max_queue_size可以更快的准备数据,避免GPU空转。
use_multiprocessing

是否使用基于进程的线程,对于keras原生的数据生成器或者线程安全的数据生成器,使用True时一般不会出现问题,但是自定义的数据生成器在workers大于1时设置本参数True可能会出现阻塞的问题,例子,此时用False可以避免问题。如果使用多个生成器时,只有设置True时才能有效加速。

参考:

python - How to define max_queue_size, workers and use_multiprocessing in keras fit_generator()? - Stack Overflow

Tip – fit_generator in keras – how to parallelise correctly – Keunwoo Choi (wordpress.com)
————————————————
版权声明:本文为CSDN博主「there2belief」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/dou3516/article/details/118757164

以上是关于Keras fit_generator中的max_queue_size, workers, use_multiprocessing设置的主要内容,如果未能解决你的问题,请参考以下文章

如何在 keras fit_generator() 中定义 max_queue_size、workers 和 use_multiprocessing?

使用 keras.utils.Sequence 和 keras.model.fit_generator 时出现 KeyError。

使用Keras model.fit_generator生成器

使用 Keras fit_generator 和 datagen.flow 时出现内存错误

使用 fit_generator 时 Keras 中的嘈杂验证损失

为啥 fit_generator 的准确性与 Keras 中的 evaluate_generator 的准确性不同?