无限for循环内的goroutine。这是一个好习惯吗?

Posted

技术标签:

【中文标题】无限for循环内的goroutine。这是一个好习惯吗?【英文标题】:goroutine inside infinite for loop. Is it a good practice? 【发布时间】:2021-02-13 09:09:24 【问题描述】:

所以我正在编写一段代码:

// Main
for 
    c := make(chan string)
    data := make(map[string]string)
    go doStuff(data,c)
    fmt.Println(<-c)

    time.Sleep(2*time.Second)


// doStuff
func doStuff(d map[string]string,ch chan string)
    defer close(ch)
    //Code to make changes to passed data
    ch <-"changes made"

它的作用是将一个映射和一个通道传递给一个 goroutine,在其中对映射进行一些更改,它会发送消息,在 main 中它会打印并等待另一个修改消息,然后继续在处理传递给 goroutine 的数据后,间隔 2 秒直到键盘中断或一些逻辑。

我觉得这不是有效的方法。 所以我的问题是在无限 for 循环中放置一个 goroutine 是否可以,或者有没有更有效的方法来做到这一点?

【问题讨论】:

如果启动goroutine后必须马上等待goroutine的输出,那为什么还要启动goroutine呢? 无限循环本身并没有错。当循环退出条件需要太多命令才能轻松放入for 条件时,我经常使用for ... 构造。不太合适的是在循环中创建一个只保存一个值的通道的想法。如果你的 goroutine 总是只返回一个值,那么这个返回值的存在就足以表明 goroutine 已经完成。尽可能重复使用通道,如果您想稍后发送更多数据,请不要关闭它们。显然,在您的情况下,goroutine 无论如何都是毫无意义的,仅用于教育目的 @DanielFarrell 谢谢,这回答了我的问题。你能写一个答案,以便我标记它是正确的吗? 我很乐意。我还会添加更多支持信息,因为我会有更多空间 【参考方案1】:

无限循环本身并没有错。当循环退出条件需要太多命令才能轻松放入 for 条件时,我经常使用 for ... 构造。

基于我的$GOPATH/src/github.com/ 目录,这显然是一个非常不完整的样本集,我看到了数百种我自己之外的此类用途。仅github.com/docker/docker 似乎就使用了 454 个这样的无限循环。

不太合适的想法是在循环中创建一个只传递一个值的通道。如果你的 goroutine 总是只返回一个值,那么这个返回值的存在就足以表明 goroutine 已经完成。尽可能重复使用通道,如果您想稍后发送更多数据,请不要关闭它们。

显然,在您的情况下,goroutine 无论如何都是毫无意义的,仅用于教育目的。但是,如果您愿意,请考虑一下:

package main

import (
  "log"
)

func doStuff(datachan <-chan map[string]string, reschan chan<- int) 
  for 
    data, ok := <-datachan
    if !ok 
      log.Print("Channel closed.")
      break
    
    log.Printf("Data had %d length: %+v", len(data), data)
    reschan<-len(data)
  
  return


const workers = 3

func main() 
  var datachan = make(chan map[string]string)
  var reschan = make(chan int)
  var inflight = 0
  var inputs = []map[string]string 
    map[string]string "hi": "world" ,
    map[string]string "bye": "space", "including": "moon" ,
    map[string]string "bye": "space", "including": "moon" ,
    map[string]string ,
    map[string]string ,
  
  // an inline funciton definition can change inflight within main()'s scope
  processResults := func (res int) 
    log.Printf("Main function got result %d", res)
    inflight--
  
  // start some workers
  for i := 0; i < workers; i++
    go doStuff(datachan, reschan)
  
  for _, data := range inputs 
      //Select allows reading from reschan if datachan is not available for
      // writing, thus freeing up a worker to read from datachan next loop
      written := false
      for written  != true 
        select 
          case res := <-reschan:
            processResults(res)
          case datachan <- data:
            inflight++
            written = true
        
      
  
  close(datachan)
  for inflight > 0 
    processResults(<-reschan)
  


输出:

2020/10/31 13:15:08 Data had 1 length: map[hi:world]
2020/10/31 13:15:08 Main function got result 1
2020/10/31 13:15:08 Data had 0 length: map[]
2020/10/31 13:15:08 Main function got result 0
2020/10/31 13:15:08 Data had 0 length: map[]
2020/10/31 13:15:08 Channel closed.
2020/10/31 13:15:08 Main function got result 0
2020/10/31 13:15:08 Data had 2 length: map[bye:space including:moon]
2020/10/31 13:15:08 Channel closed.
2020/10/31 13:15:08 Main function got result 2
2020/10/31 13:15:08 Data had 2 length: map[bye:space including:moon]
2020/10/31 13:15:08 Channel closed.
2020/10/31 13:15:08 Main function got result 2

在这里,我添加了一些结构来说明for close(chan) 的一些更常见的用法。

我在 worker goroutines 中使用了一个潜在的无限循环,其中有 3 个(故意创建的比使用的多)。我数了数我给频道写了多少次,以确保我阅读了每一个回复。当主 goroutine 结束时,所有其他 goroutine 都会被毫不客气地杀死,所以我要确保让它们完成。计算结果是一种简单的方法。

我还演示了close(chan) 的正确用法。虽然在使用后关闭通道(例如您所做的)是不正确的,但通常没有必要这样做,因为在所有对它们的引用无论如何都消失后,打开的通道将被垃圾收集。 (https://***.com/questions/8593645/is-it-ok-to-leave-a-channel-open#:~:text=It's%20OK%20to%20leave%20a,that%20no%20more%20data%20follows.)

close(chan) 通常用于告诉频道读者频道上没有更多可用数据了。

    data, ok := <-datachan

第二个值是一个布尔值,它将告诉我们是读取了data 还是通道实际上已关闭耗尽。所以这是确保我们已处理所有频道的接收器部分。

因为我使用select,这段代码可以处理任意长度的inputs,带有一组静态的worker。这些通道都没有缓冲 - 读者必须在阅读才能让作者写入。因此,在尝试向该阅读器发送另一个数据输入之前,我需要确保从工作人员那里收到任何结果。使用select 使这变得微不足道:无论哪个通道首先准备好,操作都会成功(如果两个通道都准备好,则随机选择一个选项 - 在这种情况下完美运行)。

for close(chan)select,总而言之,在向 goroutine 工作布尔值发送未知数量的输入时,它们可以很好地协同工作。

最后的几点说明。在现实世界中,通常会使用https://gobyexample.com/waitgroups 而不是手动实现这一切。这个概念大体上是相同的,但它更少跟踪事物并导致更清晰的代码。我自己实现了它,所以概念很清楚。

最后,您会注意到,无法保证工作 goroutine 在程序结束之前看到关闭的通道。实际上,从技术上讲,可能不会从所有 goroutine 中记录“关闭通道”消息。但是使用inflight 计数器确保我得到了他们的结果,即使他们没有机会观察到通道的关闭。当应用程序将随着时间的推移继续运行多批工作人员时,关闭通道和退出工作人员更有意义 - 如果我们没有通知他们关闭,但后来创建了更多工作人员,这将导致内存泄漏,就像那些工作人员一样继续等待永远不会到来的输入。或者,对多批请求使用同一组工作人员并不罕见。

【讨论】:

哇!该示例代码回答了我的问题。感谢您的详细回答。

以上是关于无限for循环内的goroutine。这是一个好习惯吗?的主要内容,如果未能解决你的问题,请参考以下文章

Golang for 循环中使用goroutine

For循环中的三元运算符导致无限迭代

Python:如何杀死无限循环?

golang range for循环中如何正确的给goroutine传参

C;如果我在 while 循环内的 for 循环中放置一个 break

无限while循环内的Sleep()函数