首页 > 解决方案 > 为什么在 runtime.GOMAXPROCS(1) 时单个 goroutine 比多个 goroutine 运行得慢?

问题描述

我只是想试试goroutine切换上下文的速度有多快,所以我写了下面的代码。令我惊讶的是,多个 gorountine 比不需要切换上下文的版本运行得更快(我将程序设置为仅在一个 CPU 内核中运行)。

package main

import (
    "fmt"
    "runtime"
    "sync"
    "time"
)

func main() {
    runtime.GOMAXPROCS(1)
    t_start := time.Now()
    sum := 0
    for j := 0; j < 10; j++ {
        sum = 0
        for i := 0; i < 100000000; i++ {
            sum += i
        }
    }
    fmt.Println("single goroutine takes ", time.Since(t_start))

    var wg sync.WaitGroup
    t_start = time.Now()

    for j := 0; j < 10; j++ {
        wg.Add(1)
        go func() {
            sum := 0
            for i := 0; i < 100000000; i++ {
                sum += i
            }
            defer wg.Done()
        }()
    }
    wg.Wait()
    fmt.Println("multiple goroutines take ", time.Since(t_start))
}

单个 goroutine 耗时 251.690788ms,多个 goroutine 耗时 254.067156ms

单个 goroutine 应该运行得更快,因为单个 goroutine 不需要更改上下文。然而,答案是相反的,单模式总是慢一些。这个节目发生了什么?

标签: gogoroutine

解决方案


您的并发版本是非并发版本所做的几件事,这将使其变慢:

  1. 它正在创造一个sum必须分配的新价值。您的非并发版本只是重置现有值。这可能影响很小,但有所不同。
  2. 您正在使用等待组。显然这会增加开销。
  3. deferindefer wg.Done()也增加了开销,大致相当于一个额外的函数调用。

很可能还有其他细微的差异。

简而言之:您的基准是无效的,因为您将苹果与橙子进行比较。

更重要的是:这首先不是一个有用的基准,因为它完全是人为的工作负载。


推荐阅读