go - 为什么在 runtime.GOMAXPROCS(1) 时单个 goroutine 比多个 goroutine 运行得慢?
问题描述
我只是想试试goroutine切换上下文的速度有多快,所以我写了下面的代码。令我惊讶的是,多个 gorountine 比不需要切换上下文的版本运行得更快(我将程序设置为仅在一个 CPU 内核中运行)。
package main
import (
"fmt"
"runtime"
"sync"
"time"
)
func main() {
runtime.GOMAXPROCS(1)
t_start := time.Now()
sum := 0
for j := 0; j < 10; j++ {
sum = 0
for i := 0; i < 100000000; i++ {
sum += i
}
}
fmt.Println("single goroutine takes ", time.Since(t_start))
var wg sync.WaitGroup
t_start = time.Now()
for j := 0; j < 10; j++ {
wg.Add(1)
go func() {
sum := 0
for i := 0; i < 100000000; i++ {
sum += i
}
defer wg.Done()
}()
}
wg.Wait()
fmt.Println("multiple goroutines take ", time.Since(t_start))
}
单个 goroutine 耗时 251.690788ms,多个 goroutine 耗时 254.067156ms
单个 goroutine 应该运行得更快,因为单个 goroutine 不需要更改上下文。然而,答案是相反的,单模式总是慢一些。这个节目发生了什么?
解决方案
您的并发版本是非并发版本所做的几件事,这将使其变慢:
- 它正在创造一个
sum
必须分配的新价值。您的非并发版本只是重置现有值。这可能影响很小,但有所不同。 - 您正在使用等待组。显然这会增加开销。
defer
indefer wg.Done()
也增加了开销,大致相当于一个额外的函数调用。
很可能还有其他细微的差异。
简而言之:您的基准是无效的,因为您将苹果与橙子进行比较。
更重要的是:这首先不是一个有用的基准,因为它完全是人为的工作负载。
推荐阅读
- reactjs - 如何使用 useState 挂钩更新对象状态
- python - Flask-login 在带有 @login_required 的页面上引发 401 状态
- rx-java2 - 如何使用 SSE(服务器发送事件)处理 RxJava2 Flowable 上的浏览器关闭情况(动作/事件)
- terraform - Terraform - 从地图创建更多虚拟机
- magento2 - 自定义产品属性未显示在管理中 (Magento 2.4.0)
- excel - 过滤特定数字/删除文本
- python - 安装 conda 的 Bash 脚本会导致“conda: command not found”,除非我之后在命令行运行 `bash`
- asp.net - ASP.NET 未从本地计算机的数据库中获取数据
- ios - Xcode Archives 中的特定崩溃日志
- spring - Spring Security 自定义过滤器被多次调用