go - 如何解决 Go 中的分段违规?
问题描述
我正在编写一个蜘蛛,到目前为止有以下代码:
import (
"fmt"
"math/rand"
"net/http"
"runtime"
"time"
"golang.org/x/net/html"
)
func handleEnd() {
//handle end (close channels, etc)
fmt.Println("Placeholder")
}
func worker(c chan string) {
var url string
url = <-c
fmt.Println(url)
//get the url
resp, err := http.Get(url)
defer resp.Body.Close()
if err != nil {
fmt.Println(err)
//we should log this incase this is in the background
}
//operate on it
//find links
z := html.NewTokenizer(resp.Body)
for {
tt := z.Next()
switch {
case tt == html.ErrorToken:
// End of the document, we're done
return
case tt == html.StartTagToken:
t := z.Token()
isAnchor := t.Data == "a"
if isAnchor {
fmt.Println("We found a link!")
}
}
}
//handle local links()
//send links to channel
//}
}
func genStartUrls(howMany, length int) []string {
var ans []string
var letters = []rune("abcdefghijklmnopqrstuvwxyz")
rand.Seed(time.Now().UnixNano())
for i := 0; i < howMany; i++ {
b := make([]byte, length)
for i := range b {
b[i] = byte(letters[rand.Intn(len(letters))])
}
ans = append(ans, "http://"+string(b)+".com")
}
return ans
}
func main() {
defer handleEnd()
workers := 3
l := make(chan string, 10000)
defer close(l)
for _, url := range genStartUrls(100, 3) {
l <- url
}
for i := 0; i < workers; i++ {
go worker(l)
}
for {
runtime.Gosched()
}
}
起初,它按预期工作(它从页面中找到hrefs),但是当我打破它并再次运行它,然后再做几次同样的事情时,我收到以下错误:
[signal SIGSEGV: segmentation violation code=0x1 addr=0x40 pc=0x6454f1]
goroutine 7 [running]:
main.worker(0xc0000662a0)
/home/name/go/src/spider/main.go:25 +0x121
created by main.main
/home/name/go/src/spider/main.go:85 +0x138
exit status 2
当我重新启动计算机时,该问题会在程序运行几次后消失,但随后又出现了。这让我觉得当我的主程序结束时,goroutines 可能不会结束,而是继续作为僵尸进程。我该如何解决这个错误?
解决方案
程序结束后,Goroutines 无法继续。
以下几行可能是您的问题的根源:
resp, err := http.Get(url)
defer resp.Body.Close()
if err != nil {
你必须defer
在错误检查之后移动,因为如果有错误,resp
将是 nil,并且defer resp.Body.Close()
会失败。
resp, err := http.Get(url)
if err != nil {
...
return err
}
defer resp.Body.Close()
推荐阅读
- c# - 如何在 C# 中从一种形式导航到另一种形式?
- gitversion - GitVersion 工具中的 IsDynamicGitRepository 标志是什么
- javascript - 从函数子组件调用类中的回调函数时反应“this”未定义
- ember.js - ember-changeset-validations 未正确验证
- mysql - 如何根据进程ID获取SQL语句?
- amazon-web-services - Get-IAMCredentialReport 中的 AWS Powershell 6 错误
- r - 数据分组可与 Pandas group-by 和 grouper 相媲美
- rust - 循环外的 Rust 类型不匹配错误
- angular - 如何在Angular中将一些变量从一个组件传递到另一个组件?
- python - 如何在openCV中确定轮廓是否为圆弧