go 爬虫

Posted php-linux

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了go 爬虫相关的知识,希望对你有一定的参考价值。

package main

import (
	"bufio"
	"fmt"
	"io/ioutil"
	"net/http"
	"os"
)
func main() {

	client := &http.Client{}

	req,err := http.NewRequest("GET","http://tool.yeves.cn/",nil)
	if err != nil{
		fmt.Println(err)
	}

	req.Header.Add("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/74.0.3729.108 Safari/537.2222")

	resp,err := client.Do(req)
	defer resp.Body.Close()

	if err != nil{
		fmt.Println("err")
	}

	body,err := ioutil.ReadAll(resp.Body)
	if err != nil{
		fmt.Println(err)
	}
	writeToFile(string(body))
}

func writeToFile(str string )  {
	filePath := "./a.html"
	file, err := os.OpenFile(filePath, os.O_WRONLY | os.O_CREATE, 0666)
	if err != nil {
		fmt.Printf("open file err=%v
", err)
		return
	}
	//及时关闭file句柄
	defer file.Close()
	//写入时,使用带缓存的 *Writer
	writer := bufio.NewWriter(file)
	for i := 0; i < 5; i++ {
		writer.WriteString(str)
	}

}

  

以上是关于go 爬虫的主要内容,如果未能解决你的问题,请参考以下文章

Go Web爬虫并发实现

[Go] 通过 17 个简短代码片段,切底弄懂 channel 基础

解决go: go.mod file not found in current directory or any parent directory; see ‘go help modules‘(代码片段

你知道的Go切片扩容机制可能是错的

go并发版爬虫

go写的爬虫相比python写的都有哪些优势