golang 一行一行读取文件

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了golang 一行一行读取文件相关的知识,希望对你有一定的参考价值。

package main

import (
	"os"
	"bufio"
	"fmt"
)

func main() {
	file, err := os.Open("readfileline.go")

	if err != nil {
		panic(err)
	}
	defer file.Close()

	scanner := bufio.NewScanner(file)
	
	for scanner.Scan() {
		fmt.Println(scanner.Text())
	}
}

Golang 读文件


阅读目录

  • ​​Go 读取文件​​
  • ​​一、整个文件读取入内存​​
  • ​​1 直接指定文件名读取​​
  • ​​1.1 第一种:使用 os.ReadFile​​
  • ​​1.2 第二种:使用 ioutil.ReadFile​​
  • ​​2 先创建句柄再读取​​
  • ​​二、每次只读取一行​​
  • ​​2.1 使用 bufio.ReadBytes​​
  • ​​2.2 使用 bufio.ReadString​​
  • ​​三、每次只读取固定字节数​​
  • ​​3.1 使用 os 库​​
  • ​​3.2 使用 syscall 库​​

Go 读取文件

Golang

一、整个文件读取入内存

直接将数据直接读取入内存,是效率最高的一种方式,但此种方式,仅适用于小文件,对于大文件,则不适合,因为比较浪费内存。

1 直接指定文件名读取

1.1 第一种:使用 os.ReadFile

package main

import (
"fmt"
"os"
)

func main()
content, err := os.ReadFile("a.txt")
if err != nil
panic(err)

fmt.Println(string(content))

1.2 第二种:使用 ioutil.ReadFile

package main

import (
"io/ioutil"
"fmt"
)

func main()
content, err := ioutil.ReadFile("a.txt")
if err != nil
panic(err)

fmt.Println(string(content))

其实在 Go 1.16 开始,ioutil.ReadFile 就等价于 os.ReadFile,二者是完全一致的。

2 先创建句柄再读取

如果仅是读取,可以使用高级函数 os.Open。

package main

import (
"os"
"io/ioutil"
"fmt"
)

func main()
file, err := os.Open("a.txt")
if err != nil
panic(err)

defer file.Close()
content, err := ioutil.ReadAll(file)
fmt.Println(string(content))

之所以说它是高级函数,是因为它是只读模式的 os.OpenFile。

因此,你也可以直接使用 os.OpenFile,只是要多加两个参数。

package main

import (
"fmt"
"io/ioutil"
"os"
)

func main()
file, err := os.OpenFile("a.txt", os.O_RDONLY, 0)
if err != nil
panic(err)

defer file.Close()
content, err := ioutil.ReadAll(file)
fmt.Println(string(content))

二、每次只读取一行

一次性读取所有的数据,太耗费内存,因此可以指定每次只读取一行数据。

方法有三种:

  • bufio.ReadLine()
  • bufio.ReadBytes(‘\\n’)
  • bufio.ReadString(‘\\n’)

在 bufio 的源码注释中,曾说道 bufio.ReadLine() 是低级库,不太适合普通用户使用,更推荐用户使用 bufio.ReadBytes 和 bufio.ReadString 去读取单行数据。

因此,这里不再介绍 bufio.ReadLine()。

2.1 使用 bufio.ReadBytes

package main

import (
"bufio"
"fmt"
"io"
"os"
"strings"
)

func main()
// 创建句柄
fi, err := os.Open("test_main.txt")
if err != nil
panic(err)


// 创建 Reader
r := bufio.NewReader(fi)

for
lineBytes, err := r.ReadBytes(\\n)
line := strings.TrimSpace(string(lineBytes))
if err != nil && err != io.EOF
panic(err)

if err == io.EOF
break

fmt.Println(line)
break

2.2 使用 bufio.ReadString

package main

import (
"bufio"
"fmt"
"io"
"os"
"strings"
)

func main()
// 创建句柄
fi, err := os.Open("test_main.txt")
if err != nil
panic(err)


// 创建 Reader
r := bufio.NewReader(fi)

for
line, err := r.ReadString(\\n)
line = strings.TrimSpace(line)
if err != nil && err != io.EOF
panic(err)

if err == io.EOF
break

fmt.Println(line)

三、每次只读取固定字节数

每次仅读取一行数据,可以解决内存占用过大的问题,但要注意的是,并不是所有的文件都有换行符 ​​\\n​​。

因此对于一些不换行的大文件来说,还得再想想其他办法。

3.1 使用 os 库

通用的做法是:

  1. 先创建一个文件句柄,可以使用 os.Open 或者 os.OpenFile。
  2. 然后 bufio.NewReader 创建一个 Reader。
  3. 然后在 for 循环里调用 Reader 的 Read 函数,每次仅读取固定字节数量的数据。
package main

import (
"bufio"
"fmt"
"io"
"os"
)

func main()
// 创建句柄
fi, err := os.Open("test_main.txt")
if err != nil
panic(err)


// 创建 Reader
r := bufio.NewReader(fi)

// 每次读取 1024 个字节
buf := make([]byte, 1024)
for
n, err := r.Read(buf)
if err != nil && err != io.EOF
panic(err)


if n == 0
break

fmt.Println(string(buf[:n]))

3.2 使用 syscall 库

os 库本质上也是调用 syscall 库,但由于 syscall 过于底层,如非特殊需要,一般不会使用 syscall。

本篇为了内容的完整度,这里也使用 syscall 来举个例子。

本例中,会每次读取 100 字节的数据,并发送到通道中,由另外一个协程进行读取并打印出来。

package main

import (
"fmt"
"sync"
"syscall"
)

func main()
fd, err := syscall.Open("test_main.txt", syscall.O_RDONLY, 0)
if err != nil
fmt.Println("Failed on open: ", err)

defer syscall.Close(fd)

var wg sync.WaitGroup
wg.Add(2)
dataChan := make(chan []byte)
go func()
wg.Done()
for
data := make([]byte, 100)
n, _ := syscall.Read(fd, data)
if n == 0
break

dataChan <- data

close(dataChan)
()

go func()
defer wg.Done()
for
select
case data, ok := <-dataChan:
if !ok
return


fmt.Printf(string(data))
default:



()
wg.Wait()


以上是关于golang 一行一行读取文件的主要内容,如果未能解决你的问题,请参考以下文章

一行一行读取文件没有换行符golang

Golang 读文件

Golang 读文件

Golang 读文件

golang (*bufio.Reader)的读取方法

Golang - 如何克服 bufio 的 Scan() 缓冲区限制?