Go语言使用buffer读取文件

 
buffer 是缓冲器的意思,Go语言要实现缓冲读取需要使用到 bufio 包。bufio 包本身包装了 io.Reader 和 io.Writer 对象,同时创建了另外的 Reader 和 Writer 对象,因此对于文本 I/O 来说,bufio 包提供了一定的便利性。

buffer 缓冲器的实现原理就是,将文件读取进缓冲(内存)之中,再次读取的时候就可以避免文件系统的 I/O 从而提高速度。同理在进行写操作时,先把文件写入缓冲(内存),然后由缓冲写入文件系统。

使用 bufio 包写入文件

bufio 和 io 包中有很多操作都是相似的,唯一不同的地方是 bufio 提供了一些缓冲的操作,如果对文件 I/O 操作比较频繁的,使用 bufio 包能够提高一定的性能。

在 bufio 包中,有一个 Writer 结构体,而其相关的方法支持一些写入操作,如下所示。
//Writer 是一个空的结构体,一般需要使用 NewWriter 或者 NewWriterSize 来初始化一个结构体对象
type Writer struct {
        // contains filtered or unexported fields
}

//NewWriterSize 和 NewWriter 函数
//返回默认缓冲大小的 Writer 对象(默认是4096)
func NewWriter(w io.Writer) *Writer

//指定缓冲大小创建一个 Writer 对象
func NewWriterSize(w io.Writer, size int) *Writer

//Writer 对象相关的写入数据的方法

//把 p 中的内容写入 buffer,返回写入的字节数和错误信息。如果 nn < len(p),返回错误信息中会包含为什么写入的数据比较短
func (b *Writer) Write(p []byte) (nn int, err error)
//将 buffer 中的数据写入 io.Writer
func (b *Writer) Flush() error

//以下三个方法可以直接写入到文件中
//写入单个字节
func (b *Writer) WriteByte(c byte) error
//写入单个 Unicode 指针返回写入字节数错误信息
func (b *Writer) WriteRune(r rune) (size int, err error)
//写入字符串并返回写入字节数和错误信息
func (b *Writer) WriteString(s string) (int, error)
示例代码如下所示:
package main

import (
    "bufio"
    "fmt"
    "os"
)

func main() {
    name := "demo.txt"
    content := "http://c.biancheng.net/golang/"

    fileObj, err := os.OpenFile(name, os.O_RDWR|os.O_CREATE|os.O_APPEND, 0644)
    if err != nil {
        fmt.Println("文件打开失败", err)
    }

    defer fileObj.Close()
    writeObj := bufio.NewWriterSize(fileObj, 4096)

    //使用 Write 方法,需要使用 Writer 对象的 Flush 方法将 buffer 中的数据刷到磁盘
    buf := []byte(content)
    if _, err := writeObj.Write(buf); err == nil {
        if err := writeObj.Flush(); err != nil {
            panic(err)
        }
        fmt.Println("数据写入成功")
    }
}
运行上面的代码会在当前目录之下生成 demo.txt 文件,并将“http://c.biancheng.net/golang/”写入到该文件中。

使用 bufio 包读取文件

使用 bufio 包读取文件也非常方便,我们先来看下 bufio 包的相关的 Reader 函数方法:
//首先定义了一个用来缓冲 io.Reader 对象的结构体,同时该结构体拥有以下相关的方法
type Reader struct {
}

//NewReader 函数用来返回一个默认大小 buffer 的 Reader 对象(默认大小是 4096) 等同于 NewReaderSize(rd,4096)
func NewReader(rd io.Reader) *Reader

//该函数返回一个指定大小 buffer(size 最小为 16)的 Reader 对象,如果 io.Reader 参数已经是一个足够大的 Reader,它将返回该 Reader
func NewReaderSize(rd io.Reader, size int) *Reader

//该方法返回从当前 buffer 中能被读到的字节数
func (b *Reader) Buffered() int

//Discard 方法跳过后续的 n 个字节的数据,返回跳过的字节数。如果 0 <= n <= b.Buffered(),该方法将不会从 io.Reader 中成功读取数据
func (b *Reader) Discard(n int) (discarded int, err error)

//Peekf 方法返回缓存的一个切片,该切片只包含缓存中的前 n 个字节的数据
func (b *Reader) Peek(n int) ([]byte, error)

//把 Reader 缓存对象中的数据读入到 []byte 类型的 p 中,并返回读取的字节数。读取成功,err 将返回空值
func (b *Reader) Read(p []byte) (n int, err error)

//返回单个字节,如果没有数据返回 err
func (b *Reader) ReadByte() (byte, error)

//该方法在 b 中读取 delimz 之前的所有数据,返回的切片是已读出的数据的引用,切片中的数据在下一次的读取操作之前是有效的。如果未找到 delim,将返回查找结果并返回 nil 空值。因为缓存的数据可能被下一次的读写操作修改,因此一般使用 ReadBytes 或者 ReadString,他们返回的都是数据拷贝
func (b *Reader) ReadSlice(delim byte) (line []byte, err error)

//功能同 ReadSlice,返回数据的拷贝
func (b *Reader) ReadBytes(delim byte) ([]byte, error)

//功能同 ReadBytes,返回字符串
func (b *Reader) ReadString(delim byte) (string, error)

//该方法是一个低水平的读取方式,一般建议使用 ReadBytes('\n') 或 ReadString('\n'),或者使用一个 Scanner 来代替。ReadLine 通过调用 ReadSlice 方法实现,返回的也是缓存的切片,用于读取一行数据,不包括行尾标记(\n 或 \r\n)
func (b *Reader) ReadLine() (line []byte, isPrefix bool, err error)

//读取单个 UTF-8 字符并返回一个 rune 和字节大小
func (b *Reader) ReadRune() (r rune, size int, err error)
示例代码如下:
package main

import (
    "bufio"
    "fmt"
    "os"
    "strconv"
)

func main() {
    fileObj, err := os.Open("demo.txt")
    if err != nil {
        fmt.Println("文件打开失败:", err)
        return
    }
    defer fileObj.Close()
    //一个文件对象本身是实现了io.Reader的 使用bufio.NewReader去初始化一个Reader对象,存在buffer中的,读取一次就会被清空
    reader := bufio.NewReader(fileObj)
    buf := make([]byte, 1024)
    //读取 Reader 对象中的内容到 []byte 类型的 buf 中
    info, err := reader.Read(buf)
    if err != nil {
        fmt.Println(err)
    }
    fmt.Println("读取的字节数:" + strconv.Itoa(info))
    //这里的buf是一个[]byte,因此如果需要只输出内容,仍然需要将文件内容的换行符替换掉
    fmt.Println("读取的文件内容:", string(buf))
}
运行结果如下:

go run main.go
读取的字节数:30
读取的文件内容: http://c.biancheng.net/golang/