Go 在 os 中提供了文件的基本操作,包括通常意义的打开、创建、读写等操作,除此以外为了追求便捷以及性能上,Go 还在 io/ioutil 以及 bufio 提供一些其他函数供开发者使用,今天在这篇文章中,我们介绍一些常用文件操作在 Go 中是如何使用的。
File 文件类型
Go 在 os 中定义了 File 类型:1
2
3type File struct {
// contains filtered or unexported fields
}
打开一个文件进行读直接使用 os.Open
:1
file, err := os.Open("msg.txt")
os.Open
只接受一个文件名参数,默认打开的文件只支持读操作,文件的读写 flag
是以常量的形式定义的 Constants 分别是:
1 | const ( |
以 os.Open
打开的文件其实就只有 O_RDONLY
flag。
文件读取
读取文件操作时通过 File
的方法 Read 进行的,这个方法接受一个参数 buf []byte
,默认读取的内容大小是 len(buf)
,并且返回读取的字节 size 和错误(如果有的话),如果读取到了文件末尾,则返回 0以及io.EOF
。
1 | if err != nil { |
按行读取
在大多数文件操作中,我们可能只需要的一行行读取文件就可以满足需要,在 Go 中如何读取行呢?至少在 os 这个 package 中好像没有找到相关操作,其实 Go 已经在其他包中提供了这个操作 bufio。
bufio 顾名思义就是带 buffer 的 IO,由于频繁读写磁盘会有相当的性能开销,因为一次磁盘的读写就是一次系统的调用,所以 Go 提供了一个 buffer 来缓冲读写的数据,比如多次写磁盘 bufio 就会把数据先缓冲起来,待 buffer 装满之后一次性写入,又比如多次读数据,bufio 会预先按照 buffer 的大小(一般是磁盘 block size 的整数倍)尽量多的读取数据,也就是采用预读的技术以提高读的性能。
bufio 提供了 Reader 、Writer、Scanner 来进行文件的读写,其中 Reader 和 Scanner 都支持按行读取文件。
Reader 读取行
使用 Reader 的ReadLine 按行读,其中 file 表示我们刚才打开的文件:
1 | reader := bufio.NewReader(file) |
ReadLine 读取文件的一行,默认是以 \r\n
或者 \n
分割,并且不包括分割符,如果行太长超过了内部 buffer 的大小,第二个返回值 isPrefix 就会被设置,直到 isPrefix 为 false 为止,表示一行读取完成。
除了 ReadLine 之外,ReadBytes 也支持按行读取,区别是 ReadBytes 需要显示的指定分隔符,而且其返回的数据中包括分割符:
1 | buf, err = reader.ReadBytes('\n') |
除了对行的读取,bufio.Reader 还包含 ReadRune、ReadSlice、ReadString 等读取内容的函数。
Scanner 读取行
Scanner 其实类似于 Reader,但是 scanner 有更强的便捷性,scanner 的主要目的就是利用各种分隔符来读取行,他提供了 SplitFunc 来自定义对文件内容的分割:
1 | scanner := bufio.NewScanner(file) |
上面的代码会把文件 file 的内容按行输出,为什么恰好会按行输出?主要原因是 scanner 提供的默认的 SplitFunc 是 ScanLines,也就是 scanner.Text() 方法使用就是这个 splitfunc。
接下类我们使用一个自定义的 SplitFunc 来实现从文本中找到可以转换成数字的字符。
1 | r := strings.NewReader("123 456 k789 123") |
上面的例子中我们定义了一个 SplitFunc,正如 SplitFunc 签名一样,他接受三个参数,分别是待处理的数据 data,是否还有更多的数据要处理的标识 atEOF,然后返回的是当前已经处理的数据的字节长度 advance,已经处理的字节数组 token,以及一个可选的错误 err。
advance 的计算是从当前剩下要处理的数据首位 0 的位置开始一直到下一个分割符,并且包含分隔符占用的字节,可以对照看以下输出就能明白:
1 | data="123 456 k789 123" |
而且需要注意的是,scanner 在遇到一个错误之后就停止 Scan 了,上面的 ParseInt 发生错误之后之后的 Scan 也不会输出。
File 类型和 bufio
如图 File 是实现了io.Reader
和 io.Writer
两个 interface 的 type,而 bufio 提供的几种操作都以这两个 interface 为基础实现文件的读写,也就是说只要 type 实现了 io.Reader 就可以使用 bufio 读取,实现了 io.Writer 就可以使用 bufio 输出。
1 | str := strings.NewReader(strings.Repeat("ab", 10)) |
如上代码 str 是一个 string 的 Reader,然后就可以使用 bufio进行高效读取。
文件的输出
文件的写入类似文件的读取,Go 提供了 Create、 OpenFile 打开文件进行写入或追加。
Create 会打开一个文件,默认的模式是 O_RDWR 即读和写,如果原来的文件已经存在则清空,如果不存在则新创建一个。
1 | file, err := os.Create("new.txt") |
OpenFile 提供了更灵活的方式打开一个文件,他接受三个参数,依次是文件名,打开文件的 flag,以及文件权限。
1 | file, err := os.OpenFile("new.txt", os.O_RDWR|os.O_CREATE, 0775) |
除了 WriteString,file 类型还提供了 Write 方法,区别是 Write 接受的是 []byte 。
使用 bufio.Writer 进行文件输出
上面我们提到过 bufio 提供了 Writer 来进行高效的输出,如何使用呢?
Writer 实际上是一个内部包含 buffer 的特殊 struct,其结构大致如下:
1 | type Writer struct { |
buf 这个 field 就是缓冲输出内容的,当满足指定 size 之后,Writer 才会把 buf 中的内容通过 wr 写到输出对象。
1 | wr := bufio.NewWriterSize(os.Stdout, 38) |
上面的代码会在 buf 的 size 满足 38 之后输出到标准输出,可以运行代码查看输出时间隔 2 秒产生的:
1 | count 0 |
默认情况下 bufio.Writer 指定的 size 大小是 defaultBufSize = 4096,像上面的代码一样可以通过 NewWriterSize 来改变这个大小。
需要注意的是,Writer 在遇到错误之后不会接着执行后面的输出,看以下代码:
1 | type Writer int |
输出:
1 | Write: "abc" |
最后一个字符 d 没有输出
ioutil 包的文件读写
除了上面提到的对文件的读写操作,io/ioutil 中提供了几个便捷的函数来读写文件,分别是: