Go程序的切片
7.2 切片
7.2.1 概念
切片 (slice) 是对数组一个连续片段的引用(该数组我们称之为相关数组,通常是匿名的),所以切片是一个引用类型(因此更类似于 C/C++ 中的数组类型,或者 Python 中的 list 类型)。这个片段可以是整个数组,或者是由起始和终止索引标识的一些项的子集。需要注意的是,终止索引标识的项不包括在切片内。切片提供了一个相关数组的动态窗口。
切片是可索引的,并且可以由 len()
函数获取长度。
给定项的切片索引可能比相关数组的相同元素的索引小。和数组不同的是,切片的长度可以在运行时修改,最小为 0, 最大为相关数组的长度:切片是一个 长度可变的数组。
切片提供了计算容量的函数 cap()
可以测量切片最长可以达到多少:它等于切片的长度 + 数组除切片之外的长度。如果 s
是一个切片,cap(s)
就是从 s[0]
到数组末尾的数组长度。切片的长度永远不会超过它的容量,所以对于切片 s
来说该不等式永远成立:0 <= len(s) <= cap(s)
。
多个切片如果表示同一个数组的片段,它们可以共享数据;因此一个切片和相关数组的其他切片是共享存储的,相反,不同的数组总是代表不同的存储。数组实际上是切片的构建块。
优点 因为切片是引用,所以它们不需要使用额外的内存并且比使用数组更有效率,所以在 Go 代码中切片比数组更常用。
声明切片的格式是: var identifier []type
(不需要说明长度)。
一个切片在未初始化之前默认为 nil
,长度为 0。
切片的初始化格式是:var slice1 []type = arr1[start:end]
。
这表示 slice1
是由数组 arr1
从 start
索引到 end-1
索引之间的元素构成的子集(切分数组,start:end
被称为切片表达式)。所以 slice1[0]
就等于 arr1[start]
。这可以在 arr1
被填充前就定义好。
如果某个人写:var slice1 []type = arr1[:]
那么 slice1
就等于完整的 arr1
数组(所以这种表示方式是 arr1[0:len(arr1)]
的一种缩写)。另外一种表述方式是:slice1 = &arr1
。
arr1[2:]
和 arr1[2:len(arr1)]
相同,都包含了数组从第三个到最后的所有元素。
arr1[:3]
和 arr1[0:3]
相同,包含了从第一个到第三个元素(不包括第四个)。
如果你想去掉 slice1
的最后一个元素,只要 slice1 = slice1[:len(slice1)-1]
。
一个由数字 1、2、3 组成的切片可以这么生成:s := [3]int{1,2,3}[:]
(注:应先用 s := [3]int{1, 2, 3}
生成数组, 再使用 s[:]
转成切片)甚至更简单的 s := []int{1,2,3}
。
s2 := s[:]
是用切片组成的切片,拥有相同的元素,但是仍然指向相同的相关数组。
一个切片 s
可以这样扩展到它的大小上限:s = s[:cap(s)]
,如果再扩大的话就会导致运行时错误(参见第 7.7 节)。
对于每一个切片(包括 string
),以下状态总是成立的:
s == s[:i] + s[i:] // i是一个整数且: 0 <= i <= len(s)
len(s) <= cap(s)
切片也可以用类似数组的方式初始化:var x = []int{2, 3, 5, 7, 11}
。这样就创建了一个长度为 5 的数组并且创建了一个相关切片。
切片在内存中的组织方式实际上是一个有 3 个域的结构体:指向相关数组的指针,切片长度以及切片容量。下图给出了一个长度为 2,容量为 4 的切片 y
。
y[0] = 3
且y[1] = 5
。- 切片
y[0:4]
由 元素3
,5
,7
和11
组成。
示例 7.7 array_slices.go
package main
import "fmt"
func main() {
var arr1 [6]int
var slice1 []int = arr1[2:5] // item at index 5 not included!
// load the array with integers: 0,1,2,3,4,5
for i := 0; i < len(arr1); i++ {
arr1[i] = i
}
// print the slice
for i := 0; i < len(slice1); i++ {
fmt.Printf("Slice at %d is %d\n", i, slice1[i])
}
fmt.Printf("The length of arr1 is %d\n", len(arr1))
fmt.Printf("The length of slice1 is %d\n", len(slice1))
fmt.Printf("The capacity of slice1 is %d\n", cap(slice1))
// grow the slice
slice1 = slice1[0:4]
for i := 0; i < len(slice1); i++ {
fmt.Printf("Slice at %d is %d\n", i, slice1[i])
}
fmt.Printf("The length of slice1 is %d\n", len(slice1))
fmt.Printf("The capacity of slice1 is %d\n", cap(slice1))
// grow the slice beyond capacity
//slice1 = slice1[0:7 ] // panic: runtime error: slice bound out of range
}
输出:
Slice at 0 is 2
Slice at 1 is 3
Slice at 2 is 4
The length of arr1 is 6
The length of slice1 is 3
The capacity of slice1 is 4
Slice at 0 is 2
Slice at 1 is 3
Slice at 2 is 4
Slice at 3 is 5
The length of slice1 is 4
The capacity of slice1 is 4
如果 s2
是一个切片,你可以将 s2
向后移动一位 s2 = s2[1:]
,但是末尾没有移动。切片只能向后移动,s2 = s2[-1:]
会导致编译错误。切片不能被重新分片以获取数组的前一个元素。
注意 绝对不要用指针指向切片。切片本身已经是一个引用类型,所以它本身就是一个指针!!
问题 7.2: 给定切片 b:= []byte{'g', 'o', 'l', 'a', 'n', 'g'}
,那么 b[1:4]
、b[:2]
、b[2:]
和 b[:]
分别是什么?
7.2.2 将切片传递给函数
如果你有一个函数需要对数组做操作,你可能总是需要把参数声明为切片。当你调用该函数时,把数组分片,创建为一个切片引用并传递给该函数。这里有一个计算数组元素和的方法:
func sum(a []int) int {
s := 0
for i := 0; i < len(a); i++ {
s += a[i]
}
return s
}
func main() {
var arr = [5]int{0, 1, 2, 3, 4}
sum(arr[:])
}
7.2.3 用 make() 创建一个切片
当相关数组还没有定义时,我们可以使用 make()
函数来创建一个切片,同时创建好相关数组:var slice1 []type = make([]type, len)
。
也可以简写为 slice1 := make([]type, len)
,这里 len
是数组的长度并且也是 slice
的初始长度。
所以定义 s2 := make([]int, 10)
,那么 cap(s2) == len(s2) == 10
。
make()
接受 2 个参数:元素的类型以及切片的元素个数。
如果你想创建一个 slice1
,它不占用整个数组,而只是占用以 len
为个数个项,那么只要:slice1 := make([]type, len, cap)
。
make()
的使用方式是:func make([]T, len, cap)
,其中 cap
是可选参数。
所以下面两种方法可以生成相同的切片:
make([]int, 50, 100)
new([100]int)[0:50]
下图描述了使用 make()
方法生成的切片的内存结构:
示例 7.8 make_slice.go
package main
import "fmt"
func main() {
var slice1 []int = make([]int, 10)
// load the array/slice:
for i := 0; i < len(slice1); i++ {
slice1[i] = 5 * i
}
// print the slice:
for i := 0; i < len(slice1); i++ {
fmt.Printf("Slice at %d is %d\n", i, slice1[i])
}
fmt.Printf("\nThe length of slice1 is %d\n", len(slice1))
fmt.Printf("The capacity of slice1 is %d\n", cap(slice1))
}
输出:
Slice at 0 is 0
Slice at 1 is 5
Slice at 2 is 10
Slice at 3 is 15
Slice at 4 is 20
Slice at 5 is 25
Slice at 6 is 30
Slice at 7 is 35
Slice at 8 is 40
Slice at 9 is 45
The length of slice1 is 10
The capacity of slice1 is 10
因为字符串是纯粹不可变的字节数组,它们也可以被切分成切片。
练习 7.4: fibonacci_funcarray.go: 为练习 7.3 写一个新的版本,主函数调用一个使用序列个数作为参数的函数,该函数返回一个大小为序列个数的 Fibonacci 切片。
7.2.4 new() 和 make() 的区别
看起来二者没有什么区别,都在堆上分配内存,但是它们的行为不同,适用于不同的类型。
new(T)
为每个新的类型T
分配一片内存,初始化为0
并且返回类型为*T
的内存地址:这种方法 返回一个指向类型为T
,值为0
的地址的指针,它适用于值类型如数组和结构体(参见第 10 章);它相当于&T{}
。make(T)
返回一个类型为 T 的初始值,它只适用于 3 种内建的引用类型:切片、map
和channel
(参见第 8 章和第 13 章)。
换言之,new()
函数分配内存,make()
函数初始化;下图给出了区别:
在图 7.3 的第一幅图中:
var p *[]int = new([]int) // *p == nil; with len and cap 0
p := new([]int)
在第二幅图中, p := make([]int, 0)
,切片 已经被初始化,但是指向一个空的数组。
以上两种方式实用性都不高。下面的方法:
var v []int = make([]int, 10, 50)
或者
v := make([]int, 10, 50)
这样分配一个有 50 个 int
值的数组,并且创建了一个长度为 10,容量为 50 的切片 v
,该切片指向数组的前 10 个元素。
问题 7.3 给定 s := make([]byte, 5)
,len(s)
和 cap(s)
分别是多少?s = s[2:4]
,len(s)
和 cap(s)
又分别是多少?
问题 7.4 假设 s1 := []byte{'p', 'o', 'e', 'm'}
且 s2 := s1[2:]
,s2
的值是多少?如果我们执行 s2[1] = 't'
,s1
和 s2
现在的值又分别是多少?
译者注:如何理解 new、make、slice、map、channel 的关系
1.slice、map 以及 channel 都是 golang 内建的一种引用类型,三者在内存中存在多个组成部分, 需要对内存组成部分初始化后才能使用,而 make 就是对三者进行初始化的一种操作方式
2. new 获取的是存储指定变量内存地址的一个变量,对于变量内部结构并不会执行相应的初始化操作, 所以 slice、map、channel 需要 make 进行初始化并获取对应的内存地址,而非 new 简单的获取内存地址
7.2.5 多维切片
和数组一样,切片通常也是一维的,但是也可以由一维组合成高维。通过分片的分片(或者切片的数组),长度可以任意动态变化,所以 Go 语言的多维切片可以任意切分。而且,内层的切片必须单独分配(通过 make()
函数)。
7.2.6 bytes 包
类型 []byte
的切片十分常见,Go 语言有一个 bytes
包专门用来提供这种类型的操作方法。
bytes
包和字符串包十分类似(参见第 4.7 节)。而且它还包含一个十分有用的类型 Buffer
:
import "bytes"
type Buffer struct {
...
}
这是一个长度可变的 bytes
的 buffer,提供 Read()
和 Write()
方法,因为读写长度未知的 bytes
最好使用 buffer
。
Buffer
可以这样定义:var buffer bytes.Buffer
。
或者使用 new()
获得一个指针:var r *bytes.Buffer = new(bytes.Buffer)
。
或者通过函数:func NewBuffer(buf []byte) *Buffer
,创建一个 Buffer
对象并且用 buf
初始化好;NewBuffer
最好用在从 buf
读取的时候使用。
通过 buffer 串联字符串
类似于 Java 的 StringBuilder 类。
在下面的代码段中,我们创建一个 buffer
,通过 buffer.WriteString(s)
方法将字符串 s
追加到后面,最后再通过 buffer.String()
方法转换为 string
:
var buffer bytes.Buffer
for {
if s, ok := getNextString(); ok { //method getNextString() not shown here
buffer.WriteString(s)
} else {
break
}
}
fmt.Print(buffer.String(), "\n")
这种实现方式比使用 +=
要更节省内存和 CPU,尤其是要串联的字符串数目特别多的时候。
练习 7.5
给定切片 sl
,将一个 []byte
数组追加到 sl
后面。写一个函数 Append(slice, data []byte) []byte
,该函数在 sl
不能存储更多数据的时候自动扩容。
练习 7.6
把一个缓存 buf
分片成两个切片:第一个是前 n
个 bytes,后一个是剩余的,用一行代码实现。