GO切片

Posted 一曲长歌一剑天涯

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了GO切片相关的知识,希望对你有一定的参考价值。

参考资料:
Go 语言切片(Slice)
GO编程模式:切片,接口,时间和性能
Go 切片绕坑指南

Go 语言切片是对数组的抽象。

Go 数组的长度不可改变,在特定场景中这样的集合就不太适用,Go 中提供了一种灵活,功能强悍的内置类型切片("动态数组"),与数组相比切片的长度是不固定的,可以追加元素,在追加时可能使切片的容量增大。

空(nil)切片
一个切片在未初始化之前默认为 nil,长度为 0,实例如下:

package main

import "fmt"

func main() {
   var numbers []int

   printSlice(numbers)

   if(numbers == nil){
      fmt.Printf("切片是空的")
   }
}

func printSlice(x []int){
   fmt.Printf("len=%d cap=%d slice=%v\\n",len(x),cap(x),x) // s= []  s.len= 0  s.cap= 0
}

切片截取
case1:foo和bar的内存是共享的,所以,foo和bar的对数组内容的修改都会影响到对方。

import (
    "bytes"
    "testing"
)

func TestSlice1(t *testing.T) {
    foo := make([]int, 5) // 首先先创建一个foo的slice,其中的长度和容量都是5
    foo[3] = 42           // 然后开始对foo所指向的数组中的索引为3和4的元素进行赋值
    foo[4] = 100
    t.Log("foo=", foo) // foo= [0 0 0 42 100]
    bar := foo[1:4]
    bar[1] = 99
    // foo和bar的内存是共享的,所以,foo和bar的对数组内容的修改都会影响到对方。
    t.Log("foo=", foo) // foo= [0 0 99 42 100]
    t.Log("bar=", bar) // bar= [0 99 42]
}

case2: 数据操作 append() 的示例
append()这个函数在 cap不够用的时候就会重新分配内存以扩大容量,而如果够用的时候不不会重新分享内存!

func TestSlice2(t *testing.T) {
    a := make([]int, 5)
    t.Log("a=", a, " a.len=", len(a), " a.cap=", cap(a)) // a= [0 0 0 0 0]  a.len= 5  a.cap= 5
    b := a[1:3]                                          //此时,a 和 b 的内存空间是共享的
    t.Log("b=", b, " b.len=", len(b), " b.cap=", cap(b)) // b= [0 0]  b.len= 2  b.cap= 4
    a = append(a, 1)                                     //这个操作会让 a 重新分享内存,导致 a 和 b 不再共享
    //b = append(b, 1)                 // 由于b的cap为4,空间够用,因此不需要重新分配内容,此时与a还是共享内存
    t.Log("a=", a, " a.len=", len(a), " a.cap=", cap(a)) // a= [0 0 0 0 0 1]  a.len= 6  a.cap= 10
    t.Log("b=", b, " b.len=", len(b), " b.cap=", cap(b)) // b= [0 0]  b.len= 2  b.cap= 4
    a[2] = 42
    t.Log("a=", a, " a.len=", len(a), " a.cap=", cap(a)) // a= [0 0 42 0 0 1]  a.len= 6  a.cap= 10
    t.Log("b=", b, " b.len=", len(b), " b.cap=", cap(b)) // b= [0 0]  b.len= 2  b.cap= 4
}

case3: dir1 和 dir2 共享内存
虽然 dir1 有一个 append() 操作,但是因为 cap 足够,于是数据扩展到了dir2 的空间。

func TestSlice3(t *testing.T) {
    path := []byte("AAAAxBBBBBBBBB")
    t.Log("path =>", string(path), " path.len=", len(path), " path.cap=", cap(path)) //path => AAAAxBBBBBBBBB  path.len= 14  path.cap= 14
    sepIndex := bytes.IndexByte(path, \'x\')
    dir1 := path[:sepIndex]
    dir2 := path[sepIndex+1:]
    t.Log("......................................................")
    t.Log("dir1 =>", string(dir1), " dir1.len=", len(dir1), " dir1.cap=", cap(dir1)) //prints: dir1 => AAAA dir1.len= 4  dir1.cap= 14
    t.Log("dir2 =>", string(dir2), " dir2.len=", len(dir2), " dir2.cap=", cap(dir2)) //prints: dir2 => BBBBBBBBB dir2.len= 9  dir2.cap= 9

    t.Log("......................................................")
    dir1 = append(dir1, "suffix"...)
    t.Log("dir1 =>", string(dir1), " dir1.len=", len(dir1), " dir1.cap=", cap(dir1)) //prints: dir1 => AAAAsuffix dir1.len= 10  dir1.cap= 14
    t.Log("dir2 =>", string(dir2), " dir2.len=", len(dir2), " dir2.cap=", cap(dir2)) //prints: dir2 => uffixBBBB  dir2.len= 9  dir2.cap= 9

}

case4: 如果要解决这个问题,我们只需要修改一行代码。

func TestSlice4(t *testing.T) {
    pathz := []byte("AAAAxBBBBBBBBB")
    sepIndex := bytes.IndexByte(pathz, \'x\')
    dirz1 := pathz[:sepIndex:sepIndex] //新的代码使用了 Full Slice Expression,其最后一个参数叫“Limited Capacity”,于是,后续的 append() 操作将会导致重新分配内存。
    dirz2 := pathz[sepIndex+1:]
    t.Log("dirz1 =>", string(dirz1), " dir1.len=", len(dirz1), " dir1.cap=", cap(dirz1)) //dirz1 => AAAA  dir1.len= 4  dir1.cap= 4
    t.Log("dirz2 =>", string(dirz2), " dir2.len=", len(dirz2), " dir2.cap=", cap(dirz2)) //dirz2 => BBBBBBBBB  dir2.len= 9  dir2.cap= 9
    t.Log("......................................................")
    dirz2[0] = \'o\'
    t.Log("dirz1 =>", string(dirz1), " dir1.len=", len(dirz1), " dir1.cap=", cap(dirz1)) //dirz1 => AAAA  dir1.len= 4  dir1.cap= 4
    t.Log("dirz2 =>", string(dirz2), " dir2.len=", len(dirz2), " dir2.cap=", cap(dirz2)) //dirz2 => oBBBBBBBB  dir2.len= 9  dir2.cap= 9

    t.Log("......................................................")
    dirz1 = append(dirz1, "suffix"...)
    t.Log("dirz1 =>", string(dirz1), " dir1.len=", len(dirz1), " dir1.cap=", cap(dirz1)) //dirz1 => AAAAsuffix  dir1.len= 10  dir1.cap= 16
    t.Log("dirz2 =>", string(dirz2), " dir2.len=", len(dirz2), " dir2.cap=", cap(dirz2)) //dirz2 => oBBBBBBBB  dir2.len= 9  dir2.cap= 9
}

坑1
下面的代码中虽然通过值传递了s,为什么在函数调用后在外部仍能看到s的变化?
大家都知道切片是指向底层数组的指针,切片本身不存储任何数据。这意味着即使在这里按值传递切片,函数中的切片仍指向相同的内存地址。所以在reverse()内部使用的切片是一个不同的指针对象,但仍将指向相同的内存地址,共享相同的数组。所以在函数调用之后,该数组中的数字重新排列,函数外部的切片与内部的切片共享着相同的底层数组,所以外部的 s 表现出来的就是它也被排序了。

func TestReverse(t *testing.T) {
    var s []int
    for i := 1; i <= 3; i++ {
        s = append(s, i)
    }
    reverse(s)
    t.Log("s=", s) // s= [3 2 1]
} 

func reverse(s []int) {
    for i, j := 0, len(s)-1; i < j; i++ {
        j = len(s) - (i + 1)
        s[i], s[j] = s[j], s[i]
    }
}

坑2:在reverse()函数内稍微更改一下代码,在函数里添加单个append调用。它如何改变我们的输出?
当我们调用append时,将创建一个新切片。新切片具有新的“长度”属性,该属性不是指针,但仍指向同一数组。因此,我们函数内的代码最终会反转原始切片所引用的数组,但是原始切片的长度属性还是之前的长度值,这就是造成了上面 1被丢掉的原因。

func TestReverse(t *testing.T) {
    var s []int //  s= []  s.len= 0  s.cap= 0,cap数为0,1,2,4,8...
    for i := 1; i <= 3; i++ {
        s = append(s, i)
    }
    reverse(s)
    t.Log("s=", s) //s= [999 3 2]
}

func reverse(s []int) {
    fmt.Println("s=", s, " s.len=", len(s), " s.cap=", cap(s))
    // s= [1 2 3]  s.len= 3  s.cap= 4
    
    s = append(s, 4)
    for i, j := 0, len(s)-1; i < j; i++ {
        j = len(s) - (i + 1)
        s[i], s[j] = s[j], s[i]
    }
    
    fmt.Println("s内=", s, " s内.len=", len(s), " s内.cap=", cap(s))
    // s内= [999 3 2 1]  s内.len= 4  s内.cap= 4
}

坑3:超过容量后,不共享内存
以下测验中,不仅切片长度没有保留,而且切片的顺序也不受影响。为什么?
如前所述,当我们调用append时,会创建一个新的切片。在第二个测验中,此新切片仍指向同一底层数组,因为它具有足够的容量来添加新元素,因此该数组没有更改,但是在此示例中,我们添加了2个元素,而我们的切片没有足够的容量。于是 系统分配了一个新数组,让切片指向该数组。当我们最终在reverse函数内开始反转切片中的元素时,它不再影响我们的初始数组,而是在完全不同的数组上运行。

func TestReverse(t *testing.T) {
    var s []int
    t.Log("s=", s, " s.len=", len(s), " s.cap=", cap(s))
    for i := 1; i <= 3; i++ {
        s = append(s, i)
        t.Log("s=", s, " s.len=", len(s), " s.cap=", cap(s))
    }
    reverse(s)
    t.Log("s=", s) // s= [1 2 3]
}

func reverse(s []int) {
    fmt.Println("s=", s, " s.len=", len(s), " s.cap=", cap(s))
    // s= [1 2 3]  s.len= 3  s.cap= 4
    s = append(s, 4, 5)
    for i, j := 0, len(s)-1; i < j; i++ {
        j = len(s) - (i + 1)
        s[i], s[j] = s[j], s[i]
    }
    fmt.Println("s内=", s, " s内.len=", len(s), " s内.cap=", cap(s))
    // s内= [5 4 3 2 1]  s内.len= 5  s内.cap= 8
}

结论:
只要不超出切片的容量,我们最终就会在main()函数中看到reverse函数对切片进行的更改。我们仍然看不到长度的变化,但是我们将看到切片的底层数组中元素的重新排列。

如果在将切片填充到容量长度后,在s上再调用append(),我们将不会再在main()函数中看到这些更改,因为我们的reverse 函数中的代码将一个新切片指向到了一个完全不同的数组。

从切片或数组派生的切片也会受到影响
如果我们恰巧在代码中创建了从现有切片或数组派生的新切片,那么我们也可以看到相同的效果。例如,如果您调用s2:= s [:]然后将s2传递到我们的reverse()函数中,则可能最终仍会影响s,因为s2和s都指向同一个支持数组。同样,如果我们向s2附加新元素,最终导致其超出支持数组,我们将不再看到对一个切片的更改会影响另一个切片。

严格来说,这不是一件坏事。通过在绝对需要之前不随意复制基础数组,我们最终获得了效率更高的代码,但编写代码时需要考虑到这一点,所以想确保在函数外也能看到函数内程序对切片的更改,那么在函数中一定要把新切片 return 给外部,即使切片是一种引用类型。这也是不要其他编程语言经验带入到 Go上的原因。

以上是关于GO切片的主要内容,如果未能解决你的问题,请参考以下文章

Go语言切片

Go切片实现

从零开始学Go之容器:切片

《Go题库·1》Golang里的数组和切片有了解过吗?

Go 语言泛型编程之切片

Go笔记:切片