GO切片

Posted 2021-09-13 一曲长歌一剑天涯

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了GO切片相关的知识，希望对你有一定的参考价值。

参考资料：
Go 语言切片(Slice)
GO编程模式：切片，接口，时间和性能
Go 切片绕坑指南

Go 语言切片是对数组的抽象。

Go 数组的长度不可改变，在特定场景中这样的集合就不太适用，Go 中提供了一种灵活，功能强悍的内置类型切片("动态数组")，与数组相比切片的长度是不固定的，可以追加元素，在追加时可能使切片的容量增大。

空(nil)切片
一个切片在未初始化之前默认为 nil，长度为 0，实例如下：

package main

import "fmt"

func main() {
   var numbers []int

   printSlice(numbers)

   if(numbers == nil){
      fmt.Printf("切片是空的")
   }
}

func printSlice(x []int){
   fmt.Printf("len=%d cap=%d slice=%v\\n",len(x),cap(x),x) // s= []  s.len= 0  s.cap= 0
}

切片截取
case1:foo和bar的内存是共享的，所以，foo和bar的对数组内容的修改都会影响到对方。

import (
    "bytes"
    "testing"
)

func TestSlice1(t *testing.T) {
    foo := make([]int, 5) // 首先先创建一个foo的slice，其中的长度和容量都是5
    foo[3] = 42           // 然后开始对foo所指向的数组中的索引为3和4的元素进行赋值
    foo[4] = 100
    t.Log("foo=", foo) // foo= [0 0 0 42 100]
    bar := foo[1:4]
    bar[1] = 99
    // foo和bar的内存是共享的，所以，foo和bar的对数组内容的修改都会影响到对方。
    t.Log("foo=", foo) // foo= [0 0 99 42 100]
    t.Log("bar=", bar) // bar= [0 99 42]
}

case2: 数据操作 append() 的示例
append()这个函数在 cap不够用的时候就会重新分配内存以扩大容量，而如果够用的时候不不会重新分享内存！

func TestSlice2(t *testing.T) {
    a := make([]int, 5)
    t.Log("a=", a, " a.len=", len(a), " a.cap=", cap(a)) // a= [0 0 0 0 0]  a.len= 5  a.cap= 5
    b := a[1:3]                                          //此时，a 和 b 的内存空间是共享的
    t.Log("b=", b, " b.len=", len(b), " b.cap=", cap(b)) // b= [0 0]  b.len= 2  b.cap= 4
    a = append(a, 1)                                     //这个操作会让 a 重新分享内存，导致 a 和 b 不再共享
    //b = append(b, 1)                 // 由于b的cap为4，空间够用，因此不需要重新分配内容，此时与a还是共享内存
    t.Log("a=", a, " a.len=", len(a), " a.cap=", cap(a)) // a= [0 0 0 0 0 1]  a.len= 6  a.cap= 10
    t.Log("b=", b, " b.len=", len(b), " b.cap=", cap(b)) // b= [0 0]  b.len= 2  b.cap= 4
    a[2] = 42
    t.Log("a=", a, " a.len=", len(a), " a.cap=", cap(a)) // a= [0 0 42 0 0 1]  a.len= 6  a.cap= 10
    t.Log("b=", b, " b.len=", len(b), " b.cap=", cap(b)) // b= [0 0]  b.len= 2  b.cap= 4
}

case3: dir1 和 dir2 共享内存
虽然 dir1 有一个 append() 操作，但是因为 cap 足够，于是数据扩展到了dir2 的空间。

func TestSlice3(t *testing.T) {
    path := []byte("AAAAxBBBBBBBBB")
    t.Log("path =>", string(path), " path.len=", len(path), " path.cap=", cap(path)) //path => AAAAxBBBBBBBBB  path.len= 14  path.cap= 14
    sepIndex := bytes.IndexByte(path, \'x\')
    dir1 := path[:sepIndex]
    dir2 := path[sepIndex+1:]
    t.Log("......................................................")
    t.Log("dir1 =>", string(dir1), " dir1.len=", len(dir1), " dir1.cap=", cap(dir1)) //prints: dir1 => AAAA dir1.len= 4  dir1.cap= 14
    t.Log("dir2 =>", string(dir2), " dir2.len=", len(dir2), " dir2.cap=", cap(dir2)) //prints: dir2 => BBBBBBBBB dir2.len= 9  dir2.cap= 9

    t.Log("......................................................")
    dir1 = append(dir1, "suffix"...)
    t.Log("dir1 =>", string(dir1), " dir1.len=", len(dir1), " dir1.cap=", cap(dir1)) //prints: dir1 => AAAAsuffix dir1.len= 10  dir1.cap= 14
    t.Log("dir2 =>", string(dir2), " dir2.len=", len(dir2), " dir2.cap=", cap(dir2)) //prints: dir2 => uffixBBBB  dir2.len= 9  dir2.cap= 9

}

case4: 如果要解决这个问题，我们只需要修改一行代码。

func TestSlice4(t *testing.T) {
    pathz := []byte("AAAAxBBBBBBBBB")
    sepIndex := bytes.IndexByte(pathz, \'x\')
    dirz1 := pathz[:sepIndex:sepIndex] //新的代码使用了 Full Slice Expression，其最后一个参数叫“Limited Capacity”，于是，后续的 append() 操作将会导致重新分配内存。
    dirz2 := pathz[sepIndex+1:]
    t.Log("dirz1 =>", string(dirz1), " dir1.len=", len(dirz1), " dir1.cap=", cap(dirz1)) //dirz1 => AAAA  dir1.len= 4  dir1.cap= 4
    t.Log("dirz2 =>", string(dirz2), " dir2.len=", len(dirz2), " dir2.cap=", cap(dirz2)) //dirz2 => BBBBBBBBB  dir2.len= 9  dir2.cap= 9
    t.Log("......................................................")
    dirz2[0] = \'o\'
    t.Log("dirz1 =>", string(dirz1), " dir1.len=", len(dirz1), " dir1.cap=", cap(dirz1)) //dirz1 => AAAA  dir1.len= 4  dir1.cap= 4
    t.Log("dirz2 =>", string(dirz2), " dir2.len=", len(dirz2), " dir2.cap=", cap(dirz2)) //dirz2 => oBBBBBBBB  dir2.len= 9  dir2.cap= 9

    t.Log("......................................................")
    dirz1 = append(dirz1, "suffix"...)
    t.Log("dirz1 =>", string(dirz1), " dir1.len=", len(dirz1), " dir1.cap=", cap(dirz1)) //dirz1 => AAAAsuffix  dir1.len= 10  dir1.cap= 16
    t.Log("dirz2 =>", string(dirz2), " dir2.len=", len(dirz2), " dir2.cap=", cap(dirz2)) //dirz2 => oBBBBBBBB  dir2.len= 9  dir2.cap= 9
}

坑1
下面的代码中虽然通过值传递了s，为什么在函数调用后在外部仍能看到s的变化？
大家都知道切片是指向底层数组的指针，切片本身不存储任何数据。这意味着即使在这里按值传递切片，函数中的切片仍指向相同的内存地址。所以在reverse()内部使用的切片是一个不同的指针对象，但仍将指向相同的内存地址，共享相同的数组。所以在函数调用之后，该数组中的数字重新排列，函数外部的切片与内部的切片共享着相同的底层数组，所以外部的 s 表现出来的就是它也被排序了。

func TestReverse(t *testing.T) {
    var s []int
    for i := 1; i <= 3; i++ {
        s = append(s, i)
    }
    reverse(s)
    t.Log("s=", s) // s= [3 2 1]
} 

func reverse(s []int) {
    for i, j := 0, len(s)-1; i < j; i++ {
        j = len(s) - (i + 1)
        s[i], s[j] = s[j], s[i]
    }
}

坑2：在reverse（）函数内稍微更改一下代码，在函数里添加单个append调用。它如何改变我们的输出？
当我们调用append时，将创建一个新切片。新切片具有新的“长度”属性，该属性不是指针，但仍指向同一数组。因此，我们函数内的代码最终会反转原始切片所引用的数组，但是原始切片的长度属性还是之前的长度值，这就是造成了上面 1被丢掉的原因。

func TestReverse(t *testing.T) {
    var s []int //  s= []  s.len= 0  s.cap= 0,cap数为0,1,2,4,8...
    for i := 1; i <= 3; i++ {
        s = append(s, i)
    }
    reverse(s)
    t.Log("s=", s) //s= [999 3 2]
}

func reverse(s []int) {
    fmt.Println("s=", s, " s.len=", len(s), " s.cap=", cap(s))
    // s= [1 2 3]  s.len= 3  s.cap= 4
    
    s = append(s, 4)
    for i, j := 0, len(s)-1; i < j; i++ {
        j = len(s) - (i + 1)
        s[i], s[j] = s[j], s[i]
    }
    
    fmt.Println("s内=", s, " s内.len=", len(s), " s内.cap=", cap(s))
    // s内= [999 3 2 1]  s内.len= 4  s内.cap= 4
}

坑3：超过容量后，不共享内存
以下测验中，不仅切片长度没有保留，而且切片的顺序也不受影响。为什么？
如前所述，当我们调用append时，会创建一个新的切片。在第二个测验中，此新切片仍指向同一底层数组，因为它具有足够的容量来添加新元素，因此该数组没有更改，但是在此示例中，我们添加了2个元素，而我们的切片没有足够的容量。于是系统分配了一个新数组，让切片指向该数组。当我们最终在reverse函数内开始反转切片中的元素时，它不再影响我们的初始数组，而是在完全不同的数组上运行。

func TestReverse(t *testing.T) {
    var s []int
    t.Log("s=", s, " s.len=", len(s), " s.cap=", cap(s))
    for i := 1; i <= 3; i++ {
        s = append(s, i)
        t.Log("s=", s, " s.len=", len(s), " s.cap=", cap(s))
    }
    reverse(s)
    t.Log("s=", s) // s= [1 2 3]
}

func reverse(s []int) {
    fmt.Println("s=", s, " s.len=", len(s), " s.cap=", cap(s))
    // s= [1 2 3]  s.len= 3  s.cap= 4
    s = append(s, 4, 5)
    for i, j := 0, len(s)-1; i < j; i++ {
        j = len(s) - (i + 1)
        s[i], s[j] = s[j], s[i]
    }
    fmt.Println("s内=", s, " s内.len=", len(s), " s内.cap=", cap(s))
    // s内= [5 4 3 2 1]  s内.len= 5  s内.cap= 8
}

结论：
只要不超出切片的容量，我们最终就会在main（）函数中看到reverse函数对切片进行的更改。我们仍然看不到长度的变化，但是我们将看到切片的底层数组中元素的重新排列。

如果在将切片填充到容量长度后，在s上再调用append（），我们将不会再在main（）函数中看到这些更改，因为我们的reverse 函数中的代码将一个新切片指向到了一个完全不同的数组。

从切片或数组派生的切片也会受到影响
如果我们恰巧在代码中创建了从现有切片或数组派生的新切片，那么我们也可以看到相同的效果。例如，如果您调用s2：= s [：]然后将s2传递到我们的reverse（）函数中，则可能最终仍会影响s，因为s2和s都指向同一个支持数组。同样，如果我们向s2附加新元素，最终导致其超出支持数组，我们将不再看到对一个切片的更改会影响另一个切片。

严格来说，这不是一件坏事。通过在绝对需要之前不随意复制基础数组，我们最终获得了效率更高的代码，但编写代码时需要考虑到这一点，所以想确保在函数外也能看到函数内程序对切片的更改，那么在函数中一定要把新切片 return 给外部，即使切片是一种引用类型。这也是不要其他编程语言经验带入到 Go上的原因。

以上是关于GO切片的主要内容，如果未能解决你的问题，请参考以下文章