[C/C++]详解STL容器2--vector的功能和模拟实现(迭代器失效,memcpy拷贝问题)

Posted TT在长大

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[C/C++]详解STL容器2--vector的功能和模拟实现(迭代器失效,memcpy拷贝问题)相关的知识,希望对你有一定的参考价值。

本文介绍了vector类的常用接口的使用,并对其进行了模拟实现,对模拟实现中涉及到的迭代器失效问题,memcpy拷贝问题进行了解析。

一、vector类

向量(Vector)是一个封装了动态大小数组的顺序容器(Sequence Container)

在C++中,vector 是一个十分有用的容器。它能够像容器一样存放各种类型的对象,简单地说,vector是一个能够存放任意类型的动态数组,能够增加和压缩数据。

就像数组vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。
vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。

二、vector类的常用接口的使用

下文中给出在实际中常用的接口及功能。

1. vector类对象的常见构造

 

(constructor)构造函数接口说明
vector()无参构造
vector(size_type n, const value_type& val = value_type())构造并初始化n个val
vector (const vector& x);拷贝构造
vector (InputIterator first, InputIterator last);使用迭代器进行初始化构造

 +

#include <iostream>
#include <vector>
int main ()
{

    std::vector<int> first; 
    std::vector<int> second (1,100); 
    std::vector<int> third (second.begin(),second.end()); 
    std::vector<int> fourth (third); 

    int myints[] = {1,2,3,4};
    std::vector<int> fifth (myints, myints + sizeof(myints) / sizeof(int) );
    for (std::vector<int>::iterator it = fifth.begin(); it != fifth.end(); ++it)
        std::cout << ' ' << *it;
    std::cout << '\\n';
    return 0;
}

2.vector iterator 的使用

iterator的使用接口说明
begin + end获取第一个数据位置的iterator/const_iterator, 获取最后一个数据的下一个位置的iterator/const_iterator
rbegin + rend获取最后一个数据位置的reverse_iterator,获取第一个数据前一个位置的reverse_iterator

 

 

void PrintVector(const vector<int>& v)
{
    // const对象使用const迭代器进行遍历打印
    vector<int>::const_iterator it = v.begin();
    while (it != v.end())
    {
        cout << *it << " ";
        ++it;
    }
    cout << endl;

    // 使用反向迭代器进行遍历再打印
    vector<int>::reverse_iterator rit = v.rbegin();
    while (rit != v.rend())
    {
        cout << *rit << " ";
        ++rit;
    }
    cout << endl;
}

3. vector 空间增长

容量空间接口说明
size获取数据个数
capacity获取容量大小
empty判断是否为空
resize改变vector的size
reserve改变vector放入capacity

capacity的代码在VS2019和g++下分别运行会发现,VS2019下capacity是按1.5倍增长的,g++是按2倍增长的。VS2019是PJ版本STL,g++是SGI版本STL。

reserve只负责开辟空间,如果确定知道需要用多少空间,reserve可以缓解vector增容的代价缺陷问题。

resize在开空间的同时还会进行初始化,影响size。

4.vector 增删查改 

vector增删查改接口说明
push_back尾插
pop_back尾删
find查找。(注意这个是算法模块实现,不是vector的成员接口)
insert在position之前插入val
erase删除position位置的数据
swap交换两个vector的数据空间
operator[]像数组一样访问

5.遍历方法

vector两种比较便捷的遍历方式是operator[] + index 和 C++ 11中vector的新式for + auto的遍历。

 

#include <iostream>
#include <vector>
using namespace std;

int main()
{

    int a[] = { 1, 2, 3, 4 };
    vector<int> v(a, a + sizeof(a) / sizeof(int));

    // 通过[]读写第0个位置。
    v[0] = 10;
    cout << v[0] << endl;

    // 通过[i]的方式遍历vector
    for (size_t i = 0; i < v.size(); ++i)
        cout << v[i] << " ";
    cout << endl;

    vector<int> swapv;
    swapv.swap(v);
    cout << "v data:";
    for (size_t i = 0; i < v.size(); ++i)
        cout << v[i] << " ";
    cout << endl;

    cout << "swapv data:";
    for (size_t i = 0; i < swapv.size(); ++i)
        cout << swapv[i] << " ";
    cout << endl;

    // C++11支持的新式范围for遍历
    for(auto x : v)
        cout<< x << " ";
    cout<<endl;

    return 0;
}

6. vector 迭代器失效问题

迭代器的失效问题:对容器的操作影响了元素的存放位置,称为迭代器失效。

迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T*。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)。

迭代器失效有两个层面的意思:无法通过迭代器++,- -操作遍历整个stl容器, 第一层失效。无法通过迭代器存取迭代器所指向的内存, 第二层失效。

对于vector可能会导致其迭代器失效的操作有:
(1) 会引起其底层空间改变的操作,都有可能是迭代器失效,比如:resize、reserve、insert、assign、push_back等。

int main()
{
    vector<int> v{1,2,3,4,5,6};
    auto it = v.begin();

    // 将有效元素个数增加到100个,多出的位置使用8填充,操作期间底层会扩容
    v.resize(100, 8);

    // reserve的作用就是改变扩容大小但不改变有效元素个数,操作期间可能会引起底层容量改变
    v.reserve(100);

    // 插入元素期间,可能会引起扩容,而导致原空间被释放
    v.insert(v.begin(), 0);
    v.push_back(8);

    // 给vector重新赋值,可能会引起底层容量改变
    v.assign(100, 8);
    return 0;
}

以上操作,都有可能会导致vector扩容,也就是说vector底层原理旧空间被释放掉,而在打印时,it还使用的是释放之间的旧空间,在对it迭代器操作时,实际操作的是一块已经被释放的空间,而引起代码运行时崩溃。

解决方式:在以上操作完成之后,如果想要继续通过迭代器操作vector中的元素,只需给it重新
赋值即可。

(2) 指定位置元素的删除操作--erase

#include <iostream>
using namespace std;
#include <vector>
int main()
{
    int a[] = { 1, 2, 3, 4 };

    vector<int> v(a, a + sizeof(a) / sizeof(int));

    // 使用find查找3所在位置的iterator
    vector<int>::iterator pos = find(v.begin(), v.end(), 3);

    // 删除pos位置的数据,导致pos迭代器失效。
    v.erase(pos);

    cout << *pos << endl; // 此处会导致非法访问
    return 0;
}

 erase删除pos位置元素后,pos位置之后的元素会往前搬移,没有导致底层空间的改变,理论上讲迭代器不应该会失效,但是:如果pos刚好是最后一个元素,删完之后pos刚好是end的位置,end位置是没有元素的,此时pos就失效了。因此删除vector中任意位置上元素时,vs就认为该位置迭代器失效了。

迭代器失效解决办法:在使用前,对迭代器重新赋值即可。

三、vector深度剖析及模拟实现

1.核心框架接口的模拟实现

 

#include <iostream>
#include <vector>
#include <string>
#include <string.h>
#include <assert.h>
#include <list>
#include <algorithm>
using namespace std;

namespace Zht
{
  template <class T>      //template<typename 数据类型参数标识符> 

  class vector 
  {
    public:
      typedef T* iterator;
      typedef const T* const_iterator;

      vector()                  //无参构造函数
        :_start(nullptr)
        ,_finsh(nullptr)
        ,_endofstorage(nullptr)
      {
      }

      vector(int n, const T& val = T())
        :_start(nullptr)
        ,_finsh(nullptr)
        ,_endofstorage(nullptr)
      {
        reserve(n);
        while(n--)
        {
            push_back(val);
        }
      }

      vector(const vector<T>& v)          //拷贝构造
        :_start(nullptr)
        ,_finsh(nullptr)
        ,_endofstorage(nullptr)
      {
        reservr(v.capacity());

        iterator it = begin();
        const_iterator vit = v.cbegin();

        while(vit != v.cend())
        {
          *it = *vit;
          it++;
          vit++;
        }
      }

      void swap(vector<T>& v)
      {
        std::swap(_start, v._start);
        std::swap(_finsh, v._finsh);
        std::swap(_endofstorage, v._endofstorage);
      }

      vector<T>& operator=(vector<T> v)
      {
        swap(v);
        
        return *this;
      }

      ~vector()         //析构函数
      {
        delete[]_start;
        _start = _finsh = _endofstorage = nullptr;
      }

      // 若使用iterator做迭代器,会导致初始化的迭代器区间[first,last)只能是vector的迭代器
      // 重新声明迭代器,迭代器区间[first,last)可以是任意容器的迭代器
      template <class InputIterator>
      vector(InputIterator first, InputIterator last)
      {
        reserve(last - first);

        while(first != last)
        {
          push_back(*first);
          ++first;
        }
      }

      iterator begin()
      {
        return _start;
      }

      iterator end()
      {
        return _finsh;
      }

      const_iterator cbegin() const
      {
        return _start;
      }

      const_iterator cend() const
      {
        return _finsh;
      }

      size_t capacity()           //空间大小
      {
        return _endofstorage - _start;
      }

      size_t size()               //数据长度
      {
        return _finsh - _start;
      }

      T& operator[](size_t i)     //运算符重载
      {
        assert(i < size());

        return _start[i]; 
      }
      
      const T& operator[](size_t i) const
      {
        assert(i < size());

        return _start[i];
      }
      void reserve(size_t n)        //要求向量容量至少足以包含 n 个元素。
      {
        if(n > capacity())
        {
            size_t sz = size();
      
            T* tmp = new T[n];      //开新空间

            if(_start)              //如果为空则说明是首次
            {
                cout << sz;
                memcpy(tmp, _start, sz * sizeof(T));
                cout<< tmp[2];
                delete[]_start;
            }

            _start = tmp;
            _finsh = _start + sz;
            _endofstorage = _start + n;
        }
      }

      void resize(size_t n, const T& val = T())
      {
        if(n <= size())     //小于当前的数据量
        {
            _finsh = _start + n;
            return;
        }

        if(n > capacity())    //扩容
        {
            reserve(n);
        }

        iterator it = begin();
        _finsh = _start + n;
        while(it != _finsh)
        {
            *it = val;
            it++;
        }
      }

      iterator insert(iterator pos, const T& x)
      {
        assert(pos <= _finsh);

        if(_finsh == _endofstorage)  //检查容量
        {
          size_t a = size();
          size_t newcapacity1 = capacity() == 0 ? 4 : capacity() * 2;
          reserve(newcapacity1);

          pos = _start + a;    //如果发生增容,则需要重置pos,因为发生增容则说明pos
        }
        
        iterator end = _finsh - 1;
        while(end >= pos)
        {
          *(end + 1) = *end;
          end--;
        }

        *pos = x;
        ++_finsh;

        return pos;
      }

      void push_back(const T& x)
      {
        if(_finsh == _endofstorage)
        {
            size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
            reserve(newcapacity);
        }

        *_finsh = x;
        _finsh++;

      }

      iterator erase(iterator pos)      //删除pos位
      {
        assert(pos <= _finsh);
        
        iterator begin = pos + 1;
        while(begin != end())
        {
            *(begin - 1) = *begin;
            begin++;
        }

        _finsh--;

        return pos;

      }

      void pop_back()       //尾删
      {
          erase(--end());
      }

    private:
      iterator _start;      //数据块开始
      iterator _finsh;      //有效尾
      iterator _endofstorage;     //空间尾

  };

  void test1()
  {
    vector<int> v;
    
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);
    //v.push_back(6);

    vector<int>::iterator it = v.begin();
    
    while(it != v.end())
    {
        cout << *it <<" ";
        it++;
    }
    cout << endl;

    for(size_t i = 0; i < v.size(); i++)
    {
        cout << v[i] << " ";
    }
    cout << endl;

    for(auto e : v)
    {
        cout << e << " ";
    }
    cout << endl;
  }
}

2.使用memcpy拷贝问题

 模拟实现的vector中的reserve接口中,如果使用memcpy进行的拷贝会发生问题。

memcpy是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中。

如果拷贝的是自定义类型的元素,memcpy即高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝

 如

int main()
{
    vector<bite::string> v;

    v.push_back("1234");
    v.push_back("5678");
    v.push_back("0000");

    return 0;
}

如果对象中涉及到资源管理时,不能使用memcpy进行对象之间的拷贝,因为memcpy是浅拷贝,否则可能会引起内存泄漏甚至程序崩溃。

以上是关于[C/C++]详解STL容器2--vector的功能和模拟实现(迭代器失效,memcpy拷贝问题)的主要内容,如果未能解决你的问题,请参考以下文章

[C/C++]详解STL容器8-mapmultimapsetmultiset的介绍和使用

[C/C++]详解STL容器8-mapmultimapsetmultiset的介绍和使用

[C/C++]详解STL容器9-基于红黑树模拟实现map和set

[C/C++]详解STL容器9-基于红黑树模拟实现map和set

[C/C++]详解STL容器9-基于红黑树模拟实现map和set

[C/C++]详解STL容器9-基于红黑树模拟实现map和set