C++初阶第十篇——vector(vector常见接口的用法与介绍+vector的模拟实现)
Posted 呆呆兽学编程
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C++初阶第十篇——vector(vector常见接口的用法与介绍+vector的模拟实现)相关的知识,希望对你有一定的参考价值。
⭐️这是年前的最后一篇博客,今天我先为大家介绍STL中的vector容器,我会先介绍它的一些个常见接口以及用法,然后再模拟实现它,这样我们就能够比较深入地了解这个容器。
⭐️博客代码已上传至gitee:https://gitee.com/byte-binxin/cpp-class-code
目录
🌏vector的介绍
vector的本质其实是一个顺序表的结构,也可以说是数组存储,与顺序表的结构很相似,vector的接口更为完善,值得我们学习。
简单地说:
- vector是表示可变大小数组的序列容器。
- vector和数组一样是连续存储数据的,可以随机存取数据,时间复杂度都是O(1)。
- vector插入数据要考虑增容的问题,增容就是重新分配一块更大的空间,然后将全部元素移到新的数组。这个操作就时间而言,是一个代价较高的任务,因为扩容是要付出代价的。
- vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
- vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
🌏vector中常见接口的介绍
🌲vector的构造和析构函数
- 无参构造函数: vector()
- 有参构造函数: vector(size_type n, const value_type& val = value_type())用n个val构造并初始化容器
- 拷贝构造: vector(const vector& x)
- 使用迭代器初始化: vector (InputIterator first, InputIterator last);
实例演示:
void TestVector()
vector<int> v1;// 无参构造
vector<int> v2(4, 100);// 有参构造
vector<int> v3(v2); // 拷贝构造
vector<int> v4(v3.begin(), v3.end());// 使用迭代器进行初始化
🌲vector的三种遍历方式
其实和string类很相似
- for+operator[]访问遍历
- 迭代器
- 范围for
实例演示:
void TestVector1()
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
// 三种遍历方式
// 1.通过[]的方式遍历
for (size_t i = 0; i < v.size(); ++i)
cout << v[i] << " ";
cout << endl;
// 2.迭代器方式遍历
// 和string类一样,有四种迭代器
// iterator const_iterator reverse_iterator const_reverse_iterator
vector<int>::iterator it = v.begin();
while (it != v.end())
cout << *it << " ";
++it;
cout << endl;
vector<int>::reverse_iterator rit = v.rbegin();
while (rit != v.rend())
cout << *rit << " ";
++rit;
cout << endl;
// 3.范围for 会被编译器替换成迭代器的方式遍历
for (auto e : v)
cout << e << " ";
cout << endl;
代码运行结果如下:
迭代器的介绍
vector中迭代器可以分为四种,(正向或反向)+(普通或const)组合起来就有四种
如下:
- begin + end: 获取第一个数据位置的iterator/const_iterator, 获取最后一个数据的下一个位置
的iterator/const_iterator - rbegin + rend: 获取最后一个数据位置的reverse_iterator,获取第一个数据前一个位置的
reverse_iterator
🌲vector的增删查改
- push_back 尾插
- pop_back 尾删
- find vector中没有这个函数,调用的是算法中的接口
实例演示:
void TestVector5()
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
for (auto e : v1)
cout << e << " ";
cout << endl;
v.pop_back();
v.pop_back();
for (auto e : v)
cout << e << " ";
cout << endl;
vector<int>::iterator pos = find(v.begin(), v.end(), 3);
if (pos != v.end())
cout << *pos << endl;
代码运行结果如下:
- insert 在pos位置之前插入一个元素
- erase 删除pos位置的一个元素
- operator[] 重载[]运算符,可以想数组一样访问
实例演示:
void TestVector7()
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
for (auto e : v)
cout << e << " ";
cout << endl;
v.insert(v.begin(), 0);
for (auto e : v)
cout << e << " ";
cout << endl;
v.erase(v.end() - 1);
for (auto e : v)
cout << e << " ";
cout << endl;
代码运行结果如下:
🌲vector容器的容量变化和大小增减
- size 返回容器中有效元素的个数
- capacity 返回容器的容量大小
- empty 判断容器是否为空
- resize 改变vector的size,要考虑增大size时是否要扩容,还有扩大size后补什么元素,如果给了就补给了的,没给就补缺省值
- reserve 改变vector中的capacity
实例演示1:
void TestVector4()
vector<int> v1(4, 100);
//v1.resize(10); 多余处默认补0
//v1.resize(10, 5); 多余处给5
v1.resize(3);
for (auto e : v1)
cout << e << " ";
cout << endl;
cout << v1.size() << endl;
cout << v1.capacity() << endl;
代码运行结果如下:
实例演示2:
void TestVector8()
size_t sz;
vector<int> v;
sz = v.capacity();
cout << "making foo grow:\\n";
for (int i = 0; i < 100; ++i)
v.push_back(i);
if (sz != v.capacity())
sz = v.capacity();
std::cout << "capacity changed: " << sz << '\\n';
代码运行结果如下:
实例演示3 我们把上面的代码中容器用reserve提前预留好空间,看会发生什么
void TestVector8()
size_t sz;
vector<int> v;
v.reserve(100);
sz = v.capacity();
cout << "making foo grow:\\n";
for (int i = 0; i < 100; ++i)
v.push_back(i);
if (sz != v.capacity())
sz = v.capacity();
std::cout << "capacity changed: " << sz << '\\n';
代码运行结果如下:
总结: 容易看出,在vs2019平台下,vector每次增容是以1.5倍的方式增长的,增长倍数一般是1.5倍或者2倍,过大过小都不好,过大会导致空间浪费,过小会导致频繁扩容,也会有很大的开销,所以1.5倍或者2倍是比较好的选择,当然,我们在知道接下来要用到容量的大小时,可以提前预留好空间,可以避免频繁扩容带来的开销。
🌏vector迭代器失效问题
迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T*。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)
看一下两种情况:
- push_back
实例演示
void TestVector6()
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
vector<int>::iterator it = v.begin();
v.push_back(6);
v.push_back(7); // 迭代器失效,底层就是一个指针,尾插如数据是,因为扩容会导致空间会发生变化,指针指向的旧空间会被销毁,所以迭代器失效
while (it != v.end())
cout << *it << " ";
++it;
cout << endl;
代码运行结果如下:
扩容导致空间发生了变化,但是指针的指向没有改变,如果我们此时再去访问就相当于野指针的解引用了,编译器会报错。所以要及时更新迭代器的值就好了。
- erase
实例演示1
void TestVector6()
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
vector<int>::iterator it = v.begin();
while (it != v.end())
if (*it % 2 == 0)
v.erase(it);// 迭代器失效,因为删除会导致后面的数据往前挪动,此时迭代器会错过一个数据,编译器检测就会报错
++it;
for (auto e : v)
cout << e << " ";
cout << endl;
代码运行结果如下:
程序崩了,删除会导致后面的数据往前挪动,理论上不会失效,但是编译器检测就会报错,这里的失效是指迭代器的位置不对了。
实例演示2 下面是堆上面的代码进行了修改
void TestVector6()
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
vector<int>::iterator it = v.begin();
while (it != v.end())
if (*it % 2 == 0)
it = v.erase(it);// 给迭代器重新赋值
else
++it;
for (auto e : v)
cout << e << " ";
cout << endl;
代码运行结果如下:
这样就没有报错了。
总结: 使用迭代器前记得对迭代器赋值,可以避免迭代器失效的问题产生。
🌏vector的模拟实现
🍯vector的小框架
template<class T>
class vector
public:
private:
iterator _start;// 起始位置的指针
iterator _finish;// _start+size
iterator _endofstorage;// _start+capacity
;
🍯构造函数和析构函数
- 这里我们实现一个无参的默认构造函数,对三个成员进行初始化操作
vector()
:_start(nullptr)
,_finish(nullptr)
,_endofstorage(nullptr)
- 踢狗一个析构函数,对空间和资源都进行清理
~vector()
delete[] _start;
_start = _finish = _endofstorage = nullptr;
🍯迭代器和operator[]的实现
我们首先要定义迭代器的类型,在vector中,迭代器其实就是一个原生指针T*。所以我们这样定义:
typedef T* iterator;
typedef const T* const_iterator;
下面是STL中vector的源码定义:
- 普通迭代器:begin(),end()
iterator begin()
return _start;
iterator end()
return _finish;
- const迭代器:begin(),end()
const_iterator begin() const
return _start;
const_iterator end() const
return _finish;
- operator[]
T& operator[](size_t i) const
assert(i < size());
return _start[i];
🍯vector的增删查改的实现
- reserve 预留空间,要考虑增容问题(拷贝数据不用memcpy,因为memcpy进行的是浅拷贝,对自定义类型处理会有问题,后面还会详细介绍)
void reserve(size_t n)
int sz = size();
if (n > capacity())
T* tmp = new T[n];
if (_start)
//memcpy(tmp, _start, sizeof(T) * sz);// 浅拷贝,对于自定义类型会出错,string类
// 赋值 对于string类就是赋值重载,也是深拷贝
for (size_t i = 0; i < size(); ++i)
tmp[i] = _start[i];
delete[] _start;
_start = tmp;
_finish = _start + sz;
_endofstorage = _start + n;
- push_back 尾插要考虑增容,增容都可以复用reserve函数
void push_back(T x)
if (_finish == _endofstorage)
size_t newcapacity = capacity() == 0 ? 2 : 2 * capacity();
reserve(newcapacity);
*_finish = x;
++_finish;
- 尾删 注意要加一个assert(_finish > _start);,确保不删空
void pop_back()
assert(_finish > _start);
--_finish;
- insert 在pos位置插入一个·元素
void insert(iterator pos, const T& x)
assert(pos <= end());
if (_finish == _endofstorage)
// 算出原先差距,以免迭代器失效带来的一些问题
int gap = end() - pos;
size_t newcapacity = capacity() == 0 ? 2 : 2 * capacity();
reserve(newcapacity);
pos = end() + gap;
iterator end = _finish;
while (pos < end)
*end = *(end - 1);
--end;
*pos = x;
++_finish;
这里push_back还可以复用insert的代码,所以insert的新写法如下:
void push_back(T x)
insert(_finish, x);
- erase 删除pos位置的元素
iterator erase(iterator pos)
assert(pos < _finish&& pos >= _start);
iterator start =以上是关于C++初阶第十篇——vector(vector常见接口的用法与介绍+vector的模拟实现)的主要内容,如果未能解决你的问题,请参考以下文章
C++初阶第十二篇—stack和queue(stack和queue的常见接口的用法与介绍+priority_queue+容器适配器+仿函数+模拟实现)
C++初阶第十三篇—模板进阶(非类型模板参数+模板特化+模板的分离编译)
第十篇:顺序容器vector,deque,list的选用规则