《STL 源码剖析》学习笔记之容器list

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《STL 源码剖析》学习笔记之容器list相关的知识,希望对你有一定的参考价值。


《STL

[图]The orange 2019-08-06


1、list 概述


相较于 vector 的连续线性空间,list 就显得复杂许多,它的好处是每次安插或删除一个元素,就配置或释放一个元素空间。因此,list 对于空间的运用有绝对的精准,一点也不浪费。而且,对于任何位置的元素安插或元素移除,list 永远是常数时间。


list 和 vector 是两个最常被使用的容器。什么时机下最适合使用哪一种容器,必须视元素的多寡、元素的构造复杂度、元素存取行为的特性而定。


list  结构定义


《STL


SGI list 不仅是一个双向串行,而且还是一个环状双向串行。所以它只需要一个指标,便可以完整表现整个串行:


《STL


安插一个元素之后的 list 状态如图 4-6。注意,安插完成后,新节点将位于标兵迭代器(标示出安插点)所指之节点的前方—这是 STL 对于「安插动作」的标准规范。


由于 list 不像 vector那样有可能在空间不足时做重新配置、数据搬移的动作,所以安插前的所有迭代器在安插动作之后都仍然有效。


《STL



2、几点注解


list 内部提供一个所谓的迁移动作(transfer):将某连续范围的元素迁移到某个特定位置之前。技术上很简单,节点间的指标移动而已。这个动作为其它的复杂动作如 splice, sort, merge 等奠定良好的基础。


1、node 是一个指针,SGI list 是一种双向环状链表,除了绿色的数据域本身之外,还要附带两个指针,一个往前指,一个往后指,也就是前驱指针和后继指针。


2、前驱和后继指针分别是 void_pointer 类型,看源码知道,void_pointer 是 void* 类型。原因?可见在程序后面操作要去转化类型。


3、list 的迭代器如何使用?链表是一种非连续的结构,所以迭代器不能是一种指针,但是我们还是要让迭代器要模拟指针的功能,也就是说,迭代器要足够聪明的知道,当用户要访问下一个元素的时候,迭代器要能够通过当前指向的位置的指针的 next 域,定位到正确访问的下一个位置,进去看 next 指针。


4、除了 array,vector 之外,所有的容器的迭代器必须是一种 class ,是一种智能指针,它才能设计出聪明的动作。


5、所有的容器必须要有一个 typedef xxx<T,T&,T> iterator 代表一种 class。有三个模板参数。


6、指针可能会被使用者进行怎样的操作呢?++,–,&,等等。


7、重载运算符 ++ 

operator++() node = (link_type)((node).next); return this;

调整迭代器的指向,使得指向当前结点的next结点


8、重载运算符 --也是一样

self& operator–() node = (link_type)((node).prev);return this;


9、这里的两个返回值,一个返回 reference 一个不是,是为了模拟整数的这两种操作,在 C++ 中,两次前置++可以运行,但不允许两次后置++。


10、node 结点的取值操作,为什么这里要用.data 而不是直接用 -> ,这里有个原因在于为了让编译器区分后面的重载-> 运算符


11、所有容器遵循的设计原则是 前闭后开原则,在 list 里面,要把最后一个元素的下一个元素设置为不属于容器本身。因此,list 的设计刻意在环状尾端加一个空白结点。


12、在 G2.9 版 中 sizeof(list) = 4而在 G4.9 版 sizeof(list) = 8;


3、源码剖析


还记得之前的手写 LRU 吗?


我们知道,STL 中的 list 就是一种双向链表,我们在定义一个 cachesMap ,key 保存键,value 保存前面的 list 中指向双向链表实现的 LRU 的 Node 节点,也就是说 cachesMap 里面 每一个 value 对应的是一个双向链表的结点,那么具体访问的时候,利用迭代器就可以了,非常的方便。


//用容器实现双向链表+哈希表 
//Author:herongwei
class LRUCache
public:
LRUCache(int capacity):cap(capacity)
/*
1、判断插入的新元素是否出现过,
2、如果之前出现过,在双向链表中删除
3、如果之前没有出现,插入到双向链表最前面,更新哈希表
4、最后判断容量是否够,如果不够,先删除双向链表最不常用的,更新哈希表
*/
void put(int key, int value)
auto it = m.find(key);
if(it != m.end()) cache.erase(it->second);
cache.push_front(make_pair(key,value));
m[key]=cache.begin();
if(m.size()>cap)
int k = cache.rbegin()->first;
cache.pop_back();
m.erase(k);


/*
1、我们在哈希表中查找给定的 key,若不存在直接返回-1。
2、如果存在则将此项移到顶部,这里我们使用C++ STL中的函数splice,专门移动链表中的一个或若干个结点到某个特定的位置,这里我们就只移动key对应的迭代器到列表的开头,然后返回value。
*/
int get(int key)
auto it = m.find(key);
if(it != m.end())
cache.splice(cache.begin(), cache,it->second);
return it->second->second;

return -1;

private:
int cap;
list<pair<int,int>>cache;
unordered_map<int,list<pair<int,int>>::iterator >m;
;


LRU 的 Node 节点,也就是说 cachesMap 里面 每一个 value 对应的是一个双向链表的结点,那么具体访问的时候,利用迭代器就可以了,非常的方便。


这里,爱思考的同学们,看到上面的 splice 函数,不禁会思考,这个函数到底是如何实现的呢?本真刨根问底的精神,我们去探究一波 list 的源码吧。


先来看一张图片


《STL


没错了,上面的图示就是 splice 函数的实现过程,而在 list 里面,具体调用的则是 另外一个函数  transfer,下面是 transfer 的源码:


protected:
// 将 [first,last) 内的所有元素搬移到 position 之前。
void transfer(iterator position, iterator first, iterator last)

if (position != last)

(*(link_type((*last.node).prev))).next = position.node; //1
(*(link_type((*first.node).prev))).next = last.node; //2
(*(link_type((*position.node).prev))).next = first.node;//3
link_type tmp = link_type((*position.node).prev); //4
(*position.node).prev = (*last.node).prev; //5
(*last.node).prev = (*first.node).prev; //6
(*first.node).prev = tmp; //7


可以看到


第一步是调整 last 结点前一个结点的 next 指针;这样才能在调整 tmp 结点的 next 指针之后,将 first position 结点保存下来。


第二步是调整 first 结点的前一个结点的 next 指针;这样才能在调整 first 结点的 prev 指针之后,将 last 结点保存下来。


实际上,transfer 并非是一种公开的接口。list 公开提供的是所谓的接合动作(splice):将某连续范围的元素从一个 list 搬移到另一个(或同一个)list 的某个定点。


在来看一张比较形象的图片就大概知道了这个过程是怎么一回事了。


《STL


下面附上部分 list 源码。


//下面是一个测试程序,观察重点在建构的方式以及大小的变化:
// filename : 4list-test.cpp
#include <list>
#include <iostream>
#include <algorithm>
using namespace std;
int main()

int i;
list<int> ilist;
cout << "size=" << ilist.size() << endl; // size=0
ilist.push_back(0);
ilist.push_back(1);
ilist.push_back(2);
ilist.push_back(3);
ilist.push_back(4);
cout << "size=" << ilist.size() << endl; // size=5
list<int>::iterator ite;
for(ite = ilist.begin(); ite != ilist.end(); ++ite)
cout << *ite << ; // 0 1 2 3 4
cout << endl;
ite =find(ilist.begin(), ilist.end(), 3);
if (ite!=0)
ilist.insert(ite, 99);
cout << "size=" << ilist.size() << endl; // size=6
cout << *ite << endl; // 3
for(ite = ilist.begin(); ite != ilist.end(); ++ite)
cout << *ite << ; // 0 1 2 99 3 4
cout << endl;
ite =find(ilist.begin(), ilist.end(), 1);
if (ite!=0)
cout << *(ilist.erase(ite)) << endl; // 2
for(ite = ilist.begin(); ite != ilist.end(); ++ite)
cout << *ite << ; // 0 2 99 3 4
cout << endl;
return 0;


// 对迭代器累加 1,就是前进一个节点
self& operator++()
node = (link_type)((*node).next);
return *this;

// 对迭代器递减 1,就是后退一个节点
self& operator--()
node = (link_type)((*node).prev);
return *this;

// 安插一个节点,做为头节点
void push_front(const T& x)

insert(begin(), x);

// 安插一个节点,做为尾节点(上一小节才介绍过)
void push_back(const T& x)

insert(end(), x);

// 移除迭代器 position 所指节点
// 先记录前驱和后继结点,在调整指向
iterator erase(iterator position)

link_type next_node = link_type(position.node->next);
link_type prev_node = link_type(position.node->prev);
prev_node->next = next_node;
next_node->prev = prev_node;
destroy_node(position.node);
return iterator(next_node);

// 移除头节点
void pop_front()

erase(begin());

// 移除尾节点
void pop_back()

iterator tmp = end();
erase(--tmp);

//清除所有节点(整个串行)
template <class T, class Alloc>
void list<T, Alloc>::clear()

link_type cur = (link_type) node->next; // begin()
while (cur != node) //巡访每一个节点

link_type tmp = cur;
cur = (link_type) cur->next;

destroy_node(tmp); //摧毁(解构并释放)一个节点
// 恢复 node 原始状态
node->next = node;
node->prev = node;



//将数值为 value之所有元素移除
template <class T, class Alloc>
void list<T, Alloc>::remove(const T& value)

iterator first = begin();
iterator last = end();
while (first != last) //巡访每一个节点

iterator next = first;
++next;
if (*first == value)
erase(first); //找到就移除
first = next;




//移除数值相同的连续元素。注意,只有「连续而相同的元素」,才会被移除剩一个。
template <class T, class Alloc>
void list<T, Alloc>::unique()

iterator first = begin();
iterator last = end();
if (first == last)
return;//空串行,什么都不必做。
iterator next = first;
while (++next != last)

if (*first == *next)
erase(next);
else
first = next;//调整指标
next = first;//修正区段范围



参考资料:《STL源码剖析》(侯捷著)。





《STL


以上是关于《STL 源码剖析》学习笔记之容器list的主要内容,如果未能解决你的问题,请参考以下文章

stl源码剖析-序列式容器 之 list

STL源码剖析 学习笔记

STL源码剖析之组件

STL 源码剖析读书笔记四:序列式容器之 dequestackqueue

STL源码剖析——序列式容器#2 List

STL学习笔记--4序列式容器之list