STL源码剖析

Posted joker-wz

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了STL源码剖析相关的知识,希望对你有一定的参考价值。

SLT简介

STL(Standard Template Library),即标准模板库,是一个高效的C++程序库。包含了诸多在计算机科学领域里常用的基本数据结构和基本算法。为广大C++程序员们提供了一个可扩展的应用框架,高度体现了软件的可复用性。其核心思想就是泛化编程(generic programming),在这种思想里,大部分基本算法被抽象,被泛化,独立于与之对应的数据结构,用于以相同或相近的方式处理各种不同情形。

STL组件

STL中包含了6大组件

  • 容器(Containers):包含各种基础的数据结构,如vector, list, deque, set, map等。
  • 分配器(Allocators):负责空间配置与管理。
  • 算法(Algorithms):各种常用的算法,如sort, search, copy, erase等等。
  • 迭代器(Iterators):负责连接Containers与Algorithms。
  • 适配器(Adapters):可以用来修饰Containers,Iterators和Functors接口的组件。
  • 函数式(Functors):类似于函数,可以作为Algorithms的一种策略。

六大组件的关系

技术分享图片
Containers 通过 Allocators 取得数据存储空间,Algorithms 通过 Iterators 存取 Containers 内容,Functors 可以协助 Algorithms 完成不同的策略变,Adapters 可以修饰或套接Containers,Iterators和Functors。

容器

结构与分类

容器总体上分为三大类:

  • Sequence Containers(序列容器): Arrary(大小固定,无法自动扩充), Vector(只可向后扩充, 两倍的扩展), Deque(可向前或向后扩充, 分段连续, stack和queue都是基于此 ), List(双向链表), Forwaed-List(单向链表)
  • Associative Containers(关联容器):Set/Multiset, Map/Multimap(基本都用红黑树来实现)
  • Unordered Containers(无序容器): Unordered Set/Multiset, Unorder ed Map/Multimap(基本都是 HashTable Separate Chaining 实现)

技术分享图片

Array

是一种固定大小的容器类型,在定义的时候就要声明大小和类型。Array其实就是对C语言中数组的一种扩充升级,使其支持了迭代器的操作,便于STL算法的使用。array在使用和性能上都要强于内置数组,对于一些固定大小的使用场景,可以用array来替代原先数组的工作。

TR1版本源码如下:

template<typename _Tp, std::size_t _Nm>
  struct array
  {
    typedef _Tp value_type;
    typedef _Tp* pointer;
    typedef balue_type* iterator;

    value_type _M_instance[_Nm ? _Nm : 1];

    iterator begin()
    { return iterator(&_M_instance[0]);}

    iterator end()
    { return iteratoe(&_M_instance[_Nm]);}

    ...
  }

Vector

Vector 使用起来和一个数组十分相似,但是在空间用完时,可以自动扩充自己的空间。一般而言空间的扩充,无法在原地完成扩充。所以会在内存中新申请一片内存(通常都是之前空间大小的2倍大),然后通过拷贝将原有数据拷贝到新的地址空间。

Vector中存在三个指针来表明Vector:

  • T* start:指向第一个元素的地址
  • T* finish:指向目前最后一个地址之后的一个空间的地址
  • T* end_of_storage:指向当前Vector的最后一个空间地址

需要注意的是:在空间(两倍)增长的过程中涉及到了大量的拷贝构造和析构!

List

相较于vector的连续线性空间,List就显得复杂许多,它的好处是每次插入或删除一个元素,就配置或释放一个元素空间。因此,list对于空间的运用有绝对的精准,一点也不浪费。而且,对于任何位置的元素插入或元素移除,List永远是常数时间。

List不仅是一个双向链表,而且还是一个环状双向链表。 另外,还有一个重要性质,插入操作和接合操作都不会造成原有的List迭代器失效,这在Vector是不成立的。因为Vector的插入操作可能造成空间的重新配置,导致原有的迭代器全部失效。甚至List的元素删除操作(erase),也只有“指向被删除元素”的那个迭代器失效,其他迭代器不受任何影响。

Forward-List

Forward-List容器与List容器的主要设计区别是List保持内部唯一的一个链接到下一个元素,而后者则保持每个元素的两个链接:一个指向下一个元素和一个前一个。允许高效在两个方向迭代,但每个元素的消耗额外的存储空间,并轻微较高的时间开销插入和删除元素的迭代。Forward-List对象,从而比List对象更有效率,虽然他们只能向前遍历。

所以Forward-List的一个最大的缺点就是无法直接访问指定位置上元素,每次一的访问都需要从头开始访问,这样的操作需要线型的时间。

Deque

技术分享图片

可以向两端扩充,通过指针连接不同分段的空间,模拟出连续空间。

template <class T, class Alloc=alloc, size_t BufSiz=0>
class deque{
public:
    typedef T value_type;
    typedef __deque_iterator<T,T&,T*,BufSiz> iterator;
protected:
    typedef pointer* map_pointer;//T**
protected:
    iterator start;
    iterator finish;
    map_pointer map;
    size_type map_size;
public:
    iterator begin(){return start;}
    iterator end(){return finish;}
    size_type size(){return finish-start;}
...
}

template <class T, class Ref, class Ptr, size_t BufSiz>
  struct __deque_iterator{
    typedef random_access_iterator_tag iterator_category;
    typedef T value_type;
    typedef Ptr pointer;
    typedef Ref reference;
    typedef size_t size_type;
    typedef ptrdiff_t difference_type;
    typedef T** map_pointer;
    typedef __deque_iterator self;

    T* cur;
    T* first;
    T* last;
    map_pointer node;
    ...
}

start指向第一块分区,finishi指向最后一块分区,map是用来存放各个分区的地址(vector实现),map_size是map的大小。
start和finish作为iterator,cur指向当前的元素,first指向第一个存放的元素,last指向当前分区中最后一个存放的数据之后的位置,node指回map。

deque 如何模拟连续空间?

基本全部依靠deque iterators完成

reference operator*() const
{
    return *cur;
}

pointer operator->() const
{
   return &(operator*());
}

difference_type operator-(const self& x) const
{
    return difference_type(buff_size()) * (node - x.node - 1) + (cur - first) + (x.last - x.cur);
}

self& operator++(){
    ++cur;
    if(cur == last){
        set_node(node + 1);
        cur = first;
    }
    return *this;
}

self operator++(int){
    self tmp = *this;
    ++*this;
    return tmp;
}

self& operator--(){
    if(cur == first){
        set_node(node - 1);
        cur = last;
    }
    --cur;
    return *this;
}

self operator--(int){
    self tmp = *this;
    --*this;
    return tmp;
}

void set_node(map_pointer new_node){
    node = new_node;
    first = *new_node;
    last = first + difference_type(buffer_size());
}

self& operator+=(difference_type n){
    difference_type offset = n + (cur - first);
    if(offset >= 0 && offset < difference_type(buffer_size())){
        cur += n;
    }
    else{
        difference_type node_offset = offset > 0 ? offset / difference_type(buffer_size()) : -difference_type((-offset - 1) / buffer_size()) - 1;
        set_node(node + node_offset);
        cur = first + (offset - node_offset * difference_type(buffer_size()));
    }
    return * this;
}

self operator+(difference_type n) const {
    self tmp = *thisl
    return tmp +=n;
}

self& operator-=(fifference_type n)
{
    return *this += -n;
}

self operator-(difference_type n) const
{
    self tmp = * this;
    return tmp -= n;
}

reference operator[](difference_type n) const
{
    return *(*this + n);
}


以上是关于STL源码剖析的主要内容,如果未能解决你的问题,请参考以下文章

STL 源码剖析笔记之仿函数

STL源码剖析(中文完整版)pdf

STL源码剖析之组件

STL源码剖析简体中文完整版(高清晰扫描带目录)PDF下载

STL源码剖析

STL源码剖析——iterators与trait编程#4 iterator源码