C++11的std::function源码解析

Posted 彼 方

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C++11的std::function源码解析相关的知识,希望对你有一定的参考价值。

1、源码准备

本文是基于gcc-4.9.0的源代码进行分析,std::function是C++11才加入标准的,所以低版本的gcc源码是没有std::function的,建议选择4.9.0或更新的版本去学习,不同版本的gcc源码差异应该不小,但是原理和设计思想的一样的。
源码下载地址:http://ftp.gnu.org/gnu/gcc

2、std::function简介

类模版std::function是一种通用的多态函数包装器。std::function的实例可以对任何可以调用的目标实体进行存储、复制、和调用操作,这些目标实体包括普通函数指针、类成员函数指针(第一个参数需要传入对应的this指针)、Lambda表达式或者某个类的实例(前提是这个类重载了()运算符)。std::function对象是对C++中现有的可调用实体的一种类型安全的包裹(我们知道像函数指针这类可调用实体,是类型不安全的)。
通常std::function是一个函数对象类,它包装其它任意的可调用实体,被包装的对象具有类型为T1,…,TN的N个参数,并且返回一个可转换到R类型的值。std::function使用模板转换构造函数接收被包装的函数对象;特别是,闭包类型可以隐式地转换为std::function。最简单的理解就是通过std::function对C++中各种可调用实体的封装,形成一个新的可调用的std::function对象,让我们不再纠结那么多的可调用实体之间如何进行方便高效的转换。

3、源码解析

3.1、std::function解析

std::function位于libstdc++-v3\\include\\std\\functional

template<typename _Res, typename... _ArgTypes>
class function<_Res(_ArgTypes...)> : public _Maybe_unary_or_binary_function<_Res, _ArgTypes...>, private _Function_base
{
    typedef _Res _Signature_type(_ArgTypes...);

    template<typename _Functor>
    using _Invoke = decltype(__callable_functor(std::declval<_Functor&>())(std::declval<_ArgTypes>()...) );

    template<typename _Functor>
    using _Callable = __check_func_return_type<_Invoke<_Functor>, _Res>;

    template<typename _Cond, typename _Tp>
    using _Requires = typename enable_if<_Cond::value, _Tp>::type;

public:
    typedef _Res result_type;

    function() noexcept
        :_Function_base()
    {
    }

    function(nullptr_t) noexcept
        :_Function_base()
    {
    }

    template<typename _Res, typename... _ArgTypes>
    function(const function& __x)
        :_Function_base()
    {
        if (static_cast<bool>(__x))
        {
            _M_invoker = __x._M_invoker;
            _M_manager = __x._M_manager;
            __x._M_manager(_M_functor, __x._M_functor, __clone_functor);
        }
    }

    function(function&& __x)
        :_Function_base()
    { __x.swap(*this); }

    template<typename _Functor, typename = _Requires<_Callable<_Functor>, void>>
    function(_Functor __f)
    {
        typedef _Function_handler<_Signature_type, _Functor> _My_handler;

        if (_My_handler::_M_not_empty_function(__f))
        {
            _My_handler::_M_init_functor(_M_functor, std::move(__f));
            _M_invoker = &_My_handler::_M_invoke;
            _M_manager = &_My_handler::_M_manager;
        }
    }

    function& operator=(const function& __x)
    {
        function(__x).swap(*this);
        return *this;
    }

    function& operator=(function&& __x)
    {
        function(std::move(__x)).swap(*this);
        return *this;
    }

    function& operator=(nullptr_t)
    {
        if (_M_manager)
        {
            _M_manager(_M_functor, _M_functor, __destroy_functor);
            _M_manager = 0;
            _M_invoker = 0;
        }
        return *this;
    }

    template<typename _Functor>
    _Requires<_Callable<_Functor>, function&> operator=(_Functor&& __f)
    {
        function(std::forward<_Functor>(__f)).swap(*this);
        return *this;
    }

    template<typename _Functor>
    function& operator=(reference_wrapper<_Functor> __f) noexcept
    {
        function(__f).swap(*this);
        return *this;
    }

    void swap(function& __x)
    {
        std::swap(_M_functor, __x._M_functor);
        std::swap(_M_manager, __x._M_manager);
        std::swap(_M_invoker, __x._M_invoker);
    }

     explicit operator bool() const noexcept
     { return !_M_empty(); }

    _Res operator()(_ArgTypes... __args) const;
    {
        if (_M_empty())
            __throw_bad_function_call();
        return _M_invoker(_M_functor, std::forward<_ArgTypes>(__args)...);
    }

private:
    typedef _Res (*_Invoker_type)(const _Any_data&, _ArgTypes...);
    _Invoker_type _M_invoker;

从源代码中可以看出以下几点信息:

  1. 该类是一个可变参模板类
  2. 该类继承于_Maybe_unary_or_binary_function(不分析)和_Function_base,类成员只有_M_invoker一个,从定义可以看出这是一个标准的函数指针
  3. 首先分析operator()方法,平时开发中std::function使用最多的肯定就是重载的括号运算符了,毕竟最终也是要把它当成类似于函数的形式来调用的。可以看到operator()函数里面调用了_M_invoker函数,并没有什么特殊的处理
  4. 既然_M_invoker能被调用,那就说明它肯定被初始化过了,从调用时传给他的参数来看,多了一个不知道是什么的参数_M_functor,所以我们可以猜测_M_invoker并不是直接指向std::function接管的可调用实体的,而是一个类似中间层的东西,在_M_invoker的实现里面才调用了我们需要执行的那个真实的可调用实体
  5. 只有构造函数function(_Functor __f)_M_invoker进行了初始化,而使用的就是std::_Function_handler里的方法来初始化_M_invoker的,std::_Function_handler的实现在后面会讲到
  6. 还是看构造函数function(_Functor __f),因为std::function的目的就是对我们传入的可调用实体进行包装,这里说的可调用实体可以是普通函数指针、类成员函数指针(第一个参数需要传入对应的this指针)、Lambda表达式以及某个类实例(前提是这个类重载了()运算符),而我们看到在std::function这个类里面并没有直接托管我们传入的可调用实体,而只是调用了_My_handler::_M_init_functor(_M_functor, std::move(__f)),推测是由_Function_base来托管可调用实体的

3.2、std::_Function_handler解析

std::_Function_handler位于libstdc++-v3\\include\\std\\functional

template<typename _Res, typename _Functor, typename... _ArgTypes>
class _Function_handler<_Res(_ArgTypes...), _Functor> : public _Function_base::_Base_manager<_Functor>
{
    typedef _Function_base::_Base_manager<_Functor> _Base;

public:
    static _Res _M_invoke(const _Any_data& __functor, _ArgTypes... __args)
    {
        return (*_Base::_M_get_pointer(__functor))(std::forward<_ArgTypes>(__args)...);
    }
};

template<typename _Functor, typename... _ArgTypes>
class _Function_handler<void(_ArgTypes...), _Functor> : public _Function_base::_Base_manager<_Functor>
{
    typedef _Function_base::_Base_manager<_Functor> _Base;

public:
    static void _M_invoke(const _Any_data& __functor, _ArgTypes... __args)
    {
        (*_Base::_M_get_pointer(__functor))(std::forward<_ArgTypes>(__args)...);
    }
};

template<typename _Res, typename _Functor, typename... _ArgTypes>
class _Function_handler<_Res(_ArgTypes...), reference_wrapper<_Functor> > : public _Function_base::_Ref_manager<_Functor>
{
    typedef _Function_base::_Ref_manager<_Functor> _Base;

public:
    static _Res _M_invoke(const _Any_data& __functor, _ArgTypes... __args)
    {
        return __callable_functor(**_Base::_M_get_pointer(__functor))(std::forward<_ArgTypes>(__args)...);
    }
};

template<typename _Functor, typename... _ArgTypes>
class _Function_handler<void(_ArgTypes...), reference_wrapper<_Functor> > : public _Function_base::_Ref_manager<_Functor>
{
    typedef _Function_base::_Ref_manager<_Functor> _Base;

public:
    static void _M_invoke(const _Any_data& __functor, _ArgTypes... __args)
    {
        __callable_functor(**_Base::_M_get_pointer(__functor))(std::forward<_ArgTypes>(__args)...);
    }
};

template<typename _Class, typename _Member, typename _Res, typename... _ArgTypes>
class _Function_handler<_Res(_ArgTypes...), _Member _Class::*> : public _Function_handler<void(_ArgTypes...), _Member _Class::*>
{
    typedef _Function_handler<void(_ArgTypes...), _Member _Class::*> _Base;

public:
    static _Res _M_invoke(const _Any_data& __functor, _ArgTypes... __args)
    {
        return std::mem_fn(_Base::_M_get_pointer(__functor)->__value)(std::forward<_ArgTypes>(__args)...);
    }
};

template<typename _Class, typename _Member, typename... _ArgTypes>
class _Function_handler<void(_ArgTypes...), _Member _Class::*> : public _Function_base::_Base_manager<_Simple_type_wrapper< _Member _Class::* > >
{
    typedef _Member _Class::* _Functor;
    typedef _Simple_type_wrapper<_Functor> _Wrapper;
    typedef _Function_base::_Base_manager<_Wrapper> _Base;

public:
    static bool _M_manager(_Any_data& __dest, const _Any_data& __source, _Manager_operation __op)
    {
        switch (__op)
        {
            #ifdef __GXX_RTTI
            case __get_type_info:
                __dest._M_access<const type_info*>() = &typeid(_Functor);
                break;
            #endif

            case __get_functor_ptr:
                __dest._M_access<_Functor*>() = &_Base::_M_get_pointer(__source)->__value;
                break;

            default:
                _Base::_M_manager(__dest, __source, __op);
        }
        return false;
    }

    static void _M_invoke(const _Any_data& __functor, _ArgTypes... __args)
    {
        std::mem_fn(_Base::_M_get_pointer(__functor)->__value)(std::forward<_ArgTypes>(__args)...);
    }
};

从源代码中可以看出_Function_handler有六种重载形式,以下对其进行分类说明:

  1. 第一个和第二个重载形式继承于std::_Function_base::_Base_manager,当std::function接管的可调用实体是一个普通函数指针、类实例或者Lambda表达式时,发挥作用的就是这两个类。里面的内容很简单,通过调用_Function_base::_Base_manager<_Functor>_M_get_pointer方法从__functor中取出对应的可调用实体,然后直接执行,我们知道能直接执行的可调用实体的类型是普通函数指针、类实例(必须重载了()运算符)或者Lambda表达式(Lambda其实本质就是一个匿名的类实例)。这两个重载形式的唯一区别就是它们一个处理函数有返回值的情况,另一个处理没返回值的情况。
  2. 第三个和第四个重载形式继承于std::_Function_base::_Ref_manager,可以看出它们基本上算是前两个类的偏特化版本,当第二个模板参数为std::reference_wrapper包装的引用时,就调用这两个偏特化的版本。这两个重载形式的唯一区别也是它们一个处理函数有返回值的情况,另一个处理没返回值的情况。现在问题来了,为什么要搞一个对于std::reference_wrapper类型的偏特化版本呢?这是因为如果可调用实体已经先被std::reference_wrapper包装过的话,那我们是绝对绝对不能直接调用这个可调用实体的,因为此时根本不确定这个被包装的可调用实体究竟是什么类型的,如果是类成员函数的话那当然是不能直接调用的,此时必须使用std::mem_fn来获取一个可调用的对象,类中使用的std::__callable_functor函数的实现如下面的代码所示,可以看到有好几种特化版本,当std::reference_wrapper包装的可调用实体是一个类成员函数指针时,就会通过std::mem_fn来获取一个可调用的对象,这和前面描述的内容一致。
template<typename _Functor>
inline _Functor& __callable_functor(_Functor& __f)
{ return __f; }

template<typename _Member, typename _Class>
inline _Mem_fn<_Member _Class::*> __callable_functor(_Member _Class::* &__p)
{ return std::mem_fn(__p); }

template<typename _Member, typename _Class>
inline _Mem_fn<_Member _Class::*> __callable_functor(_Member _Class::* const &__p)
{ return std::mem_fn(__p); }

template<typename _Member, typename _Class>
inline _Mem_fn<_Member _Class::*> __callable_functor(_Member _Class::* volatile &__p)
{ return std::mem_fn(__p); }

template<typename _Member, typename _Class>
inline _Mem_fn<_Member _Class::*> __callable_functor(_Member _Class::* const volatile &__p)
{ return std::mem_fn(__p); }

关于上面提到的std::reference_wrapperstd::mem_fn,大家如果可以不懂的话一定要看下面两篇文章,不然的话就像学英语不会英语单词一样,根本不可能看懂std::function的内容的

  1. 第五个和第六个重载形式和前面的差不多,这两个也是属于偏特化版本,主要是用于处理可调用实体为类成员函数指针的情况,这里就可以看到直接调用了std::men_fn函数来使得我们可以直接调用对应的类成员函数,从这点也可以看出std::men_fn函数的重要性,不懂的小伙伴一定要去看前面两篇文章啊。
  2. 每一个类里面的_M_invoke函数都用了_M_get_pointer(来源不全部相同),从代码逻辑上不难看出_M_get_pointer函数的作用是从第一个传入参数__functor中取出对应的可调用实体,然后将后面的可变参传给这个可调用实体,运行它,这个功能是不是就有点似曾相识了?对,这就是我们平时正常调用函数的那样子嘛,也就是说std::function的函数执行功能在这里实现了
  3. 从代码中我们可以看出这几个类都是和std::_Function_base相关的,并且到现在还是不知道_M_functor究竟是个什么东西,接下来分析std::_Function_base,看一下里面究竟做了哪些工作

3.3、_Any_data解析

_Any_data位于libstdc++-v3\\include\\std\\functional

union _Nocopy_types
{
    void*       _M_object;
    const void* _M_const_object;
    void (*_M_function_pointer)();
    void (_Undefined_class::*_M_member_pointer)();
};

union _Any_data
{
    void*       _M_access()       { return &_M_pod_data[0]; }
    const void* _M_access() const { return &_M_pod_data[0]; }

    template<typename _Tp>
    _Tp& _M_access()
    { return *static_cast<_Tp*>(_M_access()); }

    template<typename _Tp>
    const _Tp& _M_access() const
    { return *static_cast<const _Tp*>(_M_access()); }

    _Nocopy_types _M_unused;
    char _M_pod_data[sizeof(_Nocopy_types)];
};

std::_Function_base之前先看一个重要的联合体_Any_data,这个在前面出现很多次了,但是一直没有介绍一下它究竟

以上是关于C++11的std::function源码解析的主要内容,如果未能解决你的问题,请参考以下文章

C++11 std::function用法(c++常问问题十七)

C++11 Lambda 函数隐式转换为 bool 与 std::function

C++11 可变参数 std::function 参数

C++11之用std::function和std::bind实现观察者模式

C++11:std::function<void()> func;

C++11 std::bind std::function 高级使用方法