Julia 是如何实现多方法的？

Posted 2023-03-31

技术标签:

【中文标题】Julia 是如何实现多方法的？【英文标题】：How does Julia implement multimethods? 【发布时间】：2015-11-15 15:02:42 【问题描述】：

我从http://c2.com/cgi/wiki?ImplementingMultipleDispatch读了一点

我很难找到有关 Julia 如何实现多方法的参考资料。 dispatch 的运行时复杂度是多少，它是如何实现的？

【问题讨论】：

【参考方案1】：

Dr. Bezanson's thesis 无疑是目前描述 Julia 内部结构的最佳来源：

4.3 调度系统

Julia 的调度系统与某些面向对象语言中的多方法系统非常相似 [17, 40, 110, 31, 32, 33]。然而，我们更喜欢术语基于类型的调度，因为我们的系统实际上是通过调度单个元组类型的参数来工作的。这种差异是微妙的，在许多情况下并不明显，但具有重要的概念含义。这意味着方法不一定限于为每个参数“槽”指定类型。例如，方法签名可以是 UnionTupleAny,Int, TupleInt,Any，它匹配两个参数中的一个（但不一定都是）是 Int 的调用。²

本节继续描述类型和方法缓存、按特异性排序、参数分派和歧义。请注意，元组类型是协变的（与所有其他 Julian 类型不同）以匹配方法分派的协变行为。

这里最大的关键是方法定义是按特异性排序的，所以它只是线性搜索来检查参数元组的类型是否是签名的子类型。所以这只是 O(n)，对吧？问题是检查具有完全通用性的子类型（包括 Unions 和 TypeVars 等）很难。非常难，事实上。比 NP-complete 更糟糕的是，估计为 Π^P₂（参见polynomial hierarchy）——也就是说，即使 P=NP，这个问题仍然需要非-多项式时间！它甚至可能是 PSPACE 或更糟。

当然，它实际工作原理的最佳来源是JuliaLang/julia/src/gf.c 中的实现（gf = 通用函数）。那里有一个rather useful comment：

方法缓存分为三个部分：一个用于签名，其中第一个参数是单例类型 (TypeFoo)，由正常情况下第一个参数类型的 UID，以及回退其他所有内容的表。

所以关于方法查找复杂性的问题的答案是：“这取决于。”第一次使用一组新的参数类型调用方法时，它必须通过线性搜索，寻找子类型匹配。如果它找到一个，它将专门用于特定参数的该方法并将其放入其中一个缓存中。这意味着在开始进行硬子类型搜索之前，Julia 可以对已经看到的方法执行快速相等性检查……并且由于缓存基于第一个参数存储为哈希表，因此需要检查的方法数量进一步减少。

但是，实际上，您的问题是关于调度的运行时复杂性。在这种情况下，答案通常是“什么调度？”——因为它已经完全消除了！ Julia 将 LLVM 用作几乎提前的编译器，其中方法根据需要按需编译。在高性能 Julia 代码中，类型应该在编译时具体推断，因此调度也可以在编译时执行。这完全消除了运行时调度开销，甚至可能将找到的方法直接内联到调用者的主体（如果它很小）中，以消除所有函数调用开销并允许下游进一步优化。如果没有具体推断出类型，那么还有其他性能缺陷，而且我没有分析过通常在调度中花费了多少时间。有一些方法可以进一步优化这种情况，但可能首先要炸得更大……而且现在通常最简单的方法是首先使热循环类型稳定。

【讨论】：

我们可以更新一下吗？ @mschauer：据我所知，这里唯一改变的是方法缓存的特定实现以及在进行完整（仍然是线性）搜索之前可用的快速路径的数量。基本概念保持不变：尽量不在方法表中进行完整的子类型搜索，尤其是在运行时。

以上是关于Julia 是如何实现多方法的？的主要内容，如果未能解决你的问题，请参考以下文章

如何获取 Julia 对象的字段

Julia中的内核PCA实现

最好的Julia语言

如何检查给定的“方法”对象是不是接受 Julia 0.6 中给定的类型的“元组”？

AdaBoost对实际数据分类的Julia实现

Julia集的JS画布实现