决策树和规则引擎 (Drools)
Posted
技术标签:
【中文标题】决策树和规则引擎 (Drools)【英文标题】:Decision trees and rule engines (Drools) 【发布时间】:2011-06-20 17:20:33 【问题描述】:在我现在正在处理的应用程序中,我需要定期检查数以万计的对象是否符合某种服务的要求。决策图本身采用以下形式,略大:
在每个末端节点(圆圈)中,我需要运行一个操作(更改对象的字段、日志信息等)。我尝试使用 Drool Expert 框架,但在这种情况下,我需要为图中通向终端节点的每条路径编写一个长规则。 Drools Flow 似乎也不是为这样的用例而构建的——我取一个对象,然后,根据沿途的决定,我最终到达一个末端节点;然后再次为另一个对象。或者是吗?您能给我一些此类解决方案的示例/链接吗?
更新:
Drools Flow 调用可能如下所示:
// load up the knowledge base
KnowledgeBase kbase = readKnowledgeBase();
StatefulKnowledgeSession ksession = kbase.newStatefulKnowledgeSession();
Map<String, Object> params = new HashMap<String, Object>();
for(int i = 0; i < 10000; i++)
Application app = somehowGetAppById(i);
// insert app into working memory
FactHandle appHandle = ksession.insert(app);
// app variable for action nodes
params.put("app", app);
// start a new process instance
ProcessInstance instance = ksession.startProcess("com.sample.ruleflow", params);
while(true)
if(instance.getState() == instance.STATE_COMPLETED)
break;
// remove object from working memory
ksession.retract(appHandle);
也就是说:我会获取一个 Application 对象,为它启动一个新进程,当进程完成时(最终的操作节点会以某种方式修改应用程序),我会从工作内存中删除该对象并重复一个新的 App 对象的过程。您如何看待这个解决方案?
解决方案:
我最终使用了 Drools Flow,它工作得很好。我的决策过程并不像 Drools Expert 所要求的那样简单,并且取决于决策树中的哪个过程需要从数据库中加载对象列表、转换它们、做出决策、记录所有内容等。我使用 Process 对象它作为参数传递给进程并存储我的所有全局变量(用于进程)和一些在树中不同点重复的便捷方法(因为在Script Task
节点中编写 Java 代码本身不是很方便)。我最终还使用 Java 来做出决定(而不是 mvel
或规则)——它更快,我会说更容易控制。我使用的所有对象都作为参数传递,并在代码中用作普通 Java 变量。
【问题讨论】:
【参考方案1】:我有一个类似的问题,并使用 Neo4J 节点数据库作为一个简单且非常灵活的规则引擎。 您可以将它与 REST 服务接口一起使用,因此它独立于主应用程序。 您还可以有一个单独的应用程序来配置规则(甚至由最终用户)。
【讨论】:
【参考方案2】:Drools 专家绝对是必经之路。
如果您想避免在更高的节点上重复自己,那么诀窍是使用insertLogical
(或者如果您处于无状态会话中,则只需使用insert
)并了解规则可以触发规则(它不是你父亲的 SQL 查询)。例如:
// we just insert Customer objects in the WM
rule "evaluateRetired"
when
$c : Customer(age > 65)
then
insertLogical(new Retiree($c));
end
rule "evaluteRetireeIsFemale"
when
$r : Retiree(customer.gender == Gender.FEMALE, $c : customer)
then
...
end
如果决策图经常更改(并且您希望非程序员编辑它),请查看关于决策表(和DSL)的文档。在这种情况下,您可能会为每个规则重复整个路径,但在大多数情况下这实际上是可以的。
【讨论】:
此外,随着决策树的增长,您可能会发现一些终端节点共享操作(例如,所有退休人员都需要获得养老金,与他们的性别无关)并且重新声明它是低效的每个端节点的操作。 Drools Flow 怎么样?我可以使用它对决策树进行建模,然后我可以将一个对象放入工作内存,启动进程并让它决定取哪个结束节点,然后取出对象,放入另一个对象,再次启动它等等?这不是更清晰的解决方案吗? Drools Flow 没有意义。并不是说它不起作用,但是由于您正在做出决定,因此使用规则引擎实现的决策表感觉更加合乎逻辑/自然。试图将其融入工作流是很奇怪的:工作流是长期存在的,每个节点都是一个状态。 看一下drools参考手册中的“决策表”:downloads.jboss.com/drools/docs/5.1.1.34858.FINAL/drools-expert/…你可能不想从XLS开始,而是直接使用DRL,但是你的规则设计是一样的: 每条规则都是一条决策线。 决策表是一个不错的功能。但是,在我的决策树中,有时有不止一种方法可以到达特定的末端节点,如果我用规则重写它,它们的数量会增长得非常快。此外,在图表发生变化的情况下更新规则将是一项相当乏味的任务。因此,在我看来,树/图表(即使在 Drools Flow 中)是一种更自然的方式来表示决策。【参考方案3】:你可以试试iLog框架兼规则引擎。
【讨论】:
谢谢,但 iLog 似乎不必要地复杂。我正在寻找更精简的解决方案。 基于 JSR 94 的 Java 规则引擎 API 怎么样?还有一个叫杰斯。您可以在此链接中找到列表:java-source.net/open-source/rule-engines 你会遇到同样的设计问题。切换规则引擎实现将无济于事。 Drools 实现了 JSR-94,但 JSR-94 API 对于大多数实际用例来说过于局限。它已经多年没有发展了。以上是关于决策树和规则引擎 (Drools)的主要内容,如果未能解决你的问题,请参考以下文章