drools 决策引擎介绍开发

Posted 2020-11-23 renfeihn

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了drools 决策引擎介绍开发相关的知识，希望对你有一定的参考价值。

1. 背景介绍

1.1 何为规则引擎

很多企业的IT业务系统中，经常会有大量的业务规则配置，而且随着企业管理者的决策变化，这些业务规则也会随之发生更改，为了适应这样的需求，IT业务系统应该能够快速且低成本的更新，通常做法是将业务规则的配置单独拿出来，使之与业务系统保持低耦合，实现这样功能的程序，叫做规则引擎。

接受数据输入，解释业务规则，并根据业务规则作出业务决策，从而实现了将业务决策从应用程序中分离出来。

1.2 一个实际的例子

银行贷款业务中，每种贷款类型都有不同的业务规则，并且这些规则也可能会根据实际应用情况进行调整，如觉得网贷产品类型有如下判定规则：

如果公积金缴存基数大于6000则进入白领贷
如果公积金缴存基数小于6000但单位性质是国家机关/事业单位也进入白领贷
如果公积金缴存基数小于6000且单位性质为非国家机关/事业单位则进入市民易贷
如果公积金缴存基数小于6000并且单位性质缺失则进入公积金贷

如果在代码中处理这类业务逻辑，会有很多的IF/ELSE，并且如果规则发生变化，还需要重新编写代码、编译、部署才能上线。

而通过规则引擎，可以方便的将这类业务强相关的逻辑放到规则引擎中执行

技术图片

1.3 规则引擎的优点

对系统的使用人员

l 把业务策略（规则）的创建、修改和维护的权利交给业务经理

l 提高业务灵活性

l 加强业务处理的透明度，业务规则可以被管理

l 减少对IT人员的依赖程度

l 避免升级的风险

对IT开发人员

l 简化系统架构，优化应用

l 提高系统的可维护性和维护成本

l 方便系统的整合

l 减少编写“硬代码”业务规则的成本和风险

2. Drools简介

Drools是一款基于Java的开源规则引擎，可以将复杂多变的规则从硬编码中解放出来，以规则脚本的形式存放在文件或特定的数据库中，使得业务规则的变更不需要修改代码即可在线上环境生效。

规则引擎由推理引擎发展而来，是一种嵌入在应用程序中的组件，实现了将业务决策从应用代码中分离出来，并使用预定义的语义模块编写业务决策。接收数据输入，解释业务规则，并根据业务规则作出业务决策。

技术图片

3. Drools基本概念

3.1 工作流程

技术图片

需要判定的规则加载进ProductionMemory

需要判定的fact对象插入到WorkingMemory

推理引擎（Inference Engine）通过模式匹配器（Pattern Matcher）对规则和fact对象进行批评，如果有规则匹配成功，则将待执行的规则放入Agenda（议事日程）队列中等待执行。

技术图片

当Agenda队列中的规则执行的过程中如果对WorkingMemory中的Fact对象进行了insert/update/delete操作时，需要重新进行推理判定，刷新Agenda队列中的执行序列。

当Agenda队列中所有规则执行完毕后，结束当前任务。

3.2 Fact对象

Fact对象指传递给Drools脚本的对象，是一个普通的POJO，可以对该Fact对象进行读写操作，并调用该对象的方法。

当一个POJO插入到WorkingMemory中变成Fact之后，Fact对象不是对原来POJO对象进行Clone，而是对原有对象的引用。规则通过对fact对象的读写，实现对应用数据的读写，对其中的属性，需要提供get/set方法，通过这些getter 和setter 方法可以方便的实现对Fact 对象的读写操作，所以我们可以简单的把Fact 对象理解为规则与应用系统数据交互的桥梁或通道。

规则中可以动态的在WorkingMemory中插入删除新的fact对象。

3.3 Rete算法简介

Rete算法是Charles Forgy博士在1979年的论文中首次提出的，针对基于规则知识表现的模式匹配算法。当前，大部分规则引擎都是基于Rete算法为核心。

Rete算法是一个用于产生式系统的高效模式匹配算法。在一个产生式系统中，被处理的数据叫做WorkingMemory，用于判定的规则分为两个部分LHS（left-hand-side）和RHS（right hand side），分别表示前提和结论。主要流程可以分为以下步骤：

Match：找出符合LHS部分的WorkingMemory集合
Confilict resolution：选出一个条件被满足的规则
Act：执行RHS的内容
返回第一步

Rete算法主要改进Match的处理过程，通过构建一个网络进行匹配。

3.4 基础语法

Drools文件中最重要的是：包路径、引用、规则体

一个DRL文件的例子HelloWorld.drl

技术图片

package：包路径。该路径是逻辑路径，可以随便写，但不能不写，已.的方式隔开，规则文件中永远是第一行

import：引用。导入规则文件需要使用到的外部变量，可以导入类，也可以是类中的静态方法

rule：规则体。以rule开头，以end结尾，每个文件可以包含多个rule，规则体分为3个部分：LHS、RHS、属性。

LHS：（Left Hand Side），条件部分，在一个规则当中”when”和”then”中间的部分就是LHS部分，在LHS当中，可以包含0~N个条件，如果LHS为空的话，那么引擎会自动添加一个eval(true)的条件。

RHS：（Right Hand Side），是规则真正做事情的部分，满足条件触发动作的操作部分，在RHS中可以使用LHS部分当中定义的绑定变量名、设置的全局变量、或者是直接编写的java代码，也可以使用import的类，虽然可以，但不建议在RHS中有条件判断。

RHS中可以使用insert/update/modify/delete实现对当前WorkingMemory中Fact对象的新增/修改/删除。

3.5 KIE API

3.5.1什么是KIE

KIE是jBoss里面一些相关项目的统称，下图就是KIE代表的一些项目，其中我们比较熟悉的就有jBPM和Drools。

技术图片

jBPM：工作流引擎

Drools：规则引擎

OptaPlanner：规划引擎

Guvnor：业务规划管理系统（Drools 6.0后已被WorkBench替换）

这些项目都有一定的关联关系，并且存在一些通用的API，比如说涉及到构建（building）、部署（deploying）和加载（loading）等方面的，这些API就都会以KIE作为前缀来表示这些是通用的API。

总的来说，就是jBoss通过KIE将jBPM和Drools等相关项目进行了一个整合，统一了他们的使用方式。像KieServices这些KIE类就是整合后的结果，在Drools中这样使用，在jBPM里面也是这样使用。

在Drools当中，规则的编译与运行要通过Drools提供的各种API来实现，这些API总体来讲可以分为三类：规则编译、规则收集和规则执行。完成这些工作的API主要有KnowledgeBuilder、KnowledgeBase、StatefulKnowledgeSession、StatelessKnowledgeSession等，它们起到了对规则文件进行收集、编译、查错、插入fact、设置global、执行规则或规则流等作用。

3.5.2 KnowledgeBuilder

KnowledgeBuilder的作用是用来在业务代码当中收集已经编写好的规则，然后对这些规则文件进行编译，最终产生一批编译好的规则包（KnowledgePackage）给其他的应用程序使用。

KnowledgeBuilder在编译规则的时候可以通过其提供的hasErrors()方法得到编译规则过程中发现规则是否有错误，如果有的话通过其提供的getErrors()方法将错误打印出来，以帮助我们找到规则当中的错误信息。

通过KnowledgeBuilder编译的规则文件的类型有很多种，如.drl文件或一个xls文件等。产生的规则包可以是具体的规则文件行程的，也可以是规则流（rule flow）文件形成的，在添加规则文件时，需要通过使用ResourceType枚举值来指定规则文件的类型；同时在指定规则文件的时候drools还提供了一个名为ResourceFactory的对象，通过该对象可以实现从Classpath、URL、File、ByteArray、Reader或诸如XLS的二进制文件里加载规则。

3.5.3 KnowledgeBase

KnowledgeBase是Drools提供的用来收集应用当中知识（Knowledge）定义的知识库对象，在一个KnowledgeBase当中可以包含普通的规则（rule）、规则流（rule flow）、函数定义（function）、用户自定义的对象（type model）等。

业务对象都是插入到由KnowledgeBase产生的两种类型的session 对象当中（StatefulKnowledgeSession 和StatelessKnowledgeSession，后面会有对应的章节对这两种类型的对象进行介绍），通过session 对象可以触发规则执行或开始一个规则流执行。

KnowledgeBase 创建完成之后，接下来就可以将我们前面使用KnowledgeBuilder 生成的KnowledgePackage 的集合添加到KnowledgeBase 当中。

3.5.4 StatefulKnowledgeSession

StatefulKnowledgeSession 对象是一种最常用的与规则引擎进行交互的方式，它可以与规则引擎建立一个持续的交互通道，在推理计算的过程当中可能会多次触发同一数据集。接收外部插入的数据fact对象（POJO），将编译好的规则包和业务数据通过fireAllRules()方法触发所有的规则执行。使用完成需调用dispose()方法以释放相关内存资源。

3.5.5 StatelessKnowledgeSession

对StatefulKnowledgeSession的封装实现，与其对比不需要调用dispose()方法释放内存，只能插入一次fact对象，StatelessKieSession隔离了每次与规则引擎的交互，不会维护会话状态。

4. Drools详细介绍

4.1 Drl

在Drools当中，一个标准的规则文件就是一个以”.drl”结尾的文本文件，由于它是一个标准的文本文件，所以可以通过一些记事本工具对其进行打开、查看和编辑。规则是放在规则文件当中的，一个规则文件可以存放多个规则，除此之外，在规则文件当中还可以存放用户自定义的函数、数据对象及自定义查询等相关在规则当中可能会用到的一些对象。

一个标准的规则文件的结构代码：

技术图片

package package-name(包名，必须的，用于逻辑上的管理，若自定义查询或函数属于同一个包名，不管物理位置如何，都可以调用)，package在规则文件中是第一行，其他的顺序可以是无序的

import(需要导入的类名)

globals(全局变量)

functions(函数)

queries(查询)

rules(规则，可以多个)

技术图片

一个规则包含三部分：只有attributes部分可选，其他都是必填

4.1.1 属性attributes

定义当前规则执行的一些属性等，比如是否可被重复执行，过期时间，生效时间等。

Salience 优先级

作用：设置规则执行的优先级，值是一个数字，数字越大执行的优先级越高，它的值可以是一个负数，默认值是0。如果我们不手动设置salience属性值，则执行顺序是随机的。

no-loop 防止死循环

在一个规则中如果条件满足就对Working Memory当中的某个Fact对象进行修改，比如使用update将其更新到当前的Working Memory当中，这时候引擎会再次检查所有的规则是否满足条件，如果满足会再执行，可能会出现死循环。

作用：用来控制已经执行过的规则条件再次满足时是否再次执行，默认是false，如果属性值是true，表示该规则只会被规则引擎检查一次。

lock-on-active 规则执行一次

当在规则上使用ruleflow-group属性或agenda-group属性的时候，将lock-on-active属性的值设置为true，可以避免因某些Fact对象被修改而使已经执行过的规则再次被激活执行。可以看出该属性与no-loop属性有相似之处，no-loop属性是为了避免Fact修改或调用了insert，retract，update之类导致规则再次激活执行，这里lock-on-active属性也是这个作用，lock-on-active是no-loop的增强版。

作用：在使用ruleflow-group属性或agenda-group属性的时候，默认是false，设置为true，该规则只会执行一次。

ruleflow-group 规则流分组

在使用规则流的时候要用到ruleflow-group属性，该属性的值为一个字符串，作用是将规则划分为一个个的组，然后在规则流当中通过使用ruleflow-group属性的值，从而使用对应的规则。该属性会通过流程的走向确定要执行哪一条规则。

4.1.2 LHS

定义当前规则的条件，如 when Message();判断当前workingMemory中是否存在Message对象。

LHS部分是由一个或多个条件组成，条件又称为pattern(匹配模式)，多个pattern之间可以使用 and 或 or来进行连接，同时还可以使用小括号来确定pattern的优先级

【绑定变量名：】Object(【filed 约束】)

对于一个pattern来说"绑定变量名"是可选的，如果在当前规则的LHS部分的其他pattern要使用这个对象，那么可以通过为该对象绑定设定一个绑定变量名来实现对其的引用，对于绑定变量的命名，通常的做法是为其添加一个 "$"符号作为前缀，可以和Fact对象区分开来。

绑定变量可以用于对象上，可以用于对象属性上，"field约束"是指当前对象里相关字段的条件限制。

技术图片

以上，

第一个pattern有三个约束

1、对象类型必须是Customer；

2、Customer的age要大于20

3、Customer的gender要是male

第二个pattern有三个约束

　　1、对象类型必须是Order

　　2、Order对应的Customer必须是前面那个Customer

　　3、当前这个Order的price要大于1000

这两个pattern没有符号连接，在Drools当中没有连接符号，默认是and，只有两个pattern(模式)都满足才会返回true。

4.1.3 RHS

RHS是满足LHS条件之后进行后续处理部分的统称，该部分包含要执行的操作的列表信息。RHS主要用于处理结果，因此不建议在此部分再进行业务判断。

RHS的主要功能是对working memory中的数据进行insert、update、delete或modify操作，Drools提供了相应的内置方法来帮助实现这些功能。

RHS中可以写java代码，即当前规则条件满足执行的操作，可以直接调用Fact对象的方法来操作应用。

4.1.4 Function函数

函数是将语义代码放置在规则文件中的一种方式，就相当于java类中的方法一样。使用函数的好处是可以将业务逻辑集中放置在一个地方，根据需要可以对函数进行修改。

4.2 决策表

决策表是一个”精确而紧凑的”表示条件逻辑的方式，非常适合商业级别的规则。目前决策表支持xls格式和csv格式。

4.2.1 何时使用决策表

如果规则能够被表达为模板+数据的格式，可以考虑使用决策表。

决策表中的每一行就是对应一行数据，将产生一个规则。

4.2.2 运行决策表

首先，决策表将转换为Drools规则语言（DRL），然后执行规则引擎需求。

4.2.3 决策表的配置

全局配置：

技术图片

RuleTable部分

技术图片

4.2.4 决策表例子

年龄分类规则如下：

技术图片

决策表设计：

技术图片

POJO对象：

技术图片

测试类：

技术图片

结果：

技术图片

4.3 规则流

4.3.1 什么是规则流

规则流能够控制，规则中的复杂流程，在复杂业务中，很多时候并不需要触发所有的规则，很多时候需要触发的规则也需要像程序一样，符合某些逻辑，如，当X对象X 属性等于 A 时，触发规则A 中的规则，当等于B时，触发规则B中的规则，这时候用规则流就能够很好的处理这类问题。

4.3.2 如何使用规则流

创建规则流文件如score.bpmn

技术图片

指定规则文件相关属性：

技术图片

流程中指定，评分模型的规则组：

技术图片

设置网关判定条件：

技术图片

编辑各条网关连接线的判断依据：

技术图片

4.3.3 规则流组件

RuleTask

规则任务，可和规则文件中指定规则组关联

ScriptTask

脚本任务，可编写脚本完成指定任务

Gateway

按网关方向可分为聚合网关diverging gateway和分散网关converging gateway

按网关类型可分为：

u 唯一网关XOR网关

技术图片

唯一网关会选择一个顺序流，如果条件执行为true。如果多个条件执行为true，第一个遇到的就会被使用。

u 并行网关AND网关

技术图片

l 并行网关拥有一个进入顺序流的和多于一个的外出顺序流叫做‘并行切分或 ‘AND-split‘。所有外出顺序流都会被并行使用。

l 并行网关拥有多个进入顺序流和一个外出顺序流叫做‘并行归并‘或 AND-join。所有进入顺序流需要到达这个并行归并，在外向顺序流使用之前。

u 包含网关OR网关

技术图片

包含网关先后执行为true的分支。

5. 开发环境搭建

5.1安装Drools插件

5.1.1 下载Drools插件

技术图片

可以去工具集中下载

5.1.2 安装Drools插件

Help->Install New Software

技术图片

重启Eclipse，如果Preferences中出现Drools则说明插件安装成功。

技术图片

5.2安装Drools Runtimes（Drools运行时）

5.2.1下载Drools Engine

技术图片

5.2.2在Eclipse中指定Drools Runtimes

Windows->Preferences->Drools->Installed Drools Runtimes

技术图片

可以新建Drools项目

技术图片

6. Drools代码编写注意事项

6.1规则流部分

每个flow需要有至少一个进入点（Start Event）和一个退出点（End Event）
网关按方向有diverge（分离网关）和converge（汇聚网关），需要合理使用
网关按类型有唯一网关（XOR）、并行网关（AND）和包含网关（OR），需要合理使用
唯一网关（XOR）作为分离网关，会选择外出的多个顺序流中的一个
并行网关（AND）作为分离网关，拥有一个进入顺序流和多个外出顺序流，叫做“并行切分（AND-split）”，所有的外出顺序流都会被执行
并行网关（AND）作为汇聚网关，拥有多个进入顺序流和一个外出顺序流，叫做“并行归并（AND-join）”，所有进入顺序流都需要到达并行网关，才会执行外出顺序流
包含网关（OR）基本行为和唯一网关类似，区别在于，满足条件的外出顺序流都会被执行
Id唯一的代表一个flow元素，不能重复
界面创建flow元素后自动生成的MetaData的UniqueId需要检查不能以数字开头，否则调用规则流引擎时会报错
如果规则流需要引用WorkingMemory中的Fact对象，需要在规则流的Properties中定义Variables，此变量需要在Java代码调用规则流时作为参数传入

6.2决策表部分

合理设置RuleSet名称，确保不重复
决策表编写需注意格式，如CONDINTION下第四行是第一条数据（规则）配置行
CONDITION和ACTION中都可以使用匹配Fact变量的成员函数
ACTION中更新WorkingMemory中Fact对象后需考虑是否规则是否会反复触发导致死循环
如果想规则始终进入，可使用eval(true)
CONDITION中如果使用可能会变化的Fact对象的Map中的value，需要使用原生的get方法
CONDITION中使用占位符匹配规则时，如果是字符串需要用双引号引起来

6.3 Java代码部分

需要使用session的insert方法将需要处理的对象插入到WorkingMemory
如果规则流需要使用Fact对象，需要在调用规则流的时候将Fact对象放入map中，作为参数传入
启用规则流后，还需要调用session的fireAllRules才会执行匹配的规则

有状态session使用后必须显式调用dispose方法来释放，避免内存

以上是关于drools 决策引擎介绍开发的主要内容，如果未能解决你的问题，请参考以下文章

决策树和规则引擎 (Drools)

开源业务规则引擎JBoss Drools

规则引擎Drools在贷后催收业务中的应用

.Net RulesEngine规则引擎使用

规则引擎Drools示例：个人所得税计算器信用卡申请保险产品准入规则

风控决策引擎——决策流路径规划