无限极分类

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了无限极分类相关的知识,希望对你有一定的参考价值。

完成无限极分类,主要运用了两种方法,一是递归方式,二是迭代方式。而主要运用无限极分类的地方有地址解析,面包屑导航等等。下面就来具体介绍两种方法的原理及实现方法。

家谱树与子孙树

家谱树是无限极分类的表现形式之一,另一个是子孙树。一开始学习无限极分类时,我时常弄混这两棵树,现在看来自然是明白很多。从汉语的意思也能够看出其中的区别。

家谱,现在很多地方都流行起修家谱,那怎么修家谱,按照我理解,就是给自己找一个祖宗,一代代找上去,形成了一个体系,这样编篡而成的叫家谱。家谱树就与之类似,从某个节点开始向上寻找其父节点,再找父节点的父节点,直到找不到为止。按照这种寻找,形成的一个类似树状的结构,就叫做家谱树。

而子孙树与其相反,子孙树类似于生物书中的遗传图,从某个节点开始寻找它的子节点,再找子节点的子节点,直到寻找完毕。这样形成的树状结构就叫做子孙树。

从上面对家谱树与子孙树的描述,将其转换为代码时,我的第一印象就是利用递归方式,家谱树,找父节点的父节点,子孙树,找子节点的子节点。完全符合递归思想。所以首先我们来说说利用递归方式完成家谱树与子孙树。

递归方式

家谱树的实现

为更清楚的讲解,我先将即将分类的数据贴在下面,是关于地址的数据:

$address = array(
    array(‘id‘=>1  , ‘address‘=>‘安徽‘ , ‘parent_id‘ => 0),
    array(‘id‘=>2  , ‘address‘=>‘江苏‘ , ‘parent_id‘ => 0),
    array(‘id‘=>3  , ‘address‘=>‘合肥‘ , ‘parent_id‘ => 1),
    array(‘id‘=>4  , ‘address‘=>‘庐阳区‘ , ‘parent_id‘ => 3),
    array(‘id‘=>5  , ‘address‘=>‘大杨镇‘ , ‘parent_id‘ => 4),
    array(‘id‘=>6  , ‘address‘=>‘南京‘ , ‘parent_id‘ => 2),
    array(‘id‘=>7  , ‘address‘=>‘玄武区‘ , ‘parent_id‘ => 6),
    array(‘id‘=>8  , ‘address‘=>‘梅园新村街道‘, ‘parent_id‘ => 7),
    array(‘id‘=>9  , ‘address‘=>‘上海‘ , ‘parent_id‘ => 0),
    array(‘id‘=>10 , ‘address‘=>‘黄浦区‘ , ‘parent_id‘ => 9),
    array(‘id‘=>11 , ‘address‘=>‘外滩‘ , ‘parent_id‘ => 10)
    array(‘id‘=>12 , ‘address‘=>‘安庆‘ , ‘parent_id‘ => 1)
    );

按照上文的介绍,对上面数据进行家谱树无限极分类,假设我们想要寻找大杨镇的家谱树,先找到与之相关的信息。

‘id‘=>5  , ‘address‘=>‘大杨镇‘ , ‘parent_id‘ => 4

可以看出它的父节点的id,即parent_id == 4,那么id==4的节点就是其父节点,由此找到庐阳区:

‘id‘=>4  , ‘address‘=>‘庐阳区‘ , ‘parent_id‘ => 3

与上面类似,寻找id=3的节点,依次向上寻找,找到大杨镇的家谱

大杨镇 -> 庐阳区 -> 合肥 -> 安徽

那么怎么用代码来完成它呢?其实很简单,只需要判断寻找的父id是否与节点的id相等,即parent_id ?= id,相等就是要寻找的父节点,并把该节点的parent_id作为寻找的id,递归进行寻找。如下面的流程图:

技术分享
递归方法求家谱树

下面就开始编写代码:

/**
 * 获取家谱树
 * @param   array        $data   待分类的数据
 * @param   int/string   $pid    要找的祖先节点
 */
function Ancestry($data , $pid) {
    static $ancestry = array();

    foreach($data as $key => $value) {
        if($value[‘id‘] == $pid) {
            $ancestry[] = $value;

            Ancestry($data , $value[‘parent_id‘]);
        }
    }
    return $ancestry;
}

根据流程图,代码编写完成。注意上面存储结点的数组,即$ancestry,要添加静态化关键字static,否则每次递归都会将该数组初始化。当然也可以使用array_merge将每次返回的数组与上一次的进行合并。

寻找家谱的关键就是条件判断,寻找的parent_id等于某个节点的id值,显然该节点就是要寻找的父节点。

代码编写完成,来看看是否符合我们的预期,来寻找大杨镇的家谱:

Ancestry($address , 4);

结果:

Array
(
    [0] => Array
        (
            [id] => 4
            [address] => 庐阳区
            [parent_id] => 3
        )
    [1] => Array
        (
            [id] => 3
            [address] => 合肥
            [parent_id] => 1
        )
    [2] => Array
        (
            [id] => 1
            [address] => 安徽
            [parent_id] => 0
        )
)

可以看出结果与我们预期相符。那么家谱树的递归方法就完成了,下面来讲子孙树的实现。

子孙树的实现

依然使用上面的数据,子孙树是从父节点开始,向下寻找其子孙节点,而形成的一个树状图形。

假设寻找id=0的子孙节点,那么就要注意所有parent_id=0的节点,这些节点都是id=0的子节点。然后,把parent_id=0节点的id作为查询id继续向下查询,直到查不到任何子节点为止。如下:

技术分享
子孙树

流程图如下:

技术分享
子孙树流程图

其流程与家谱树类似,不同点,也是关键点就是条件语句的执行。家谱树判断的是当前节点的id是否与上一个节点的parent_id相等;子孙树判断的是当前节点的parent_id与上一个节点的id相等,按照这种条件判断子孙树能够有多个子孙节点,而家谱树只能存在一个祖先。代码如下:

/**
 * 获取子孙树
 * @param   array        $data   待分类的数据
 * @param   int/string   $id     要找的子节点id
 * @param   int          $lev    节点等级
 */
 function getSubTree($data , $id = 0 , $lev = 0) {
     static $son = array();

     foreach($data as $key => $value) {
         if($value[‘parent_id‘] == $id) {
             $value[‘lev‘] = $lev;
             $son[] = $value;
             getSubTree($data , $value[‘id‘] , $lev+1);
         }
     }

     return $son;
 }

在函数中我添加了一个变量lev,为的是给存入的节点标注等级,方便看出子孙树的结构。下面来测试结果:

getSubTree($data , 0 , 0);

因篇幅有限,将结果进行部分处理:

foreach($tree as $k => $v) {
    echo str_repeat(‘--‘ , $v[‘lev‘]) . $v[‘address‘] . ‘<br/>‘;
}

结果:

安徽
--合肥
----庐阳区
------大杨镇
--安庆
江苏
--南京
----玄武区
------梅园新村街道
上海
--黄浦区
----外滩

递归方式的家谱树与子孙树比较容易理解,只要对递归思想比较了解,一步步写下来不是很难。比起递归方式,迭代方式可能更加让人难以理解。下面就来介绍迭代方式的家谱树与子孙树编写。

迭代方式

家谱树

完成跌代方式的家谱树之前,首先说一下寻找祖先节点的终止条件。虽然叫无限极分类,它不是绝对的无限,只是理论的无限。

如同我国上下五千年历史,任一个大的姓氏,向上找其祖先,不是找到炎帝就是找到黄帝,在往前就没有历史记载了。所以在家谱树的寻找中也有终止条件,就是在分类数据中再也找不到它的父节点时,表现在实例数据上,就是不存在parent_id < 0的节点。

这也是完成迭代的关键,以其作为迭代条件,对数据进行循环判断,并把每次找到的节点的parent_id再次作为迭代条件,直到不满足迭代条件。流程图如下:

技术分享
家谱树迭代流程

理清流程,现在开始完成代码编写:

function Ancestry($data , $pid) {
    $ancestry = array();

    while($pid > 0) {
        foreach($data as $v) {
            if($v[‘id‘] == $pid) {
                $ancestry[] = $v;

                $pid = $v[‘parent_id‘];
            }
        }
    }

    return $ancestry;
}

迭代条件$pid>0,当pid>0时说明还有祖先存在,可以继续迭代,否则说明没有祖先,迭代终止。$pid = $v[‘parent_id‘]是迭代继续进行的关键,每次找到祖先节点,就将祖先节点的父id传递给pid,进行下一次迭代。

运行这个函数,结果与使用递归方式的结果一致。

子孙树的实现

使用迭代方式完成子孙树,更为复杂,需要运用的栈的思想。在进行迭代的过程中,将每次寻找的id入栈,找到一个节点,就将该节点从原数据中删除,当寻找到叶子节点时,即不存在子孙节点时,就将该叶子节点对应的id从栈中弹出,再寻找栈顶id的子孙节点,直到栈清空为止,迭代结束。下面用一个例子来说明:

$address = array(
    array(‘id‘=>1  , ‘address‘=>‘安徽‘ , ‘parent_id‘ => 0),
    array(‘id‘=>2  , ‘address‘=>‘江苏‘ , ‘parent_id‘ => 0),
    array(‘id‘=>3  , ‘address‘=>‘合肥‘ , ‘parent_id‘ => 1),
    array(‘id‘=>4  , ‘address‘=>‘庐阳区‘ , ‘parent_id‘ => 3),
    array(‘id‘=>5  , ‘address‘=>‘大杨镇‘ , ‘parent_id‘ => 4),
    array(‘id‘=>6  , ‘address‘=>‘南京‘ , ‘parent_id‘ => 2),
    array(‘id‘=>7  , ‘address‘=>‘玄武区‘ , ‘parent_id‘ => 6),
    array(‘id‘=>8  , ‘address‘=>‘梅园新村街道‘, ‘parent_id‘ => 7),
    array(‘id‘=>9  , ‘address‘=>‘上海‘ , ‘parent_id‘ => 0),
    array(‘id‘=>10 , ‘address‘=>‘黄浦区‘ , ‘parent_id‘ => 9),
    array(‘id‘=>11 , ‘address‘=>‘外滩‘ , ‘parent_id‘ => 10)
    array(‘id‘=>12 , ‘address‘=>‘安庆‘ , ‘parent_id‘ => 1)
    );

寻找id=0的子孙节点,id=0入栈,寻找到该节点,为

array(‘id‘=>1  , ‘address‘=>‘安徽‘ , ‘parent_id‘ => 0)

此时栈为[0],并且将该节点从原数据中删除,再将id=1入栈,寻找id=1的子孙节点,找到为:

array(‘id‘=>3  , ‘address‘=>‘合肥‘ , ‘parent_id‘ => 1),

此时栈[0][1],将该节点删除,id=3入栈,寻找id=3的子孙节点,找到:

array(‘id‘=>4  , ‘address‘=>‘庐阳区‘ , ‘parent_id‘ => 3)

[0][1][3],将该节点删除,id=4入栈,寻找id=4的子孙节点,找到:

array(‘id‘=>5  , ‘address‘=>‘大杨镇‘         , ‘parent_id‘ => 4),

[0][1][3][4],将该节点删除,id=5入栈,栈[0][1][3][4][5],并寻找id=5的子节点,遍历后未找到,于是将id=5出栈,再次寻找id=4的子孙节点,依次进行。最后完成整个迭代。

期间,栈的情况如下:

[0]
[0][1]
[0][1][3]
[0][1][3][4]
[0][1][3][4][5]
[0][1][3][4]
[0][1][3]
[0][1]
[0][1][12]
[0][1]
[0]
……

代码如下:

function getSubTree($data , $id = 0) {
    $task = array($id);                          # 栈 任务表
    $son = array();

    while(!empty($task)) {
        $flag = false;                           # 是否找到节点标志
        foreach($data as $k => $v) {

            # 判断是否是子孙节点的条件 与 递归方式一致
            if($v[‘parent_id‘] == $id) {
                $son[] = $v;                     # 节点存入数组
                array_push($task , $v[‘id‘]);    # 节点id入栈
                $id = $v[‘id‘];                  # 判断条件切换
                unset($data[$k]);                # 删除节点
                $flag = true;                    # 找到节点标志
            }
        }

        # flag == false说明已经到了叶子节点 无子孙节点了
        if($flag == false) {
            array_pop($task);                    # 出栈
            $id = end($task);                    # 寻找栈顶id的子节点
        }
    }
    return $son;
}

这里找到节点后必须把该节点从原数据中删除,否则会造成每次都找到该节点,形成无限迭代的bug。在这里利用数组函数array_push与array_pop模拟进栈与出栈操作。

利用迭代完成子孙树比较复杂,且我没有测试过这个与递归方式谁的效率高,不过利用迭代完成家谱树明显比起递归方法效率高。

 

 




以上是关于无限极分类的主要内容,如果未能解决你的问题,请参考以下文章

Laravel框架实现无限极分类

创建无限极分类树型结构

无限极分类+商品导出excel(Thinkphp5,数据读取无限极,个人限制导出5级)

PHP无限极分类 - 3 - 分类目录

关于PHP无限极分类

yii框架无限极分类的做法