使用闭包表对分层数据进行分页(MySQL)

Posted

技术标签:

【中文标题】使用闭包表对分层数据进行分页(MySQL)【英文标题】:Paginating hierarchical data using closure tables (MySQL) 【发布时间】:2013-05-18 00:52:21 【问题描述】:

我正在尝试查询按score 排序的分页分层 cmets。 score 是一个整数,cmets 表有一个自引用的parent_id 列。

每个页面都应至少有一个根评论,后跟其子评论。如果数据集中只有一个根评论,则只会返回一页。

因此,给定comments 表中的以下数据:

+----+-------+-----------+
| id | score | parent_id |
+----+-------+-----------+
|  1 |    10 |      NULL |
|  2 |     5 |      NULL |
|  3 |     0 |         1 |
|  4 |     6 |         2 |
|  5 |     0 |      NULL |
|  6 |    30 |         1 |
|  7 |     1 |         3 |
|  8 |     0 |         4 |
|  9 |    50 |      NULL |
| 10 |     2 |         2 |
+----+-------+-----------+

我希望能够SELECT * FROM comments...LIMIT 4 OFFSET 0 并拥有第 1 页

+----+-------+-----------+
| id | score | parent_id |
+----+-------+-----------+
|  9 |    50 |      NULL |
|  1 |    10 |      NULL |
|  6 |    30 |         1 |
|  3 |     0 |         1 |
+----+-------+-----------+

第2页是:

+----+-------+-----------+
| id | score | parent_id |
+----+-------+-----------+
|  2 |     5 |      NULL |
|  4 |     6 |         2 |
| 10 |     2 |         2 |
|  5 |     0 |      NULL |
+----+-------+-----------+

并且 第 3 页 为空白,因为没有根 cmets。

我正在使用 Bill Karwin 所描述的支持闭包表,因为可以使用任何评论作为根评论来独立查看评论子树,这似乎是最好的解决方案。

相关表格的结构和样本数据如下:

CREATE TABLE `comments` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `score` int(11) NOT NULL,
  `parent_id` int(11) unsigned DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

INSERT INTO `comments` (`id`, `score`, `parent_id`)
VALUES
  (1,10,NULL),
  (2,5,NULL),
  (3,0,1),
  (4,6,2),
  (5,0,NULL),
  (6,30,1),
  (7,1,3),
  (8,0,4),
  (9,50,NULL),
  (10,2,2);

CREATE TABLE `comments_closure` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `ancestor` int(11) unsigned NOT NULL,
  `descendant` int(11) unsigned NOT NULL,
  `depth` int(11) unsigned NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

INSERT INTO `comments_closure` (`id`, `ancestor`, `descendant`, `depth`)
VALUES
  (1,1,0), (1,3,1), (1,6,1), (1,7,2),
  (2,2,0), (2,4,1), (2,10,1), (2,8,2),
  (3,3,0), (3,7,1),
  (4,4,0), (4,8,1),
  (5,5,0),
  (6,6,0),
  (7,7,0),
  (8,8,0),
  (9,9,0),
  (10,10,0);

【问题讨论】:

【参考方案1】:

这应该适用于 1 级深度查询:

SELECT @id_multiplier := MAX(POW(10, -(length(id) + 1))) FROM comments;
SELECT @score_multiplier := @id_multiplier * MAX(POW(10, -(length(score) + 1))) FROM comments;
SELECT c1.id
     , c1.score
     , c1.parent_id 
FROM comments c1
LEFT JOIN comments c2 
   ON c1.parent_id = c2.id
WHERE c1.parent_id IS NULL 
   OR c1.parent_id IN 
     (SELECT id FROM comments WHERE parent_id IS NULL)
ORDER BY 
   IF(ISNULL(c1.parent_id)
    , c1.score
    , c2.score + (c1.parent_id * @id_multiplier) - (1-(c1.score * @score_multiplier))
    ) DESC

【讨论】:

以上是关于使用闭包表对分层数据进行分页(MySQL)的主要内容,如果未能解决你的问题,请参考以下文章

外键约束问题(分层数据)

使用分层数据结构对数据库进行分片

多级页表——分层分页

最短路合集(分层图最短路传递闭包路径还原k短路...)

spring---web项目结构分层

以高写入负载在 MySQL 中存储分层数据