算法导论读书笔记-第十四章-数据结构的扩张

Posted 2020-10-14

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了算法导论读书笔记-第十四章-数据结构的扩张相关的知识，希望对你有一定的参考价值。

算法导论第14章数据结构的扩张

一些工程应用需要的只是标准数据结构, 但也有许多其他的应用需要对现有数据结构进行少许的创新和改造, 但是只在很少情况下需要创造出全新类型的数据结构, 更经常的是通过存储额外信息的方法来扩张一种标准的数据结构, 然后对这种数据结构编写新的操作来支持所需要的应用. 但是对数据结构的扩张并不总是简单直接的, 因为新的信息必须要能被该数据结构上的常规操作更新和维护.

14.1 动态顺序统计

顺序统计树(order-static tree) : 在红黑树的基础上, 在每个结点加上一个size域表示以该结点为根的子树(包括该结点本身)的(内)结点树, 而哨兵T.nil(叶结点)的size域定义为0, 故有等式\(x.size=x.left.size + x.right.size + 1\) .

顺序统计树可在O(lgn)时间内确定任何顺序统计量, 也可在O(lgn)时间内确定任何元素的秩, 即它在集合线性序中的位置.

在一棵顺序统计树中, 并不要求关键字各不相同, 若有关键字相同, 则秩定义为在中序遍历树时输出的位置.

查找具有给定秩的元素

# 返回以x为根的子树中秩为i的结点
os_select(x,i):
  r == x.left.size + 1
  if i == r:
    return x
  else if i < r:
    return os_select(x.left, i)
  else:
    return os_select(x.right, i-r)

每次递归调用都在顺序统计树下降一层, 故os_select运行时间为O(h)即O(lgn).

确定一个元素的秩

# 返回树T中x在中序遍历T对应的线性序中x的位置
os_rank(T,x):
  r = x.left.size + 1
  y = x
  # while循环保持下列不变式:
  # 每次循环开始前, r为以y为根的子树中x的秩
  while y != T.root:
    if y == y.p.right:
      r = r + y.p.left.size + 1
    y = y.p
  return r

对子树规模的维护

对红黑树的插入删除大体分为两个阶段: 寻找插入位置, 再作着色和旋转操作以保持红黑结构. 为了维护顺序统计数的附加信息, 在第一阶段, 对从根到插入位置路径上的每一个结点, 将size加1, 而新结点的size置1. 对第二阶段, 着色并不影响树型结构, 只有旋转影响局部结构, 只需要在旋转操作的基础上加上以下代码:

# 对 left_rotation(T,x) 和 right_rotation(T,x)
y.size = x.size
x.size = x.left.size + x.right.size + 1

显然维护顺序统计树只需要O(lgn)时间.

14.2 如何扩张数据结构

扩张数据结构的一般步骤:

选择一种基础数据结构.
确定基础数据结构中要维护的附加信息.
检验基础数据结构上的基本修改操作能否维护附加信息.
设计一些新操作.

有时扩张数据结构并不是为了设计新操作, 而是利用附加信息来加速已有的操作.

定理14.1(红黑树的扩张) : 设\(f\) 是n个结点的红黑树\(T\) 扩张的属性, 且假设对任意结点\(x\) , \(f\) 的值仅依赖于结点\(x\) , \(x.left\) 和 \(x.right\) 的信息, 还可能包括\(x.left.f\) 和\(x.right.f\) . 那么, 我们可以在插入和删除期间对\(T\) 的所有结点的\(f\) 值进行维护, 并且不影响和两个操作的O(lgn)渐近时间性能.

14.3 区间树

闭区间\([t_1,t_2]\) 可表示成一个对象\(i\) , 其中\(i.low = t_1\) 为低端点, \(i.high = t_2\) 为高端点.

任何两个(闭区间)\(i\) 和\(i^{‘}\) 满足区间三分律:

\(i\) 和\(i^{‘}\) 重叠: \(且i.low \le i^{‘}.high 且 i^{‘}.low \le i.high\) .
\(i\) 在\(i^{‘}\) 左边: \(i.high < i^{‘}.low\) .
\(i\) 在\(i^{‘}\) 右边: \(i^{‘}.high < i.low\) .

对于开区间和半开区间, 三分律依然成立, 只是条件中的取等有变化.

区间树(interval tree) : 一种对动态集合进行维护的红黑树, 其中每个元素\(x\) 都包含一个区间\(x.int\) . 区间树表达集合的具体方式为: 取\(x.int.low\) 为中序遍历(线性序)用的关键字; 每个结点\(x\) 中除了自身区间信息外, 还包含附加信息\(x.max\), 它是以\(x\) 为根的子树中所有区间的端点的最大值.

由于\(x.max = max(x.int.high, x.left.max, x.right.max)\) , 由定理14.1, 插入和删除操作时间为O(lgn).

区间树支持的操作:

interval_insert(T,x): 将包含区间属性int的元素x插入到区间树T中
interval_delete(T,x): 从区间树T中删除元素x
interval_search(T,i): 返回一个指向区间树T中元素x的指针, 使x.int与i重叠. 若此元素不存在则返回T.nil.

interval_search(T,i):
  x = T.root
  # while循环保证寻找方向是对的
  # 即如果存在与i重叠的区间, 则在哪棵子树上找一定可以找到
  while (x != T.nil) and (i does not overlap x.int):
    # 由于x的左子树上的区间的最大端点值比i的低端点大
    # 如果左子树上没有与i重叠的区间,那么可以推出
    # 对右子树上任一区间, 其低端点比i的高端点大
    # 故只能在左子树上找
    if (x.left != T.nil) and (x.left.max >= i.low):
      x = x.left
    # 如果左子树为空, 必然只能在右子树上找
    # 如果左子树上的区间的最大端点值都比i的低端点小, 左子树上也必然没有与i重叠的区间
    else:
      x = x.right
  return x

以上是关于算法导论读书笔记-第十四章-数据结构的扩张的主要内容，如果未能解决你的问题，请参考以下文章