应用运筹学基础：组合优化 - 一类问题的贪心解法

Posted 2020-10-17 TsReaper

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了应用运筹学基础：组合优化 - 一类问题的贪心解法相关的知识，希望对你有一定的参考价值。

这一节课讲解了被称为独立系统的一类问题，以及用贪心解决独立系统问题的近似比。

独立系统

考虑一个有限元素集合 $E$，给 $E$ 中的每个元素 $e$ 定义一个非负的费用 $c(e)$。再考虑 $\mathcal{F} \in 2^E$，那么对于 $F \in \mathcal{F}$，我们定义 $F$ 的费用 $c(F) = \sum\limits_{e \in F} c(e)$。现在我们要找出一个 $F$，使得 $c(F)$ 最大（或最小）。这就是这节课我们需要考虑的一类问题。

独立系统

从这类问题中，我们引入独立系统的概念。对于一个二元组 $(E, \mathcal{F})$，若 $\forall Y \in \mathcal{F}$，$X \subseteq Y \to X \in \mathcal{F}$，那么我们称 $(E, \mathcal{F})$ 为独立系统。由这个定义我们马上推出，$\emptyset \in \mathcal{F}$。

独立集与相关集

在独立系统 $(E, \mathcal{F})$ 中，$\mathcal{F}$ 中的元素称为独立集，$E - \mathcal{F}$ 中的元素称为相关集。

基与圈

我们将 $\mathcal{F}$ 中的极大独立集称为基，将 $E - \mathcal{F}$ 中的极小相关集称为圈。

对于 $X \subseteq E$，定义 $X$ 上的基为 $X$ 中的极大独立集。

秩商

对于 $X \subseteq E$，$X$ 中的基大小可能不同。我们定义 $X$ 的秩 $r(X)$ 为 $X$ 中最大的基的大小，类似地定义 $X$ 的下秩 $\rho(X)$ 为 $X$ 中最小的基的大小。

由此定义独立系统的秩商 $q(E, \mathcal{F}) = \min\limits_{x \subseteq E} \quad \frac{\rho(X)}{r(X)}$。秩商是一类问题中贪心解法近似比的下界，下面会进行说明。

一类最大（小）化问题

根据独立系统的定义，我们引出一类最大（小）化问题。

最大化问题：给出一个独立系统 $(E, \mathcal{F})$，找出一个 $F \in \mathcal{F}$，使得 $c(F)$ 最大。

很显然，由于每个元素的费用都是非负的，所以 $|F|$ 越大，$c(F)$ 也越大。所以最优的 $F$ 一定是基。

最小化问题：给出一个独立系统 $(E, \mathcal{F})$，找出一个 $F \in \mathcal{F}$，使得 $F$ 是基，且 $c(F)$ 最小。

（如果不要求 $F$ 是基，那么取 $F = \emptyset$ 就会让代价最小，没什么意义...）

最大化问题的实例有很多。

0-1 背包问题：$E$ 中的元素是每个物品，$\mathcal{F}$ 中的元素是所有可以放进背包的物品集合，费用就是物品的价值。

最大权独立集：$E$ 中的元素是点，$\mathcal{F}$ 中的元素是独立集，费用就是每个点的权值。

最长简单路径：$E$ 中的元素是边，$\mathcal{F}$ 中的元素是所有从起点到终点的简单路径以及其子集，费用就是每条边的距离。

最大权森林：$E$ 中的元素是边，$\mathcal{F}$ 中的元素是所有不含圈的边集，费用就是每条边的权值。

最小化问题也有很多实例。

最小生成树：$E$ 中的元素是边，$\mathcal{F}$ 中的元素是所有不含圈的边集，费用就是每条边的权值。

最短路：$E$ 中的元素是边，$\mathcal{F}$ 中的元素是所有从起点到终点的简单路径以及其子集，费用就是每条边的距离。

旅行商问题（TSP）：$E$ 中的元素是边，$\mathcal{F}$ 中的元素是哈密尔顿回路及其子集，费用就是每条边的距离。

拟阵

拟阵（matroid）是一个特殊的独立系统。一个独立系统需要满足以下三个条件中的一个才被称为是拟阵（事实上以下三个条件等价）：

(1) 若 $X, Y \in \mathcal{F}$，且 $|X| > |Y|$，则 $\exists e \in X - Y$，$Y \cup \{e\} \in \mathcal{F}$；

(2) 若 $X, Y \in \mathcal{F}$，且 $|X| = |Y| + 1$，则 $\exists e \in X - Y$，$Y \cup \{e\} \in \mathcal{F}$；
(3) $\forall X \subseteq E$，$X$ 的所有基大小相同。

接下来说明这三个条件等价。

(1) 推出 (2) 是显然的，(2) 推出 (1) 使用归纳法即可。

(1) → (3)：假设存在 $X, Y \in \mathcal{F}$，$X$ 与 $Y$ 都是基，且 $|X| > |Y|$。那么 $\exists e \in X - Y$，$Y \cup \{e\} \in \mathcal{F}$，说明 $Y$ 不是基。矛盾。
(3) → (1)：假设存在 $X, Y \in \mathcal{F}$，$|X| > |Y|$，且 $\forall e \in X - Y$，$Y \cup \{e\} \not\in \mathcal{F}$，那么说明 $Y$ 是基。由于 $X$ 是独立集，存在一个基 $Z$ 使得 $|Z| \ge |X| > |Y|$，那么有两个基 $Y$ 与 $Z$ 大小不同。矛盾。

我们另外定义 $\mathcal{F}^* = \{F \subseteq E \quad | \quad \exists (E, \mathcal{F}) \text{ 的基 } B, F \cap B = \emptyset\}$。

很容易发现，$(E, \mathcal{F}^*)$ 也是独立系统。我们称 $(E, \mathcal{F})$ 与 $(E, \mathcal{F}^*)$ 互为对偶。

下面证明 $F \in \mathcal{F}^{**} \to F \in \mathcal{F}$：

首先，由 $F \in \mathcal{F}^{**}$ 可以推出 $\exists (E, \mathcal{F^*}) \text{ 的基 } B_1, F \cap B_1 = \emptyset$。

又可以推出 $\exists (E, \mathcal{F}) \text{ 的基 } B_2, B_1 \cap B_2 = \emptyset$。

注意到 $B_1 \cup B_2 = E$，否则我们可以从 $E - (B_1 \cup B_2)$ 中选出一个元素加入 $B_1$，仍有 $B_1 \cap B_2 = \emptyset$，那 $B_1$ 就不是基了。

既然 $B_1 \cup B_2 = E$，且 $F \cap B_1 = \emptyset$，那么只能有 $F \subseteq B_2$。根据独立系统的定义，有 $F \in \mathcal{F}$。

反过来也是成立的，证明类似就略去。

两类贪心算法

下面介绍两类贪心算法，分别用于独立系统的最大化和最小化问题。

Best in：将 $E$ 中所有元素按费用从大到小排序，使得 $c(e_1) \ge c(e_2) \ge ... \ge c(e_n)$。一开始令 $F = \emptyset$，按 $e_1, e_2 \dots, e_n$ 的顺序考虑，若 $e_i$ 加入 $F$ 后 $F$ 仍是独立集那就加入。这个贪心算法用于解决最大化问题。

Worst out：将 $E$ 中所有元素按费用从大到小排序，使得 $c(e_1) \ge c(e_2) \ge ... \ge c(e_n)$。一开始令 $F = E$，按 $e_1, e_2 \dots, e_n$ 的顺序考虑，若把 $e_i$ 从 $F$ 中去掉后 $F$ 还含有至少一个基那就去掉。这个贪心算法用于解决最小化问题。

接下来介绍重要的 Best in 定理：设 $G(E, \mathcal{F})$ 表示 best in 贪心得到的解，$\text{OPT}(E, \mathcal{F})$ 表示最优解，则 $$q(E, \mathcal{F}) \le \frac{G(E, \mathcal{F})}{\text{OPT}(E, \mathcal{F})} \le 1$$ 从这个定理可以看出，如果一个独立系统是拟阵，那么用 best in 得到的最大化问题的解一定是最优解。

下面证明 Best in 定理：

首先定义 $E_j = \{e_1, e_2, \dots, e_n\}$，$G_n$ 是 best in 贪心选中元素的集合，$O_n$ 是最优解选中元素的集合。令 $G_j = E_j \cap G_n$ 表示 best in 贪心在考虑 $e_j$ 之后选择了哪些元素，$O_j = E_j \cap O_n$ 表示最优解在考虑 $e_j$ 之后选择了哪些元素。记 $d_j = c(e_j) - c(e_{j+1})$ 以及 $d_n = c(e_n)$，那么 $$\begin{matrix} c(G_n) & = & \sum\limits_{j=1}^n(|G_j| - |G_{j-1}|)c(e_j) \\ & = & \sum\limits_{j=1}^n|G_j|d_j \\ & \ge & \sum_{j=1}^n \rho(E_j)d_j & \text{（因为容易证明 } G_j \text{ 是 } E_j \text{ 的一个极大独立集）} \\ & \ge & q(E, \mathcal{F})\sum\limits_{j=1}^n r(E_j)d_j & \text{（根据秩商的定义）} \\ & \ge & q(E, \mathcal{F})\sum\limits_{j=1}^n |O_j|d_j \\ & = & q(E, \mathcal{F})c(O_n) \end{matrix}$$ 这就证明了 Best in 定理。

可以举一个例子说明 Best in 定理的下界是紧的：根据秩商的定义，$\exists X \subset E$，$X$ 的基 $B_1$ 和 $B_2$ 满足 $\frac{|B_1|}{|B_2|} = q(E, \mathcal{F})$。我们定义 $$c(e) = \begin{cases} 1 & e \in X \\ 0 & e \not\in X \end{cases}$$ 然后把 $B_1$ 中的元素排在前面形成 $e_1, e_2, \dots, e_{|B_1|}$，后面随便排。如果使用 best in 贪心，就会把前面 $|B_1|$ 个元素选走，然而最优解可以选 $|B_2|$ 个元素。

另外还有两个奇怪的定理，上课提了一下...

Worst out 定理：使用 worst out 贪心得到的解满足 $$1 \le \frac{G(E, \mathcal{F})}{\text{OPT}(E, \mathcal{F})} \le \max\limits_{F \subseteq E} \quad \frac{|F| - \rho^*(F)}{|F| - r^*(F)}$$ 其中 $\rho^*(F)$ 表示对偶独立系统中的下秩，$r^*(F)$ 表示对偶独立系统中的秩。

$n$ 个拟阵的交：$n$ 个拟阵的交，用贪心得到的解近似比为 $\frac{1}{n}$。

以上是关于应用运筹学基础：组合优化 - 一类问题的贪心解法的主要内容，如果未能解决你的问题，请参考以下文章

应用运筹学基础：组合优化 - 近似算法选讲

深度强化学习的组合优化研究进展

7.2 贪心基础

应用运筹学基础：线性规划

求大神给个数学排列组合的各种题型以及解法，本人数学渣渣，如果我数学真能提高上去，我会内牛满面的^ω

最优化理论基础