推土机距离到Wassertein距离
Posted 鬼道2022
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了推土机距离到Wassertein距离相关的知识,希望对你有一定的参考价值。
推土机距离(Earth Mover’s Distance)
对于离散概率分布,推土机距离又称为
W
a
s
s
e
r
s
t
e
i
n
\\mathrmWasserstein
Wasserstein距离。如果将不同的概率分布看成不同的沙土堆,则推土机距离就是将一个沙土堆转换成另一个沙土堆所需的最小总工作量。假定有两个离散的概率分布
x
∼
P
r
x\\sim P_r
x∼Pr和
y
∼
P
θ
y\\sim P_\\theta
y∼Pθ,其中每个概率分布都有
l
l
l种可能结果,如下图所示给出的两个概率分布特例
计算推土机距离是一个优化问题,从一个沙土堆到另一个沙土堆无数种方案进沙土传输迁移,所以需要找到一个最佳的传输方案
γ
(
x
,
y
)
\\gamma(x,y)
γ(x,y)。根据上图实例,则需要如下约束条件
∑
x
γ
(
x
,
y
)
=
P
θ
(
y
)
∑
y
γ
(
x
,
y
)
=
P
r
(
x
)
\\left\\\\beginaligned\\sum\\limits_x\\gamma(x,y)=P_\\theta (y)\\\\\\sum\\limits_y\\gamma(x,y)=P_r(x)\\endaligned\\right.
⎩⎪⎪⎪⎨⎪⎪⎪⎧x∑γ(x,y)=Pθ(y)y∑γ(x,y)=Pr(x)
γ
(
x
,
y
)
∈
Π
(
P
r
,
P
θ
)
\\gamma(x,y)\\in \\Pi(P_r,P_\\theta)
γ(x,y)∈Π(Pr,Pθ)为联合概率分布,并且
Π
(
P
r
,
P
θ
)
\\Pi(P_r,P_\\theta)
Π(Pr,Pθ)的边缘分布为
P
r
,
P
θ
P_r,P_\\theta
Pr,Pθ。此时推土机距离为每一个
γ
(
x
,
y
)
\\gamma(x,y)
γ(x,y)乘以
x
x
x到
y
y
y的欧式距离之和的最小值,具体公式为
E
M
D
(
P
r
,
P
θ
)
=
inf
γ
∈
Π
∑
x
,
y
∥
x
−
y
∥
γ
(
x
,
y
)
=
inf
γ
∈
Π
E
(
x
,
y
)
∼
γ
∥
x
−
y
∥
\\mathrmEMD(P_r,P_\\theta)=\\inf\\limits_\\gamma\\in \\Pi\\sum\\limits_x,y\\|x-y\\|\\gamma(x,y)=\\inf\\limits_\\gamma\\in \\Pi\\mathbbE_(x,y)\\sim\\gamma\\|x-y\\|
EMD(Pr,Pθ)=γ∈Πinfx,y∑∥x−y∥γ(x,y)=γ∈ΠinfE(x,y)∼γ∥x−y∥进一步令
Γ
=
γ
(
x
,
y
)
\\Gamma=\\gamma(x,y)
Γ=γ(x,y),
D
=
∥
x
,
y
∥
D=\\|x,y\\|
D=∥x,y∥,其中
Γ
,
D
∈
R
l
×
l
\\Gamma,D\\in \\mathbbR^l\\times l
Γ,D∈Rl×l,则上式可以化简为
E
M
D
(
P
r
,
P
θ
)
=
inf
γ
∈
Π
⟨
D
,
γ
⟩
F
\\mathrmEMD(P_r,P_\\theta)=\\inf\\limits_\\gamma\\in \\Pi\\langle D,\\gamma \\rangle_F
EMD(Pr,Pθ)=γ∈Πinf⟨D,γ⟩F其中
⟨
,
⟩
\\langle , \\rangle
⟨,⟩表示斐波那契内积,即对应元素相乘再相加,矩阵
Γ
\\Gamma
Γ和
D
D
D的热力示意图如下所示
线性规划求解
求解推土机距离中的最优传输方案可以利用线性规划标准型来求解。给定一个向量 x ∈ R n x\\in \\mathbbR^n x∈Rn,线性目标标准型的优化形式如下所示 min x z = c ⊤ x s . t . A x = b x ≥ 0 \\beginarrayrl\\min\\limits_x&z=c^\\topx\\\\\\mathrms.t.&\\left\\\\beginalignedAx&=b\\\\x&\\ge 0\\endaligned\\right.\\endarray xmins.t.z=c⊤xAxx=b≥0其中 c ∈ R n c\\in\\mathbbR^n c∈Rn, A = ∈ R m × n A=\\in \\mathbbR^m\\times n A=∈Rm×n, b ∈ R m b\\in \\mathbbR^m b∈Rm。根据以上实例将推土机距离转化为线性规划标准型,首先将矩阵 Γ \\Gamma Γ和 D D D进行向量化,则有 x = v e c ( Γ ) ∈ R n c = v e c ( D ) ∈ R n \\beginalignedx&=\\mathrmvec(\\Gamma)\\in\\mathbbR^n\\\\c&=\\mathrmvec(D)\\in\\mathbbR^n\\endaligned xc=vec(Γ)∈Rn=vec(D)∈Rn并且有 n = l 2 n=l^2 n=l2,将目标分布进行拼接则有 b = [ P r P θ ] b=\\left[\\beginarraycP_r\\\\P_\\theta\\endarray\\right] b=[Pbean映射推土机的替代品? [关闭]