A Probabilistic Formulation of Unsupervised Text Style Transfer

Posted Facico

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了A Probabilistic Formulation of Unsupervised Text Style Transfer相关的知识,希望对你有一定的参考价值。

A Probabilistic Formulation of Unsupervised Text Style Transfer

无监督的问题转化

X = x ( 1 ) , x ( 2 ) , … , x ( m ) X=\\x^(1), x^(2),\\dots,x^(m)\\ X=x(1),x(2),,x(m)是领域 D 1 D_1 D1的数据, Y = y ( m + 1 ) , y ( m + 2 ) , … , y ( n ) Y=\\y^(m+1), y^(m+2),\\dots,y^(n)\\ Y=y(m+1),y(m+2),,y(n)是领域 D 2 D_2 D2的数据,相同的上标表示平行语句

考虑引入latent sentence将其补成平行语料库,设 X ˉ = x ˉ ( m + 1 ) , x ˉ ( m + 2 ) , … , x ˉ ( n ) \\barX=\\\\barx^(m+1), \\barx^(m+2),\\dots,\\barx^(n)\\ Xˉ=xˉ(m+1),xˉ(m+2),,xˉ(n) D 1 D_1 D1的latent部分。 Y ˉ = y ˉ ( 1 ) , y ˉ ( 2 ) , … , y ˉ ( m ) \\barY=\\\\bary^(1), \\bary^(2),\\dots,\\bary^(m)\\ Yˉ=yˉ(1),yˉ(2),,yˉ(m) D 2 D_2 D2的latent部分。

现在任务目标就变成从 X , Y X,Y X,Y推测 X ˉ , Y ˉ \\bar X, \\bar Y Xˉ,Yˉ,也就是 p ( y ˉ ∣ x ) , p ( x ˉ ∣ y ) p(\\bar y|x),p(\\bar x|y) p(yˉx),p(xˉy)

概率模型

直接学习 p ( y ˉ ∣ x ) , p ( x ˉ ∣ y ) p(\\bar y|x),p(\\bar x|y) p(yˉx),p(xˉy)是很困难的,所以改成求联合概率 p ( X , Y , X ˉ , Y ˉ ) p(X,Y,\\barX,\\barY) p(X,Y,Xˉ,Yˉ)
因为我们的句子都要从latent层来生成,所以有
p ( X , Y , X ˉ , Y ˉ ) = ( ∏ i = 1 m p ( x ( i ) ∣ y ˉ ( i ) ; θ x ∣ y ˉ ) p D 2 ( y ˉ ( i ) ) ) ( ∏ j = m + 1 n p ( y ( j ) ∣ x ˉ ( j ) ; θ y ∣ x ˉ ) p D 1 ( x ˉ ( j ) ) ) p(X,Y,\\barX,\\barY) = \\left(\\prod\\limits_i=1^m p(x^(i)|\\bary^(i);\\theta_x|\\bary)p_\\mathcalD_2(\\bary^(i))\\right) \\left(\\prod\\limits_j=m+1^n p(y^(j)|\\barx^(j);\\theta_y|\\barx)p_\\mathcalD_1(\\barx^(j))\\right) p(X,Y,Xˉ,Yˉ)=(i=1mp(x(i)yˉ(i);θxyˉ)pD2(yˉ(i)))(j=m+1np(y(j)xˉ(j);θyxˉ)pD1(xˉ(j)))