CVR预估模型-ESMM

Posted -柚子皮-

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了CVR预估模型-ESMM相关的知识,希望对你有一定的参考价值。

文章基于 Multi-Task Learning 的思路,提出一种新的CVR预估模型——ESMM,有效解决了真实场景中CVR预估面临的数据稀疏以及样本选择偏差这两个关键问题。 

Motivation

不同于CTR预估问题,CVR预估面临两个关键问题:

1 样本选择偏差(sample selection bias,SSB):传统CVR模型通常以点击数据为训练集,其中点击未转化为负例,点击并转化为正例,但是训练好的模型实际使用时,则是对整个空间的样本进行预估,而非只对点击样本进行预估。即传统的推荐系统仅用Xc(click=1的样本集)中的样本来训练CVR预估模型,但训练好的模型是在整个样本空间X(曝光的)去做推断的。

        由于点击事件相对于曝光事件来说要少很多,因此只是样本空间X的一个很小的子集,从Xc上提取的特征相对于从X中提取的特征而言是有偏的,甚至是很不相同。从而,按这种方法构建的训练样本集相当于是从一个与真实分布不一致的分布中采样得到的,这一定程度上违背了机器学习中独立同分布的假设。这种训练样本从整体样本空间的一个较小子集中提取,而训练得到的模型却需要对整个样本空间中的样本做推断预测的现象称之为样本选择偏差。样本选择偏差会伤害学到的模型的泛化性能。conventional CVR models are trained with samples of clicked impressions while utilized to make inference on the entire space with samples of all impressions

<

以上是关于CVR预估模型-ESMM的主要内容,如果未能解决你的问题,请参考以下文章

CVR预估模型-ESMM

CVR预估模型-ESMM

CVR预估模型-ESMM

CVR预估模型ESMM

CVR预估模型ESMM

多任务学习——SIGIR 2018ESMM