逆向倾向评分 (Inverse Propensity Scoring, IPS) 原理解析与MF算法的结合使用
Posted 白水baishui
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了逆向倾向评分 (Inverse Propensity Scoring, IPS) 原理解析与MF算法的结合使用相关的知识,希望对你有一定的参考价值。
当历史交互数据为MCAR(Missing Completely At Random,完全随机缺失)时,评级预测损失函数可以定义为:
L
o
s
s
N
a
i
v
e
=
1
∣
(
u
,
i
)
:
o
u
,
i
=
1
∣
∑
(
u
,
i
)
:
o
u
,
i
=
1
δ
u
,
i
(
Y
,
Y
^
)
\\mathcalLoss_Naive=\\frac1|\\(u,i):o_u,i=1\\|\\sum_(u,i):o_u,i=1\\delta_u,i(Y,\\hatY)
LossNaive=∣(u,i):ou,i=1∣1(u,i):ou,i=1∑δu,i(Y,Y^)其中,
Y
^
\\hatY
Y^表示预测的评级;
Y
Y
Y 表示
u
u
u 对
i
i
i 的实际评级;
o
u
,
i
=
1
o_u,i=1
ou,i=1 表示
u
u
u 对
i
i
i 有评级;
∣
(
u
,
i
)
:
o
u
,
i
=
1
∣
|\\(u,i):o_u,i=1\\|
∣(u,i):ou,i=1∣ 表示所有被浏览项目的数量;
δ
u
,
i
(
Y
,
Y
^
)
\\delta_u,i(Y,\\hatY)
δu,i(Y,Y^) 表示
Y
Y
Y 与
Y
^
\\hatY
Y^ 之间匹配程度的度量,可以定义为:
δ
u
,
i
M
S
E
(
Y
,
Y
^
)
=
(
y
u
,
i
−
y
^
u
,
i
)
2
\\delta^MSE_u,i(Y,\\hatY)=(y_u,i-\\haty_u,i)^2
δu,iMSE(Y,Y^)=(yu,i−y^u,i)2
δ
u
,
i
M
A
E
(
Y
,
Y
^
)
=
∣
y
u
,
i
−
y
^
u
,
i
∣
\\delta^MAE_u,i(Y,\\hatY)=|y_u,i-\\haty_u,i|
δu,iMAE(Y,Y^)=∣yu,i−y^u,i∣
但是历史记录往往是MNAR(Missing Not At Random,非随机缺失)的,那么整体评级预测损失就是有偏的:
E
[
L
o
s
s
N
a
i
v
e
]
=
1
∑
u
=
1
N
∑
i
=
1
M
p
(
o
u
,
i
=
1
)
∑
u
=
1
N
∑
i
=
1
M
p
(
o
u
,
i
=
1
)
δ
u
,
i
(
Y
,
Y
^
)
≠
1
N
⋅
M
∑
u
=
1
N
∑
i
=
1
M
δ
u
,
i
(
Y
,
Y
^
)
\\beginaligned \\mathbbE[\\mathcalLoss_Naive] & = \\frac1\\sum^N_u=1\\sum^M_i=1p(o_u,i=1)\\sum^N_u=1\\sum^M_i=1p(o_u,i=1)\\delta_u,i(Y,\\hatY) \\\\ & \\neq \\frac1N\\cdot M\\sum^N_u=1\\sum^M_i=1\\delta_u,i(Y,\\hatY) \\\\ \\endaligned
E[LossNaive]=∑u=1N∑i=1Mp(ou,i=1)1u=1∑Ni=1∑Mp(ou,i=1)δu,i(Y,Y^)=N⋅M1u=1∑Ni=1∑Mδu,i(Y,Y^)其中,
p
(
o
u
,
i
=
1
)
p(o_u,i=1)
p(ou,i=1) 是指
u
u
u 浏览
i
i
i 的概率;
1
N
⋅
M
∑
u
=
1
N
∑
i
=
1
M
δ
u
,
i
(
Y
,
Y
^
)
\\frac1N\\cdot M\\sum^N_u=1\\sum^M_i=1\\delta_u,i(Y,\\hatY)
N⋅M1∑u=1N∑i=1Mδu,i(Y,Y^) 指的是所有
u
u
u 对所有
i
i
i 平均评分损失,它是一种算术平均;
E
[
L
o
s
s
N
a
i
v
e
]
\\mathbbE[\\mathcalLoss_Naive]
E[LossNaive< 以上是关于逆向倾向评分 (Inverse Propensity Scoring, IPS) 原理解析与MF算法的结合使用的主要内容,如果未能解决你的问题,请参考以下文章 逆向倾向评分 (Inverse Propensity Scoring, IPS) 原理解析与MF算法的结合使用 模仿学习:逆向强化学习(Inverse Reinforcement Learning, IRL) 词频-逆向文件频率TF-IDF(term frequency–inverse document frequency)是什么?有什么用处?