将word2vec思想拓展到序列item的2vec方法并运用到推荐系统中,实质上可以认为是一种cf
在word2vec中,doc中的word是具有序列关系的,优化目标类似在max对数似然函数
应用在item2vec上,可以有两种看待方式:
(1)如果item是强时序关系的,那么对某一次序列中的item,可以看成doc中的word,对其进行word2vec
(2)如果item是set-based,不用考虑时序,那么可能需要对word2vec进行变形
论文中对第二种情况进行了描述,有两种变形方式
(1)改变滑动窗口,不再使用定长c,还是根据set的size灵活变化(也就是对整个set里的word进行两两组合成样本)
(2)在训练过程中对每个set随机shuffle
论文中使用的两个数据集,一是用户收听的音乐歌手数据,一个是订单以及其中goods的数据
在推荐上,可以是用户一次浏览序列里面的item,用户豆列里的item,等等
可以看到word2vec在构建集合内item关系时很有用处
参考: