推荐系统主要架构图

Posted 合格的程序猿

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了推荐系统主要架构图相关的知识,希望对你有一定的参考价值。

推荐系统主要模块如下图所示(以视频推荐为例):

1. Router (Gateway)

推荐系统的入口服务,主要职责为:

  • 加载 User Profile 数据

  • 请求 Leaf Server 获取推荐结果

  • 请求 Video Server 完善视频信息

  • 产生推荐日志。

2. Leaf Server

推荐系统的主要“调度者”,主要功能为:

  • 视频检索(retrieval):从各种索引中检索大量的候选视频

  • 请求粗排服务(rough ranking)

  • 请求精排服务(full ranking)

  • 进行多样性打散(variety)

3.Ranking Predictor

推荐系统的算法核心,一般分为两个Server,分别由 Leaf Server请求:

  • 粗排服务:利用轻量级的模型对大量视频进行排序,然后返回头部的少量作品,比如输入5000个视频,返回top 1000;

  • 精排服务:使用比较复杂的模型对粗排返回的少量视频进行准确的排序,产生最终的排序得分;

4. Data Sink

数据落盘:通过使用 Kafka、HDFS 等手段,把 Router 拼接的推荐日志数据进行持久化,日志信息主要包括请求上下文、用户画像、推荐结果信息等。

5. Model Training

使用落盘的推荐日志对模型进行训练,然后把训练的模型推送给 predictor 主要分为两类场景:

  • 离线调研:主要使用 HDFS 上的数据进行训练

  • 线上模型:根据实时性要求选择 Kafka 或者 HDFS 上的数据进行训练


个人初步总结,可能有不完善的地方,如有高见,欢迎评论指出。

相关文章






以上是关于推荐系统主要架构图的主要内容,如果未能解决你的问题,请参考以下文章

电影推荐系统(037~039)

《推荐系统实践》 5. 推荐系统实例

离线数据分析流程及推荐系统架构图

推荐系统架构(摘自《推荐系统实践》)

各大公司推荐系统的架构概览

推荐系统架构图——我的软件工程概论课设