Kafka 用户日志上报实时统计之分析与设计
Posted pony1223
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Kafka 用户日志上报实时统计之分析与设计相关的知识,希望对你有一定的参考价值。
一、项目整体概述
- 简述项目的背景
背景:
用户行迹
企业运营
- 分析项目的目的
通过对项目的分析,可以初步得到以下目的:
•实时掌握用户动态
•根据实时统计结果,适度推广
•统计分析效果,快速合理的调整
二、Producer 模块分析
- 分析生产数据来源
在用户上报日志中,每条日志记录代表用户的一次活动状态,示例数据如下:
121.40.174.237 yx12345 [21/July/2015 13:25:45 +0000] chrome
appid_5 "http://www.***.cn/sort/channel/2085.html"
示例数据所包含的信息量,如下图所示:
![技术分享图片](https://image.cha138.com/20210729/b0bee8d93d83482a825e018eb5a6aef6.jpg)
- Flume 到 Kafka 流程分析
数据源生产流程分析,如下图所示:
![技术分享图片](https://image.cha138.com/20210729/402431cc68434d059f619c786b554f20.jpg)
三、Consumer 模块分析
- 消费数据来源分析
消费数据源统计的KPI指标,如下图所示:
![技术分享图片](https://image.cha138.com/20210729/8d934690518f4b49ba9837acdef9177c.jpg)
- Kafka 到 Storm 流程分析
数据源消费流程分析,如下图所示:
![技术分享图片](https://image.cha138.com/20210729/4428f98eaf964a8e963fefd025105e7b.jpg)
四、项目整体设计
1.项目详细设计流程
项目详细设计流程,如下图所示:
2.KPI 指标设计
KPI 指标设计,如下图所示:
![技术分享图片](https://image.cha138.com/20210729/3080239106dd40dfb1a63871a31d1a9b.jpg)
本节我们项目进行了整体分析,并指导大家去分析 Kakfa 的 Producer 模块和 Consumer 模块,以及帮助大家去设计项目的开发流程等知识,应该掌握以下知识:
•项目的背景和目的
•分析 Producer 模块和 Consumer 模块
•项目的整体开发流程
•KPI 指标的设计
以上是关于Kafka 用户日志上报实时统计之分析与设计的主要内容,如果未能解决你的问题,请参考以下文章