22 友盟项目--sparkstreaming对接kafka集成redis--从redis中查询月留存率
Posted star521
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了22 友盟项目--sparkstreaming对接kafka集成redis--从redis中查询月留存率相关的知识,希望对你有一定的参考价值。
实时存储到redis,更新用户使用时间的最大、最小值--》来求留存率 避免全表扫描问题
1.spark 对接kafka 消费者 解析json
2.concat(appid,‘#‘,appversion,‘#‘,brand,‘#‘,appplatform,‘#‘,devicestyle,‘#‘,ostype,‘#‘,deviceid) ---> 作为key 各个维度
3.选出用户使用app的最小时间戳min , 最大时间戳max -->作为value
4.存储到redis
依赖
<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming_2.11</artifactId> <version>2.1.0</version> </dependency> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming-kafka-0-10_2.11</artifactId> <version>2.1.0</version> </dependency> <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>5.1.17</version> </dependency> <dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifactId> <version>2.9.0</version> </dependency>
以上是关于22 友盟项目--sparkstreaming对接kafka集成redis--从redis中查询月留存率的主要内容,如果未能解决你的问题,请参考以下文章
Spark Streaming实时流处理项目实战Spark Streaming整合Kafka实战一
Spark Streaming实时流处理项目实战Spark Streaming整合Kafka实战一