22 友盟项目--sparkstreaming对接kafka集成redis--从redis中查询月留存率

Posted star521

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了22 友盟项目--sparkstreaming对接kafka集成redis--从redis中查询月留存率相关的知识,希望对你有一定的参考价值。

 实时存储到redis,更新用户使用时间的最大、最小值--》来求留存率  避免全表扫描问题
1.spark 对接kafka 消费者   解析json  
2.concat(appid,‘#‘,appversion,‘#‘,brand,‘#‘,appplatform,‘#‘,devicestyle,‘#‘,ostype,‘#‘,deviceid) ---> 作为key  各个维度
3.选出用户使用app的最小时间戳min , 最大时间戳max  -->作为value
4.存储到redis
 
依赖
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-streaming_2.11</artifactId>
            <version>2.1.0</version>
        </dependency>

        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-streaming-kafka-0-10_2.11</artifactId>
            <version>2.1.0</version>
        </dependency>

        <dependency>
            <groupId>mysql</groupId>
            <artifactId>mysql-connector-java</artifactId>
            <version>5.1.17</version>
        </dependency>

        <dependency>
            <groupId>redis.clients</groupId>
            <artifactId>jedis</artifactId>
            <version>2.9.0</version>
        </dependency>

 

 
 
 
 
 
 
 
 

以上是关于22 友盟项目--sparkstreaming对接kafka集成redis--从redis中查询月留存率的主要内容,如果未能解决你的问题,请参考以下文章

Spark Streaming实时流处理项目实战Spark Streaming整合Kafka实战一

Spark Streaming实时流处理项目实战Spark Streaming整合Kafka实战一

Spark Streaming实时流处理项目实战Spark Streaming整合Kafka实战一

使用友盟分享的步骤

02.友盟项目--原始日志数据生成

spark streaming 对接kafka记录