Druid单机环境安装指南

Posted yinghun

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Druid单机环境安装指南相关的知识,希望对你有一定的参考价值。

1、下载单机环境必备工具

  • 下载druid-0.10.1-bin.tar.gz和tranquility-distribution-0.8.2.tgz插件

    http://druid.io/downloads.html
  • 下载Zookeeper

    http://mirrors.hust.edu.cn/apache/zookeeper/
  • 下载Kafka

    http://mirrors.tuna.tsinghua.edu.cn/apache/kafka/0.11.0.0/kafka_2.11-0.11.0.0.tgz

2、上传解压druid-0.10.1-bin.tar.gz和tranquility-distribution-0.8.2.tgz

  • 解压druid-0.10.1-bin.tar.gz到指定目录,比如:解压到/alidata/agent/目录下

    # tar -zxvf druid-0.10.1-bin.tar.g -C /alidata/agent/
  • 解压tranquility-distribution-0.8.2.tgz到druid-0.10.1目录下

    # tar -zxvf tranquility-distribution-0.8.2.tgz -C /alidata/agent/druid-0.10.1
  • 解压Zookeeper到指定目录,比如:/usr/local/

    tar -zxvf zookeeper-3.4.9.tar.gz -C /usr/local/
  • 解压Kafka到指定目录,比如:/usr/local/

    tar -zxvf kafka_2.11-0.11.0.0.tgz -C /usr/local/

    3、安装配置Zookeeper

  • 重命名Zookeeper配置文件

    zookeeper默认读取zoo.cfg配置文件,因此需重命名zoo_sample.cfg为zoo.cfg

    # mv zoo_sample.cfg zoo.cfg
  • 配置Zookeeper

    # 配置zookeeper数据保存路径
    dataDir=/tmp/zookeeper/data
    
    # 配置zookeeper日志输出路径
    dataLogDir=/tmp/zookeeper/logs
    
    # 配置zookeeper连接端口
    clientPort=2181
  • 启动Zookeeper并查看状态

    // 启动zookeeper
    # bin/zkServer.sh start
    
    // 查看zookeeper状态
    # bin/zkServer.sh status

4、安装配置Kafka

  • 配置Kafka

    # vi config/server.properties
    ---
    # kafka日志输出路径
    log.dirs=/tmp/kafka-logs
    
    # kafka分区数量
    num.partitions=1
    
    # kafka所连接zookeeper地址和端口,多个zookeeper间用英文逗号隔开,比如:"127.0.0.1:3000,127.0.0.1:3001".
    zookeeper.connect=localhost:2181
    
    # kafka连接zookeeper超时时间
    zookeeper.connection.timeout.ms=6000
    ---
  • 启动Kafka并查看状态

    // 启动kafka
    # bin/kafka-server-start.sh config/server.properties &
    
    // 查看kafka状态
    # ps -ef | grep kafka
  • 创建topics推送数据到Druid

    根据Druid中创建的Schema【相当于数据的表结构】来确定需要创建的topic,从而实现将对应topic数据推送到druid中,比如:druid创建了jvm-metrics、request-metrics、server-metrics、jdbc-metrics、sql-metrics等Schema中 的topicPattern属性值对应的就是kafka的topic

    // 创建jvm-metrics主题
    # bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 5 --topic jvm-metrics
    
    // 创建jdbc-metrics主题
    # bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 5 --topic jdbc-metrics
    
    // 创建sql-metrics主题
    # bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 5 --topic sql-metrics
    
    // 创建server-metrics主题
    # bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 5 --topic server-metrics
    
    // 创建request-metrics主题
    # bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 5 --topic request-metrics

5、安装配置Druid

  • 配置Druid

    # vi conf-quickstart/druid/_common/common.runtime.properties
    ---
    # 添加druid kafka插件
    druid.extensions.loadList=["druid-kafka-eight"]
    
    # 配置zookeeper连接,如果zookeeper端口是2181可以不写端口号,多个zookeeper使用英文逗号分隔
    druid.zk.service.host=localhost:12181
    # 配置druid在zookeeper的存储路径
    druid.zk.paths.base=/druid
    ---
  • 初始化Druid

    初始化druid生成log目录和var目录,log目录用于存放日志,var目录主要用于存储分片、分片缓存以及任务等

    # bin/init
  • 启动Druid

    启动Druid脚本不分先后顺序,可以以任何顺序启动Druid各节点

    // 启动历史数据节点
    # java `cat conf-quickstart/druid/historical/jvm.config | xargs` -cp "conf-quickstart/druid/_common:conf-quickstart/druid/historical:lib/*" io.druid.cli.Main server historical
    
    // 启动查询路由聚合节点
    # java `cat conf-quickstart/druid/broker/jvm.config | xargs` -cp "conf-quickstart/druid/_common:conf-quickstart/druid/broker:lib/*" io.druid.cli.Main server broker
    
    // 启动分片管理发布节点
    # java `cat conf-quickstart/druid/coordinator/jvm.config | xargs` -cp "conf-quickstart/druid/_common:conf-quickstart/druid/coordinator:lib/*" io.druid.cli.Main server coordinator
    
    // 启动任务分配节点
    # java `cat conf-quickstart/druid/overlord/jvm.config | xargs` -cp "conf-quickstart/druid/_common:conf-quickstart/druid/overlord:lib/*" io.druid.cli.Main server overlord
    
    // 启动任务执行节点
    # java `cat conf-quickstart/druid/middleManager/jvm.config | xargs` -cp "conf-quickstart/druid/_common:conf-quickstart/druid/middleManager:lib/*" io.druid.cli.Main server middleManager
  • 启动Tranquility-Kafka插件

    Druid创建的Schema中的commit.periodMillis属性值默认为15秒指定了数据推送时间,tranquility-kafka插件将根据数据根据指定时间间隔将从对应kafka中消费的数据推送到Druid中,如果对实时性要求比较高的话,可以根据实际情况修改commit.periodMillis的值,单位为ms。比如druid已经创建jvm-metrics、sql-metrics、server-metrics、request-metrics、jdbc-metrics等五个Schema,启动Tranquility-Kafka插件读取对应Kafka信息推送到Druid中。

    // 进入实时插件目录
    # cd tranquility-distribution-0.8.2/
    
    // 启动实时插件消费对应kafka消息,其中kafka-从通过kafka方式获取数据 -configFile:表示Schema路径
    # bin/tranquility kafka -configFile ../conf/tranquility/kafka/jvm-metrics
    # bin/tranquility kafka -configFile ../conf/tranquility/kafka/sql-metrics
    # bin/tranquility kafka -configFile ../conf/tranquility/kafka/jdbc-metrics
    # bin/tranquility kafka -configFile ../conf/tranquility/kafka/server-metrics
    # bin/tranquility kafka -configFile ../conf/tranquility/kafka/request-metrics

6、Druid数据展示

  • 可视化工具

    目前有许多工具支持Druid数据的展示,目前比较流行的有如下集中工具:

    grafana: grafana的druid插件,比较简陋。

    superset:权限管理完善,图形可定制性也比较高,github持续更新,集合了metabase的Dashboard和pivot的查询可定制性优点,部署相对麻烦。

    pivot:基于Plywood,部署方便,能构造复杂的查询。目前已经闭源了,没法二次开发。

    Metabase:支持数据库种类多,启动方便,支持json查询。图形化查询,只能有一个聚合字段,两个维度。

    如果觉得这些工具不能满足实际需求,也可以自己开发页面进行数据展示。

  • Http方式查询

    Druid支持通过Http方式查询Druid数据,查询参数必须是标准的JSON格式,并且Header必须是Content-Type: application/json,否则无法正常查询数据

    http://localhost:8082/druid/v2/?pretty
    

以上是关于Druid单机环境安装指南的主要内容,如果未能解决你的问题,请参考以下文章

大数据常用软件安装指南

Druid 大数据分析之快速应用(单机模式)

使用minikube创建K8S单机环境-填坑指南

安装-单机

MyCAT安装指南

Druid.io系列:部署