Apache Kylin的入门安装

Posted 2022-12-14 魏大宾

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Apache Kylin的入门安装相关的知识，希望对你有一定的参考价值。

在hadoop启动时，要启动JobHistoryServer，否则kylin会出现各种各样的异常。

Apache Kylin™是一个开源的分布式分析引擎，提供Hadoop之上的SQL查询接口及多维分析（OLAP）能力以支持超大规模数据，最初由eBay Inc. 开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。

从官网的介绍来看Kylin是一个OLAP的数据查询引擎，其特点就是快。公司最近准备引入Kylin做数据分析，原来也听说过但一直没有接触，现在正好可以验证下Kylin是否是传说中那么NB，今天我们先来看看如何安装部署Kylin。

由于Kylin本身只是一个Server，所以安装部署还是比较简单的，但是它的前提要求是Hadoop，Hive，Hbase必须已经安装而且能正常工作，在这里关于Hadoop生态的一些框架的安装部署就不再重复写了，有兴趣的可以看我以前的博文。

下面来看下一些基础软件的版本：

Hadoop2.7.2
Hive2.1.1
Hbase1.2.0
Zookeeper3.4.8
Kylin2.0.0

在这里假设你的Hadoop，Hive，Hbase都已经安装成功并能正常运行。

然后去Kylin官网下载对应的kylin版本，链接如下： http://kylin.apache.org/cn/download/

下载的具体版本是： apache-kylin-2.0.0-bin-hbase1x.tar.gz

下载成功后，解压到根目录，然后重命名目录为kylin并在.bash_profile 文件中，配置kylin的环境变量：

export KYLIN_HOME=/home/search/kylin
export CLASSPATH=$CLASSPATH:$KYLIN_HOME/lib
export PATH=$KYLIN_HOME/bin:$PATH

然后执行bin/check-env.sh 脚本，检查环境变量是否有缺失的，校验通过之后，可以执行如下脚本启动：

bin/kylin.sh start // 启动

bin/kylin.sh stop // 停止

这里需要注意一点，Kylin当前最新的版本只支持spark1.6.0的版本，原来我的机器中，安装了一个spark2.0的版本，导致启动kylin失败，终端仅仅输出spark assembly lib not found这个提示信息，别的什么也没有，导致我误以为我编译的spark有问题，后来我将我的spark移除，重新启动kylin才成功，另外一个注意的地方是Hadoop的mr-jobhistory-daemon.sh 进程也要启动起来。

启动成功之后，访问地址：http://hostname:7070/kylin（kylin的启动过程感觉有点慢，差不多1分钟之后，在访问这个地址基本能生效）

并输入默认的用户名和密码：ADMIN / KYLIN 成功登录之后，看到下面的页面，就代表安装部署成功了。

以上是关于Apache Kylin的入门安装的主要内容，如果未能解决你的问题，请参考以下文章