Linux安装DataHub (开源元数据管理工具)

Posted bluishglc

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux安装DataHub (开源元数据管理工具)相关的知识,希望对你有一定的参考价值。

1. 前置条件

系统已经安装Python 3.7+

2. 安装命令

2.1 安装Docker & JQ

sudo yum -y install docker jq
sudo systemctl enable docker
sudo systemctl start docker
# 检查docker服务是否正常启动
systemctl status docker

2.2 创建docker组并将当前用户加入其中

创建docker组并将当前用户加入其中,否则当前用户无权调用docker命令,后续datahub docker quickstart命令将失败。

sudo groupadd docker
sudo usermod -aG docker $USER
# 检查当前用户是否可以使用docker
docker run hello-world

参考: https://www.digitalocean.com/community/questions/how-to-fix-docker-got-permission-denied-while-trying-to-connect-to-the-docker-daemon-socket

2.3 安装Docker Compose (V2)

mkdir -p ~/.docker/cli-plugins
curl -sSL https://github.com/docker/compose/releases/download/v2.12.2/docker-compose-$(uname -s)-$(uname -m) -o ~/.docker/cli-plugins/docker-compose
chmod +x ~/.docker/cli-plugins/docker-compose
# 检查安装是否正确
docker compose version

参考:https://www.rockyourcode.com/how-to-install-docker-compose-v2-on-linux-2021/

2.4 安装DataHub

python3 -m pip install --upgrade pip wheel setuptools
python3 -m pip uninstall datahub acryl-datahub || true  # sanity check - ok if it fails
python3 -m pip install --upgrade acryl-datahub
datahub version
datahub docker quickstart

3. 常见错误

3.1 datahub docker quickstart启动失败

[user]$ datahub docker quickstart
No ~/.datahubenv file found, generating one for you...
Unable to run quickstart:
- Docker doesn't seem to be running. Did you start it?

使用docker ps -a检查docker服务,输出如下:

Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock: Get "http://%2Fvar%2Frun%2Fdocker.sock/v1.24/containers/json?all=1": dial unix /var/run/docker.sock: connect: permission denied

原因:没有赋予当前用户使用docker的权限

3.2 datahub docker quickstart报错

unknown shorthand flag: 'f' in -f

原因:没有安装Docker Compose (V2),必须是v2版本!

以上是关于Linux安装DataHub (开源元数据管理工具)的主要内容,如果未能解决你的问题,请参考以下文章

一站式元数据治理平台——Datahub

元数据管理Datahub架构讲解

Logstash + DataHub + MaxCompute/StreamCompute 进行实时数据分析

EasyCV DataHub 提供多领域视觉数据集下载,助力模型生产

在阿里云用Flink Sql同步polardb数据到hbase

startersspringboot-starter整合阿里云datahub