火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0 (Ⅴ)

Posted 字节跳动数据平台

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0 (Ⅴ)相关的知识,希望对你有一定的参考价值。

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群

 

近日,《火山引擎云原生数据仓库 ByteHouse 技术白皮书》正式发布。白皮书简述了 ByteHouse 基于 ClickHouse 引擎的发展历程,首次详细展现 ByteHouse 的整体架构设计及自研核心技术,为云原生数据仓库发展,及企业数字化转型实战运用提供最新的参考和启迪。

 

以下为 ByteHouse 技术白皮书【多租户管理、运维监控管理】版块摘录。

 

技术白皮书(Ⅰ)(Ⅱ)(Ⅲ)(Ⅳ)精彩回顾:

https://xie.infoq.cn/article/5c9471c7adb58e4bb43b69c4d

https://xie.infoq.cn/article/086b4e706965a6bd81f6a6ff2

https://xie.infoq.cn/article/a0dceef1588fe6c58247d3b37

https://xie.infoq.cn/article/9802a36beb0e82fd989991011

 

ByteHouse 多租户管理

多租户管理架构图

 

ByteHouse 的计算资源、数据资源、作业任务和用户权限都用租户进行隔离,所有的数据对象和资源都在一个租户内部进行管理。

不同的业务团队可以建立各自的租户,按额度申请所需的计算资源,便于进行资源管理和结算。计算资源隔离在租户内部,屏蔽租户之间的资源争抢。

数据库、数据表、视图等对象都在租户内部进行管理和授权,数据安全限制在租户内部。

数据查询、数据导入任务也在各自租户中,增加了任务代码安全性。

多租户管理功能适应了整个企业资源集中统一管理、按需按份额使用、兼顾资源共享和数据安全要求,同时可以为 SaaS 应用提供支撑,能按需为新用户申请资源,做到即开即用,又能满足不同用户资源和数据隔离性需求,实现一套系统服务所有用户。

ByteHouse 运维监控管理

ByteHouse 的私有化部署版本包含一个可视化的资源监控和管理平台,提供资源、负载监控仪表盘,直观地展现集群整体状况,同时提供租户管理、报警监控、审计日志、扩缩容、系统升级、故障节点替换等核心功能,让运维人员通过白屏化操作,降低运维成本和操作风险。

集群管理维护模块包括对物理资源的配置、节点重启、故障节点一键替换、滚动升级、滚动重启等功能,实现可视化运维管理。

通过仪表板对集群健康度进行宏观监控,集群资源饱和度监控能实时查看存储计算的当前应用情况和增长趋势,方便进行扩缩容;节点健康度监控能实时监控节点实时的响应情况;集群负载监控能实时反应集群总体负载水位;提供 Grafana 对各个组件运行状态进行细粒度监控。

运维监控模块示意图

 

监控报警模块提供与第三方报警平台对接能力,支持对 CPU、内存、存储资源使用量指标、技术组件健康度指标、计算任务状态指标、集群负载和性能指标进行监控,并通过短信、电话等方式通知值班员。

点击链接,立即下载完整版白皮书

ByteHouse技术白皮书正式发布,云数仓核心技术能力首次全面解读(内附下载链接)

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群

 近日,《火山引擎云原生数据仓库 ByteHouse 技术白皮书》正式发布。

在数字化浪潮下,伴随着公有云的广泛普及,生于云、长于云、基于云原生架构的数据仓库百花齐放,快速迭代。相比起传统数仓,云原生数据仓库凭借更灵活、更具弹性化的特性,以及有效降低资源、人力成本的能力,在云市场上受到越来越多的关注,逐渐成为企业数字化基础设施中的关键“底座”。

《火山引擎云原生数据仓库 ByteHouse 技术白皮书》简述了 ByteHouse 基于 ClickHouse 引擎的发展历程,首次详细展现 ByteHouse 的整体架构设计及自研核心技术,为云原生数据仓库发展,及企业数字化转型实战运用提供最新的参考和启迪。

三“高”一“低”:ByteHouse 核心技术能力全面解读

ClickHouse 作为近年来快速崛起的 OLAP 数据库管理系统,以其优异的查询性能引人瞩目, 在全球及国内众多大厂得到了大量的推广及应用。

云原生数据仓库 ByteHouse,经过多年字节跳动内部经验沉淀,对开源 ClickHouse 引擎实现了大量技术架构重构和优化,并通过火山引擎对外服务。在字节跳动内部,ByteHouse 部署规模已超过 1 万 8000 台,单集群超过 2400 台,经过数百个应用场景和数万用户锤炼,并在多个外部企业客户中得到推广应用。

《火山引擎云原生数据仓库 ByteHouse 技术白皮书》共分为五个章节,详细介绍了 ByteHouse 产品简介、技术趋势挑战、整体架构设计、核心技术解析、未来总结展望等技术内容。

本次发布的 ByteHouse 技术白皮书,在内容上进一步聚焦于 ByteHouse 自身先进技术及实力优势,深度剖析 ByteHouse 在企业级数据仓库场景下的业务需求和挑战;在整体架构及核心技术层面,完整呈现 ByteHouse 引擎不同层级及执行流程,详细解析元数据管理、自研表引擎、复杂查询执行模型等 ByteHouse 自研核心技术。

"高性能、高资源利用率、高稳定性、低运维成本"——是 ByteHouse 海量数据实时接入、无限扩展存储、实时合并计算和关联聚合查询等多个核心能力的最佳解读。

图:ByteHouse 适用场景

目前,ByteHouse 不断以字节和外部最佳实践输出给行业用户,帮助企业更好地构建交互式大数据分析平台和云原生数据仓库。中国地震台网中心、海王集团等已与火山引擎 ByteHouse 达成合作,率先通过海量数据实时分析的极速体验,辅助决策落地,加速业务洞察,实现自身数字化升级的进一步加速。

点击链接,立即下载完整白皮书

以上是关于火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0 (Ⅴ)的主要内容,如果未能解决你的问题,请参考以下文章

火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0 (Ⅴ)

火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0(中)

助力企业数据飞轮转起来!火山引擎云原生数仓ByteHouse全面大促中

ByteHouse技术白皮书正式发布,云数仓核心技术能力首次全面解读(内附下载链接)

从 ClickHouse 到 ByteHouse:实时数据分析场景下的优化实践

火山引擎云原生 | 码出未来,向你致敬!