无惧百万级并发,GaussDB(for Cassandra)让华为推送服务更快触达
Posted 华为云开发者社区
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了无惧百万级并发,GaussDB(for Cassandra)让华为推送服务更快触达相关的知识,希望对你有一定的参考价值。
摘要:推送服务(Push Kit)是华为提供的消息推送平台,建立了从云端到终端的消息推送通道。通过集成推送服务,您可以向客户端应用实时推送消息,让应用更精准触达用户,是开发者提升用户感知度和活跃度的一件利器。
本文分享自华为云社区《无惧百万级并发,GaussDB(for Cassandra)让华为Push推送服务更快触达》,作者:GaussDB 数据库。
推送服务(Push Kit)是华为提供的消息推送平台,建立了从云端到终端的消息推送通道。通过集成推送服务,您可以向客户端应用实时推送消息,让应用更精准触达用户,是开发者提升用户感知度和活跃度的一件利器。
华为云GaussDB(for Cassandra) 是一款基于计算存储分离架构的分布式数据库,致力于提供稳定可靠、超高并发,兼容Cassandra生态、弹性伸缩、一键部署、快速恢复、监控告警的分布式数据库服务,在Push业务的高效架构建设中,起到了关键的作用。
业务挑战
Push服务能够协助开发者快速触达用户,其提供的系统级通道推送速度每秒最高可达百万级,消息量每日百亿级,并且支持实时消息回执。如此高到达率的背后,是因为Push使用了大量分布式架构、高性能队列、大数据分析、数据库、AI等技术,用来支撑实时推送、精准送达业务的高效开展。
Push的主要业务链路是发送上行消息和下行消息,接下来我们从发送下行消息流程来了解业务在哪些场景上用到了数据库,以及对数据库的要求有哪些?
下行消息交互图如下所示:
当用户设备网络条件良好且不拥堵的情况下,华为Push服务器在收到消息后,会先将消息存入高性能队列中,然后队列消费消息发送给用户设备。但是当用户设备处于弱网、网络异常,或不在线、熄屏状态时,消息无法到达设备,或此时发送消息价值较低。Push业务为了保障消息不丢失,以及提升消息的有效率,利用数据库为底座,来支持离线消息缓存能力。
离线消息缓存是指当消息到达华为Push平台后,如果设备不在线,华为Push平台会将消息缓存起来,等到设备上线后,华为Push平台会将缓存的消息再次推送给用户。如果用户很长时间不在线,这些缓存的消息默认保存24小时,最长保存15天,超期的消息会被Push平台丢弃。
此时,在数据库的选型上就需要考虑以下几个问题:
- 推送速度每秒百万级,极端场景下,大部分写入数据库,会有每秒百万写入请求,数据库需要具备超高的写入能力;
- 当设备恢复正常状态时,消息会从数据库中读出发送给用户,消息的实时性会直接影响到消息的价值,此时就要求数据库的读时延低且长尾时延稳定;
- 推送的消息中,多与时事热点相关,容易引发流量突增,且不可预知,这就要求数据库具有快速弹性伸缩的能力;
- 为达成AI智能推送的能力,可能需要对数据库中的数据进行数据挖掘和分析,从而实施智能推送策略,数据库需支持与主流大数据引擎兼容的接口和解决方案。
为什么选择GaussDB(for Cassandra)?
基于以上挑战,Push业务经过一系列技术选型,最终选择了GaussDB(for Cassandra)数据库。GaussDB(for Cassandra)凭借丰富强大的特性,可以帮助Push业务很好地应对消息缓存的挑战:
- 从请求量上看,GaussDB(for Cassandra)轻松支持千万级并发访问,高并发不在话下;
- 从时延上看,GaussDB(for Cassandra)除了本身具备超低时延的能力外,在并发量大的情况下,可通过扩容和规格变更,增加分区和负载均衡保证业务时延基本无变化;
- 从弹性伸缩上看,GaussDB(for Cassandra)基于存算分离架构,支持秒级存储扩容,分钟级计算扩容,轻松应对流量高峰;
- 从兼容能力看,GaussDB(for Cassandra)支持CQL语法和灵活的数据定义,同时兼容主流的批式/流式处理引擎(Spark/Flink等),且提供动态增量+全量的解决方案,供大数据分析引擎接入,充分满足不同类型数据的接入需求。
如何利用GaussDB(for Cassandra)提升消息缓存体验
下面,我们将从具体的几个技术改进来聊聊,GaussDB(for Cassandra)是如何帮助Push业务获得更好的消息缓存体验。
降本增效
- 降低Push集群对数据库请求量:
- 表结构设计时,将同一用户设备的多条信息存入同一partition中
- 在读取时,可使用范围查询将同一用户设备的多条信息批量查出,且时延较低
- 在写入时,使用Batch写入,降低客户端与数据库的交互次数
- 降低存储使用量:业务科通过TTL、范围删除、单行删除等多种手段,根据业务情况灵活使用达到数据消亡的目的,降低存储用量。
弹性伸缩,热点无忧
每当出现重大新闻,各大应用均产生了海量的推送消息,Push业务收到消息后,流量激增,集群规模难以支撑巨大的流量。但依靠GaussDB(for Cassandra)的快速扩容能力,Push业务实现了分钟级别的计算扩容,业务不受影响,而且当流量回归正常后,可以进行缩容降低成本。
超强可靠性,底座无忧
GaussDB(for Cassandra)不仅在读写性能上表现优异,在数据可靠性上也表现突出。因为采用多节点分布式架构,当任意盘或节点出现故障,读写操作会自动切换至其他节点,理论上可以达到N-1个节点故障容忍,即集群任一节点存活即可提供完整服务。同时还支持异地双活,实现业务恢复和故障恢复解耦,Region级高可用。
综上所述,GaussDB(for Cassandra) 为Push业务提供了高效、稳定、安全的数据库底座,助力Push业务实现了离线消息缓存架构。我们相信,借助GaussDB(for Cassandra), Push业务在消息推送领域,会为开发者提供更优质的服务和工具,助力企业提升业务价值和用户体验。
让数据库无惧灾难,华为云GaussDB同城双集群高可用方案正式发布!
摘要:在华为全联接2021期间,华为云GaussDB(for openGauss)正式推出重大内核新特性——同城双集群高可用方案,提供金融级高可用服务,支持RPO=0 、RTO<60s的同城双集群切换,尽最大可能保障企业用户的核心业务7X24小时无中断。
在华为全联接2021期间,华为云GaussDB(for openGauss)正式推出重大内核新特性——同城双集群高可用方案,提供金融级高可用服务,支持RPO=0 、RTO<60s的同城双集群切换,尽最大可能保障企业用户的核心业务7X24小时无中断。
GaussDB 同城双集群高可用方案,是GaussDB(for openGauss)提供的一种全新架构和部署方式的高可用技术。在已有的高可用方案中,多采用单集群多副本的模式进行跨AZ部署,无法做到故障隔离,类似于集群管理组件的故障或其他区域性的故障将导致整个集群服务不可用;对于传统的基于网络的日志同步方式,数据库主备节点间地理距离的增大将导致传输时延的大幅度增加,直接影响到生产服务的性能。同时,金融、银行业对数据安全有着较高的要求,需要最大限度地保证数据的安全性以及服务的可用性。因此,GaussDB提供了支持RPO=0的数据库同城双集群高可用方案,即主集群在出现故障的情况下,备集群还具备继续提供服务的能力,当发生自然或人为灾难时,保护数据并快速进行恢复,对数据丢失零容忍。
GaussDB同城双集群高可用方案总体描述
数据库的主、备集群分别部署在同城的两个不同的AZ内,支持集中式和分布式架构,主集群作为生产中心提供生产服务,备集群作为同城的热备中心,提供只读和故障切换的功能。主集群的Redo日志通过存储层数据复制技术同步到备集群的存储设备中,备集群的备节点从所在分片的存储设备中读取Redo日志并进行回放。当数据库主节点写入的日志同步到备集群的存储设备之后,主节点的事务才会被提交,从而确保了集群切换RPO=0的性能指标。存储设备采用了华为自研的OceanStor Dorado V6全闪存存储系统,具有远程并行复制数据的功能,提供端到端低时延、大吞吐量的稳定高性能能力。
除此以外,本方案有良好的扩展性,在同城双集群高可用方案的基础上,还可以和异地集群组成跨Region容灾,即增加一个异地的灾备中心,用于对同城双中心的数据备份,形成两地三中心的容灾解决方案。
同城双集群高可用方案融合了GaussDB数据库和共享存储设备,利用共享存储设备的性能和可靠性优势,实现跨集群的RPO=0的高可用架构,为GaussDB(for openGauss)提供了更丰富的企业级功能。
同城双集群高可用方案的分布式架构示意图
GaussDB同城双集群高可用方案核心优势
- 金融级高可用:支持RPO=0 、RTO<60s的同城双集群切换,保障业务的安全性和可靠性。当主集群发生故障时,备集群能够数据无损地快速完成切换,替代主集群继续提供生产服务。
- 高性能:第一,采用物理日志同步相对于逻辑日志同步性能可提升10倍;第二,通过Dorado存储硬件实现集群间日志的快速同步,利用Dorado固有网络协议(密集波分),降低网络时延一倍以上,同时利用Dorado存储的缓存能力,日志写入即刻持久化,降低了事务提交时延。
- 高可靠:数据安全实现双保险,一方面数据库内核的多副本保障了故障自动切换和恢复,不中断业务;另一方面,存储内核保障了磁盘亚健康、故障容错、硬件自愈等能力。
- 架构先进性:通过数据库内部计算与存储分离,将存储管理放到下层共享存储中,从而解决数据同步带来的延时问题,并同时增加了计算能力的横向扩展性。
- 集群隔离:数据库集群间解耦,故障域隔离从而避免全局性的网络故障和集群管理组件故障;集群间版本隔离,避免Bug污染,能够快速回切;集群间资源隔离,按照Region进行资源管理和调度,方便数据库管理员对数据库系统资源使用进行规范和约束。
同城双集群高可用方案进一步扩大了GaussDB的高可用能力,特别是针对性能和稳定性有更高要求的金融核心业务场景,提供了安全可靠的数据库服务,使数据库无惧灾难,为用户的生产业务保驾护航。
技术无止境,未来GaussDB(for openGauss)将对数据库高可用技术进行更智能、更安全、更高效的技术优化,为客户打造更领先、更优质的数据库服务。更多GaussDB(for openGauss)详情了解请移步华为云官网:GaussDB数据库_GaussDB for openGauss_云数据库GaussDB_企业级分布式关系型数据库-华为云
以上是关于无惧百万级并发,GaussDB(for Cassandra)让华为推送服务更快触达的主要内容,如果未能解决你的问题,请参考以下文章
让数据库无惧灾难,华为云GaussDB同城双集群高可用方案正式发布!