互联网巨头的关系型数据库优化“财”路
Posted DT时代
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了互联网巨头的关系型数据库优化“财”路相关的知识,希望对你有一定的参考价值。
阿里云 :数据库成就双十一
自从电商火爆之后,每年双十一就成为了各大平台竞争的主战场。
“相比销售数字,我更关心技术的峰值。”——阿里巴巴董事局主席兼CEO张勇
这位财务出身的阿里巴巴掌门人之所以对技术峰值如此看重,恰恰说明数据库处理交易的能力事关电商业务的成败,高效、稳定、实时响应的数据库是电商运营的核心。
作为国内云计算的领军者,阿里巴巴自研了多款关系型数据库,2019年双十一期间,阿里云旗下的POLARDB和蚂蚁金服旗下的OceanBase分别处理8700万、6100万笔/秒峰值请求,实时计算处理峰值每秒25.5亿笔、计算平台单日处理970PB数据、12亿笔物流智能化等……打破了诸多技术记录。
除了出色的软件架构和算法,关系型数据库的性能表现也离不开计算和存储等底层硬件的支持。
在架构层面,POLARDB和OceanBase采用不同的技术路线。OceanBase采用share-nothing架构,各个节点之间完全对等,每个节点都有自己的SQL引擎和存储引擎。
OceanBase的这一特性使其可以直接部署在基于阿里云定制版本英特尔至强可扩展处理器和NVMe SSD本地盘的i2实例上,由204个数据节点组成的OceanBase集群以超过6000万tpmC的成绩创下数据库联机交易处理系统(OLTP)权威基准测试标准TPC-C的性能记录,这也是该测试基准历史上第一个分布式关系数据库获得认可的测试成绩。
之前TPC-C榜单上的前两名都采用小型机+共享存储的传统数据库架构,OceanBase以实际行动表明基于x86架构的云服务在保有同等事务能力的前提下具有更高的扩展潜力。
OceanBase支持三地五中心容灾架构,即单区域3可用区、三区域5可用区部署,前者的典型例子就是数字中国万里行团队多次参观过的阿里云张北数据中心,其由3个相距20公里左右的数据中心园区(可用区)组成阿里云华北3区,跨这3个可用区部署的多个副本可以在其中一个可用区发生故障时自动切换,保证数据库系统的高可用性。
图:位于河北省张家口市张北县的阿里云华北3区,是国内云计算企业首个采用同城三中心布局的数据中心集群。上图分别是1号园区和2号园区的局部
在阿里云对外提供的商业级云托管关系型数据库POLARDB上,阿里云大量将英特尔傲腾DC固态盘P4800X系列和英特尔3D NAND固态盘相结合,在软件层实现了一个混合型存储层,不仅使POLARDB每秒查询数(QPS)提升30%,改善了客户体验,还将POLARDB第95百分位延迟降低76%,进而实现低延迟、高吞吐量、高QoS。如今,POLARDB可以实现高达一百万每秒输入/输出(IOPS),而且只有毫秒级的延迟。
阿里云平台还全面上线了基于英特尔第二代至强可扩展处理器的第六代实例c6、g6和r6,睿频从上一代的2.7Ghz提升到3.2Ghz,计算性能有3~15%的提升,用于加速工作负载处理和服务交付,使Redis读写实测性能、nginx每秒请求数和mysql查询qps有20%以上的提升,MySQL查询延迟降低20%,明显改善了用户体验。
腾讯云:灵活反应打造全功能数据库服务
腾讯同样有多款数据库服务,比如TBase。这是一款腾讯自主研发的分布式国产数据库,提供领先的HTAP能力,在提供NewSQL便利性的同时完整支持分布式事务并保持SQL兼容性,支持RR、RC、SSI三种隔离级别,同时兼容Oracle语法。
对于日益多元化的企业客户,TBase能够满足他们对业务融合、场景融合、管理融合的更高诉求。强大的安全和容灾能力,让TBase已经成功应用在腾讯内部的微信支付,以及外部众多金融、政府、电信、医疗等行业的核心业务系统。
另一款腾讯自研的数据库架构TDSQL则应用于腾讯云中。作为定位于金融云服务的数据库,TDSQL符合金融行业的严格标准,在数据强一致性、高性能、高安全性、高可用性、高兼容性等方面表现卓越,并可部署在公有云、公有云独享物理集群、腾讯金融专区、用户自有数据中心等多种场景中。
当然,要在分布式数据库架构上实现高性能和数据的强一致性,计算、网络和存储的性能输出就不能掉链子。在腾讯金融云的实践中,全新英特尔至强可扩展处理器就发挥出了它高频、多核、多线程的优势,这些优势均能充分转化为TDSQL各模块处理速度的显著提升,例如它集成的英特尔高级矢量扩展512(英特尔AVX-512)技术输出的强大并行计算能力,就能为分布式数据库的任务处理提供更佳的支持,让用户能以更低的延时访问数据。
与该处理器搭配的英特尔Omni-Path架构,则能帮助TDSQL数据库系统在内部构建端到端的高带宽、低延迟数据通道,大大缓解高并发数据处理带来的压力。英特尔固态盘更是各种云数据库服务的标配存储介质,能满足从高到低的差异化存储需求。
总结
﹀
﹀
﹀
从云服务商的选择来看,将计算、网络和存储技术融合在一起,一个高效的数据云服务平台就已初现雏形,互联网公司只是“敢为天下先”,他们对于技术的渴求最为迫切,对于新技术带来的成果也最为认可。
无论是阿里还是腾讯,都积极拥抱了第二代至强可扩展平台,从至强处理器到傲腾数据中心可持久内存再到傲腾DC固态盘和英特尔3D NAND固态盘,这一系列从计算到存储的结果方案帮助互联网巨头们优化数据库应用,进而也让互联网用户们的体验获得了提升。网络方面,主要是指英特尔10Gb、25Gb和40Gb以太网适配器,以及英特尔Omni-Path架构(英特尔OPA),它们可以为数据在不同设备间的传输提供尽可能高的带宽和更低的延迟。
而且这样的的组合,还不仅仅是简单的拼接,英特尔开发的一些创新技术特性和软件,还能让它们实现的优势加成。例如:通过配备英特尔智能存储加速库(英特尔ISA-L)软件,Ceph存储方案可以利用英特尔至强处理器来更好地执行数据保护、数据完整性和数据安全型任务;通过英特尔高速缓存加速软件(英特尔CAS),Ceph方案也可使用智能缓存来提高性能;借助至强可扩展处理器平台集成的英特尔X722 10GbE网络适配器所支持的iWARP(Internet Wide-Area RDMA Protocol)RDMA功能,海量数据在传输中也可以进一步降低延迟并减少对处理器资源的占用。
2019数字中国万里行往期文章:
变革与创新,从未停息。DT时代聚焦最新基础架构设施和技术的的进展,关注企业数字化转型优秀案例,专注企业级方案和技术的传播和创新企业的成长,触及企业的变革与转型,目前覆盖的渠道有:今日头条、百度百家、搜狐新闻(DTValue)、天天快报、凤凰新闻、网易新闻、大鱼、一点资讯等多家平台。
THANKS
以上是关于互联网巨头的关系型数据库优化“财”路的主要内容,如果未能解决你的问题,请参考以下文章