互联网巨头的关系型数据库优化“财”路

Posted DT时代

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了互联网巨头的关系型数据库优化“财”路相关的知识,希望对你有一定的参考价值。

数字中国万里行
2018年,“数字中国万里行”正式启动。 经过一个多月的时间,我们探寻了腾讯、阿里巴巴、百度、字节跳动、华为云、京东云、中国联通、中国移动等8大数据中心,见证了中国互联网、云计算带领下数据中心的蓬勃发展。
2019年,“数字中国万里行”再度扬帆,这次我们将探索的区域放大,分为京津冀、长三角、珠三角和西南地区等四大区域,触达金融、制造等传统行业,造访的数据中心多达20家,聚焦基础设施的上层应用,通过“小区域、多采集”的方式,继续用“行“的模式,挖掘新技术的价值。
互联网上的全民狂欢对相对“传统”的关系型数据库提出了更为全面的要求,并且在数据分析服务上催生出新的应用。 2019年“双11”阿里巴巴再创多项交易记录,阿里云与腾讯云推出多款数据库服务和数据分析业务,无需另起炉灶,在他们普遍使用的英特尔架构基础设施上,已经有大量开源或商业版本的数据库和数据分析应用可供选择。

阿里云 :数据库成就双十一


自从电商火爆之后,每年双十一就成为了各大平台竞争的主战场。


相比销售数字,我更关心技术的峰值。”——阿里巴巴董事局主席兼CEO张勇


这位财务出身的阿里巴巴掌门人之所以对技术峰值如此看重,恰恰说明数据库处理交易的能力事关电商业务成败高效、稳定、实时响应的数据库电商运营的核心。


互联网巨头的关系型数据库优化“财”路


作为国内云计算的领军者,阿里巴巴自研了多款关系型数据库,2019年双十一期间,阿里云旗下的POLARDB蚂蚁金服旗下的OceanBase分别处理8700万、6100万笔/秒峰值请求实时计算处理峰值每秒25.5亿笔、计算平台单日处理970PB数据、12亿笔物流智能化等……打破了诸多技术记录


除了出色的软件架构和算法,关系型数据库的性能表现也离不开计算和存储等底层硬件的支持


在架构层面,POLARDB和OceanBase采用不同的技术路线。OceanBase采用share-nothing架构,各个节点之间完全对等,每个节点都有自己的SQL引擎和存储引擎。


OceanBase的这一特性使其可以直接部署在基于阿里云定制版本英特尔至强可扩展处理器和NVMe SSD本地盘的i2实例上,204个数据节点组成的OceanBase集群以超过6000tpmC的成绩创下数据库联机交易处理系统(OLTP)权威基准测试标准TPC-C的性能记录,这也是该测试基准历史上第一个分布式关系数据库获得认可的测试成绩。


之前TPC-C榜单上的前两名都采用小型机+共享存储的传统数据库架构,OceanBase以实际行动表明基于x86架构的云服务在保有同等事务能力的前提下具有更高的扩展潜力。


OceanBase支持三地五中心容灾架构,即单区域3可用区、三区域5可用区部署,前者的典型例子就是数字中国万里行团队多次参观过的阿里云张北数据中心,其由3个相距20公里左右的数据中心园区(可用区)组成阿里云华北3区,跨这3个可用区部署的多个副本可以在其中一个可用区发生故障时自动切换,保证数据库系统的高可用性。


互联网巨头的关系型数据库优化“财”路

互联网巨头的关系型数据库优化“财”路

图:位于河北省张家口市张北县的阿里云华北3区,是国内云计算企业首个采用同城三中心布局的数据中心集群。上图分别是1号园区和2号园区的局部


在阿里云对外提供的商业级云托管关系型数据库POLARDB上,阿里云大量英特尔傲腾DC固态盘P4800X系列和英特尔3D NAND固态盘相结合,在软件层实现了一个混合型存储层,不仅使POLARDB每秒查询数(QPS)提升30%,改善了客户体验,还将POLARDB第95百分位延迟降低76%,进而实现低延迟、高吞吐量、高QoS。如今,POLARDB可以实现高达一百万每秒输入/输出(IOPS),而且只有毫秒级的延迟。


阿里云平台全面上线了基于英特尔第二代至强可扩展处理器的第六代实例c6g6r6,睿频从上一代的2.7Ghz提升到3.2Ghz计算性能有315%的提升用于加速工作负载处理和服务交付,使Redis读写实测性能、nginx每秒请求数mysql查询qps20%以上的提升,MySQL查询延迟降低20%,明显改善了用户体验


互联网巨头的关系型数据库优化“财”路


腾讯云:灵活反应打造全功能数据库服务

互联网巨头的关系型数据库优化“财”路


腾讯同样有多款数据库服务,比如TBase。这是一款腾讯自主研发的分布式国产数据库,提供领先的HTAP能力,在提供NewSQL便利性的同时完整支持分布式事务并保持SQL兼容性,支持RR、RC、SSI三种隔离级别,同时兼容Oracle语法。


对于日益多元化的企业客户,TBase能够满足他们对业务融合、场景融合、管理融合的更高诉求。强大的安全和容灾能力,让TBase已经成功应用在腾讯内部的微信支付,以及外部众多金融、政府、电信、医疗等行业的核心业务系统。


另一款腾讯自研的数据架构TDSQL则应用于腾讯云中。定位于金融云服的数据TDSQL符合金融行准,在数据强一致性、高性能、高安全性、高可用性、高兼容性等方面表卓越,并可部署在公有云、公有云独享物理集群、腾讯金融区、用自有数据中心等多种景中

 

当然,要在分布式数据架构上实现高性能和数据的强一致性,算、网和存的性能出就不能掉子。在腾讯金融云的践中,全新英特尔至强可理器发挥出了它高、多核、多线程的优势优势能充分TDSQL各模块处理速度的提升,例如它集成的英特尔高矢量512英特尔AVX-512术输出的强大并行算能力,就能分布式数据的任务处理提供更佳的支持,能以更低的延时访问数据。

 

该处理器搭配的英特尔Omni-Path架构,能帮助TDSQL数据在内部构建端到端的高带宽、低延数据通道,大大解高并数据来的力。英特尔固态盘更是各种云数据配存,能足从高到低的差异化存需求。


总结


从云服务商的选择来看,将计算、网络和存储技术融合在一起,一个高效的数据云服务平台就已初现雏形,互联网公司只是“敢为天下先”,他们对于技术的渴求最为迫切,对于新技术带来的成果也最为认可

 

无论是阿里还是腾讯,都积极拥抱了第二代至强可扩展平台,从至强处理器到傲腾数据中心可持久内存再到傲腾DC固态盘和英特尔3D NAND固态盘,这一系列从计算到存储的结果方案帮助互联网巨头们优化数据库应用,进而也让互联网用户们的体验获得了提升。网络方面,主要是指英特尔10Gb、25Gb和40Gb以太网适配器,以及英特尔Omni-Path架构(英特尔OPA),它们可以为数据在不同设备间的传输提供尽可能高的带宽和更低的延迟。


英特尔傲术为高性能存储带来了更多选择,其最新物是内存型Optane DC Persistent Memory,它可以内存(In-Memory)的用,特别是内存数据和内存数据分析来更具性价比的承平台


而且这样的的组合,还不仅仅是简单的拼接,英特尔开发的一些创新技术特性和软件,还能让它们实现的优势加成。例如:通过配备英特尔智能存储加速库(英特尔ISA-L)软件,Ceph存储方案可以利用英特尔至强处理器来更好地执行数据保护、数据完整性和数据安全型任务;通过英特尔高速缓存加速软件(英特尔CAS),Ceph方案也可使用智能缓存来提高性能;借助至强可扩展处理器平台集成的英特尔X722 10GbE网络适配器所支持的iWARP(Internet Wide-Area RDMA Protocol)RDMA功能,海量数据在传输中也可以进一步降低延迟并减少对处理器资源的占用。


未来十年,数据的创建和应用将加速增长,并且所有的行业都在面临数字化转型的问题。在底层硬件平台上实现革新和加速,英特尔第二代可扩展平台也 不仅为 阿里、腾讯这样的超大型互联网公司 ,也为百行百业 提供了最佳的选择


2019数字中国万里行往期文章:







变革与创新,从未停息。DT时代聚焦最新基础架构设施和技术的的进展,关注企业数字化转型优秀案例,专注企业级方案和技术的传播和创新企业的成长,触及企业的变革与转型,目前覆盖的渠道有:今日头条、百度百家、搜狐新闻(DTValue)、天天快报、凤凰新闻、网易新闻、大鱼、一点资讯等多家平台。


THANKS


以上是关于互联网巨头的关系型数据库优化“财”路的主要内容,如果未能解决你的问题,请参考以下文章

数据库查询处理及优化

云计算市场持续高速增长,亚马逊微软IBM阿里云腾讯云等巨头企业竞争愈演愈烈

数据库优化概览

不会优化数据库,早晚被优化!

百度企业网站搜索引擎优化诊断报告

《MySQL性能优化和高可用架构实践》于2020-07-01上市