报告解读与下载 | 数据库深度复盘与2022国产数据库展望

Posted 耀阳居士

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了报告解读与下载 | 数据库深度复盘与2022国产数据库展望相关的知识,希望对你有一定的参考价值。

报告解读与下载 | 数据库深度复盘与2022国产数据库展望

发布于 2022-03-08 17:40:20
5140
举报

编者注:本系列将选择一些行业分析报告进行分享,同时提供下载,与读者共同分析分享数据库行业的最新进展与动态。关注本公众号回复:下载 。可以找到获得下载链接。

本报告的核心观点

数据库作为信息化的核心环节,是底层硬件基础资源与上层应用之间的重要支撑。随着海量数据的涌现和分析能力需求增长, 预计未来数据库存储量将出现严重错配 ,需求迫切性将显著提升 。

  • 从信息产业链角度来看,数据库作为信息化系统承上启下的关键环节 ,向下调用硬件基础资源, 向上为应用软件提供重要数据支撑,是信息化中间的核心环节 ;
  • 从国家政策角度来看, 数字经济作为国家“ 十四五 ”建设的重中之重, 数据作为新型关键生产要素 ,是推动数字经济发展的关键一环,同时,国内数据库长期由海外厂商主导,在国内数据库行业快速发展下,国产数据库将迎来重要发展机遇。

不断顺应市场需求变化 ,数据库行业正持续进化。报告回顾了数据库70年发展历程, 从数据模型逻辑 、技术架构、 需求功能、 部署方式、 商业模式、 存储介质、 治理模式等七大维度对数据库发展脉络进行详细梳理。我们发现, 由于数据规模 、读写需求量等指数级增长 ,为避免数据冗余与架构的复杂化, 叠加分布式架构技术日趋成熟,将多技术 、多模型融合成为数据库发展的重要方向。如将NoSQL非关系型的分布式拓展性与关系型数据模型融合诞生的NewSQL,保留了关系型数据逻辑的同时, 大幅提升了系统的灵活拓展能力;数据模型方面,将结构化、半结构化、非结构化等多种数据融合的多模数据库正快速发展;需求功能方面,将OLTP与OLAP融合的HTAP数据库正逐渐成为企业首选等均显示出行业技术融合的发展特点。

在国内大力发展数字经济建设的大背景下, 数据库行业规模将保持快速增长 。根据信通院统计,2020年中国数据库市场规模为35亿美元 (约合240.9 亿元人民币 ),预计2025 年市场总规模将达到688亿元,CAGR 为23.4 %。基于对数据库发展趋势与国家政策导向的分析,我们认为,未来数据库市场增量需求主要来自于以下三方面:

  1. 国产化进程正逐步加速 :通过对金融行业国产化数据库建设案例梳理发现, 国产数据库已经从边缘系统逐步实现核心系统国产化 ,显示出国产数据库产品功能、性能水平不断增强 。预计随着行业信创逐步落地, 对国产数据库需求将进一 步提速。
  2. 分布式架构凭借在经济性 、安全自主、 灵活性、可伸缩性等方面的优势,逐步实现对集中式架构替代:目前,互联网、 金融、 电信等行业分布式升级进展较快 ,其中金融 、电信行业已有分布式数据库在股份制银行 、城商行、 二三线城市运营商等实现了核心业务系统的改造落地 ,同时 ,墨天轮 前十大热门数据库均为分布式架构 ,其应用场景涵盖各行业,显示出国产分布式数据库已经趋于成熟,正成为各行业数据库建设重要选择。
  3. 随着工业互联网、互联网创新型业务 、车联网等应用的快速发展,非关系型数据库应用将加速落地:非关系型数据库 应用场景不断丰富 ,如 图数据库能够支撑社交网络、金融反欺诈等互联网新型应用场景的关联分析业务;时序数据库可以高效存储和快速处理海量时序大数据 ,在工业互联网快速发展下 ,传感器与设备产生的大量实时数据, 将推动时序数 据库应用快速发展等。
  • 数据模型逻辑 、技术架构、 需求功能、 部署方式、 商业模式、 存储介质、 治理模式等七大维度对数据库发展脉络进行详细梳理。
  • 在当前关系、非关系并行时代,新型NewSQL与多模数据库快速发展。传统SQL受限于其拓展性,在大数据发展下逐渐面临瓶颈, 而NewSQL提供了与NoSQL相同的可扩展性 ,而且仍基于关系模型 ,保留了极其成熟的SQL作为查询语言,从而保证了数据的强一致性;同时,基于分布式架构,对接多种数据模型引擎,避免搭建多种类数据库的多模数据库快速发展。
  • 分布式架构逐步由分库分表中间件向原生分布式发展 ,以应对不同应用场景。分库分表中间件早期主要以电商 、社交起家的互联网公司自研为主, 但由于其对复杂查询事务的支持较差 ,难以应对业务瞬时高峰需求, 因此更加便捷 、可靠的原生分布式数据库应运而生 。 按照具体实现方式可以分为两类:以 Greenplum 为代表的主流MPP架构和以Cassandra、HBase为代表的分区分片架构。
  • 开源有助于强化数据库生态建设, 已逐渐成为数据库产业的共识。2021年1月,根据DB-Engines ,全球数据库开源许可证流行度首次超过商业许可证,开源数据库逐渐成为行业主流。截至2021年6月, 开源与商业许可证数量分别为198和185个 ,流行度分别 占比51.4% 和48.6% 。开 源有助于扩大人才规模及上下游生态影响力, 通过运营开源社区快速获得反馈并加快产品开发、提升产 品质量,同时反哺社区开发者及独立软件开发商(ISV)等生态伙伴,能够达到多方共赢目的。 
  • 智能自治成为保障数据库安全可控的重要发展趋势。数据安全是数据库建设的重要前提 ,自动检测、 防范系统故障、 运维保护和修补安全漏洞对数据库而言至关重要;随着信息化的发展 ,应用系统和数据规模井喷式增长,数据库的负载调优压力增 大。因此,摆脱对DBA的经验决策依赖,基于人工智能自动执行安全 、备份、 打补丁和其他需要大量人工重复劳作、从根本上彻底消除人为差错、减轻DBA工作压力的自治数据库成为历史的必然选择。目前自治数据库仍停留在事后判断阶段,展望未来, 提前预判数据规模增长趋势和数据库负载状况,事前主动调优是自治数据库的发展新方向。
  • 金融、电信、政务、制造、互联网五个行业为数据库行业下游主要需求领域,大数据应用快速发展为数据库提供增长动力。根据信通院统计,其合计市场份额高达80%以上,2020年整体采购额超过192亿元。此外,根据赛迪顾问,2020年国内大数据市场结构数据 ,其中互联网、政府、金融 、电信 、工业位列前五, 占比分别为48% 、14%、12%、9 %、5%, 合计约88%, 大数据应用与数据库需求结构基本吻合,预计随着大数据应用领域拓展与规模持续增长,将为数据库行业规模增长提供充足动力。
  • 根据信通院统计,目前我国金融行业海外Oracle与IBM DB 2占比约74 %,占据主导,基于MySQLPostgreSQL二次开发的国产数据库合计占比约为19%, 国产化仍有广阔空间。 其中,我们通过对金融行业国产化数据库建设案例梳理发现, 国产数据库已经从边缘系统逐步实现核心系统国产化, 显示出国产数据库产品功能 、性能水平不断增强 。预计随着行业信创逐步落地, 对国产数据库需求将进一步提速。
  • 分布式架构凭借在经济性、安全自主、灵活性、 可伸缩性等方面的优势,逐步实现对集中式架构替代。目前,互联网、金融、电信 等行业分布式升级进展较快,以金融和电信行业 为例,其核心业务数据类型均为关系型数据库, 此类集中式数据库所面临的业务体量将呈现爆发性增长。由于单一硬件能力增长有限,所以无法依靠纵向升级硬件扩展存量数据库能力上限。而分布式数据库采用多 种模式实现数据的分散存储,将压力分散到不同服务器上,并不断通过增加存储或计算节点来实现弹性升级,克服了集中式数据库 的诸多缺点,业界已有分布式数据库在股份制银行、城商行、二三线城市运营商等实现了核心业务系统的改造落地,同时,去年12 月,腾讯分布式数据库TDSQL落地东吴证券核心交易系统,也标志着分布式数据库在券商核心系统领域取得突破。
  • 墨天轮国产数据流行度排行(截至2022/02), 前十大热门数据库均为分布式架构,其应用场景涵盖各行业,显示出国产分布式数 据库已经趋于成熟,正成为各行业数据库建设重要选择。
  • 华为GaussDB是一个企业级AI-Native分布式数据库,将AI能力植入到数据库内核的架构和算法中, 智能诊断 、 索引推荐 , 为 用户提供更高性能、更高可用、更多算力支持的分布式数据库。GaussDB系列基于统一架构,底层选用分布式存储 ,中间层是每个DB特有的数据结构,上层是各个生态接口,支持关系型与非关系型数据库引擎,开启数据库极速与多模融合时代。
  • OceanBase是由蚂蚁集团完全自主研发的企业级分布式关系数据库 。OceanBase始创于2010年 , 具有数据强一致、高可用、高 性能、在线扩展、高度兼容SQL标准和主流关系数据库、低成本等特点 。据国际事务处理性能委员会(TPC) 测评 ,OceanBase 在TPC-H榜单中排名第一,是唯一一个在OLTP和OLAP领域测试均摘取桂冠的国产自研数据库。
  • PingCAP 成立于 2015 年, 是一家企业级开源分布式数据库厂商,致力于为全球用户提供稳定高效、安全可靠、开放兼容的新型数据服 务平台 、解决方案与咨询、技术支持与培训认证服务, 解放企业生产力, 加速企业数字化转型升级。PingCAP 在帮助企业释放 增长空间的同时,也提供了一份具有高度可参考性的开源建设实践样本。

《2021Bots自动化威胁报告》深度解读之Bots攻击详解

近日,作为Bots自动化攻击防护领域的专业厂商和中国动态安全技术的创新者,瑞数信息近日重磅发布《2021 Bots自动化威胁报告》。根据瑞数信息多年在政务、金融、电信、教育、医疗卫生、互联网等行业的上千例防护案例及第三方公开数据,报告从攻击目标、攻击来源、Bots客户端分析、移动端分析等角度对2020年度Bots自动化攻击的详细数据进行细致解析,为企业深入了解Bots攻击威胁及提升相应的安全防御能力提供重要参考。

分析一:政务、出版、医疗卫生成Bots攻击的热点行业

从行业角度分析,2020年,公示类系统和服务提供类系统依然是Bots攻击的头号目标,恶意机器人比例从2019年的40.97%上升至2020年的43.76%。排名Top5的威胁场景包括漏洞探测利用、资源抢占、数据搜刮、暴力破解、拒绝服务攻击。

同时受新冠疫情影响,出版和医疗卫生行业成为了Bots攻击关注的热点。为方便大家在线学习而免费开放的电子书、论文库等资源吸引了大量恶意爬虫进行信息爬取。而医疗卫生行业因为医疗数据“价值高”也成为攻击的重点目标,其中针对系统的漏洞扫描、DDoS、公示信息高频度抓取等方面尤为突出。

分析二: API被重点“光顾”

随着企业业务的发展,访问方式融合了Web、APP、小程序等多种方式,而作为融合访问基础支撑的API也成为了攻击者重点关注的目标。预计到2022年,API滥用将成为导致企业Web应用程序出现数据泄露的最常见攻击方式。

通过对访问类型监测分析,瑞数信息观察到API的请求占比已经超过 65%。

另据观察,API面临的威胁和传统的Web页面还是存在很大的差别。相比传统的Web页面,API承载了更多业务流程,面临的攻击类型也主要集中于业务类攻击,包括越权访问、接口滥用、数据拖取等,占比超过70%。

分析三: Bots攻击来源更加隐秘

为了突破目标系统的防护机制,90%以上的Bots都会选择用IP代理的方式来隐藏自己。随着Bots攻击的升级,IP代理的提供方式也从本地代理发展成更为高效的HTTP隧道模式,IP地址的数量大大增加,来源也更为广泛,隐蔽性达到了新的高度。

从Bots攻击发起的地理位置上分析,国内Bots的攻击来源相当分散,但总体以南方经济发达地区为主。广东占比超过10%,成为国内Bots攻击来源地区Top1,其次为安徽、浙江、江苏、北京。而在来自境外的攻击中,美国依然占据榜首,攻击占比将近60%,其次为德国和新加坡。

此外报告指出,公有云依然是Bots攻击的主要来源之一,大量的Bots利用IDC机房的资源进行攻击。其中,超过50%的Bots攻击使用阿里云,其次来自华为云和腾讯云的攻击明显增加,三者合计占比超过80%。

分析四:Bots仍然青睐Windows和Chrome

为提高攻击效率,Bots攻击者不断在尝试利用各种各样的手段来绕过检测措施,比如通过修改User Agent来隐藏自己真实的身份信息。根据瑞数信息分析,超过半数的Bots都会选择Windows,其次为Mac和Linux两大操作系统。另外,高达66%的Bots攻击者喜欢Chrome作为他们的“马甲”。

无论是从提升效率,还是绕过现有一些防护机制,很多的Bots都会基于自动化框架来做。相比2019年,Bots在选择自动化框架方面没有明显变化,主流技术依然采用 Webdriver、Headless、PhantomJS、NodeJS。

分析五:移动端Bots攻击愈演愈烈

随着企业越来越多的业务系统向移动端迁移,攻击平台也必须随之向移动端转移,多种多样的攻击手段因此接连出现,例如各类改机工具、破解框架、模拟器、root、群控、云控、IMEI伪造、GPS伪造等。

在工具选择上,攻击者在2020年使用的技术并没有太多的变化,但在工具上有部分更新,使用相对多的工具是多开分身,其次是改机工具微霸。

由于Android是开源系统,在经济成本、系统破解难易程度方面也相对较低,因此,高达86%的攻击者选择Android作为攻击平台选择。在系统平台层面,Android 10替代Android 9成为第一大平台,这和谷歌的发布进程也基本吻合。

从城市分布看,移动平台的 Bots最大来源城市为广州,其次为上海。从手机品牌看,Bots攻击小米占据首位,其次是华为和oppo。

总结

综合来看,在Bots机器人攻击已成为攻击主流的今天,伴随AI技术及平台化趋势的加强,越来越复杂的高级Bots机器人攻击为网络安全行业带来了更为严峻的挑战。

作为国内创新提出“动态安全”理念的公司,Bots自动化威胁防御能力是瑞数信息的看家本领,其机器人防火墙产品Botgate已经成为市场上应对Bots机器人攻击非常有效的一款方案。

未来,随着更多企业安全思维的转变,瑞数信息将利用这一安全武器,实现更高水准的安全防御,帮助更多企业将Bots攻击拒之门外,打造出一套响应迅速、防御完备的网络安全体系。

以上是关于报告解读与下载 | 数据库深度复盘与2022国产数据库展望的主要内容,如果未能解决你的问题,请参考以下文章

CVPR2022 前沿研究成果解读:基于生成对抗网络的深度感知人脸重演算法

袋鼠云春季生长大会最新议程来啦!4月20日我们云上见

IDC 中国边缘云市场最新报告解读:阿里云蝉联中国公有云市场第一

IDC 中国边缘云市场最新报告解读:阿里云蝉联中国公有云市场第一

3000字长文为你解读数据仓库与复杂业务数据建模全流程

中间件的国产化之路(深度)| 国君计算机