2022年中国数据库研究报告

Posted 耀阳居士

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2022年中国数据库研究报告相关的知识,希望对你有一定的参考价值。


 

2022年中国数据库研究报告

艾瑞咨询界面官方财经号
2023年03月15日 20:17
IP属地:北京
 
数据库出海成为国产厂商的全新增量逻辑。
 

文|艾瑞咨询

核心摘要:

中国数据库市场规模:据艾瑞统计,2021年中国数据库市场总规模达286.8亿元,同比增长16.1%。中国数据库市场虽受疫情影响,但整体稳步增长,由多方面因素促成:1)信创利好;2)需求驱动;3)国产厂商厚积薄发;4)国内用户对基础软件的IT支出,尤其是国产数据库的付费意愿逐年提升。

在数据库市场供给侧:分布式架构的技术特性趋于融合,云化部署大势所趋,使用门槛不断降低;数字化业务场景不断丰富,业务需求驱动HTAP技术成为重要的技术底座;在开源数据库领域,国产开源时间不长,整体表现尚有提升空间;国产数据库借信创东风,迎来了前所未有的发展机会。

在数据库市场需求侧:在数字化转型浪潮下,企业用户的数据已初具规模,业务场景和数据结构越来越复杂,对于数据分析的需求日趋强烈。数据库部署方式呈现多元化,其中分布式架构和云部署的渗透率显著提升。随着国产数据库的技术创新以及产品性能提升,国产产品的头部效应明显,用户体验仍有待进一步完善。

数据库行业趋势洞察:数据库出海成为国产厂商的全新增量逻辑,欧美线路和东南亚线路是国产厂商出海的优选项;云原生进入2.0时代,实现了云资源对数据库的细粒度资源拆解和优化编排,云托管数据库进一步向原生式数据库推演;数据库与大数据技术的边界不断模糊,呈现融合趋势。

定义

数据库是由DBMS统一管理的,有组织、共享的数据集合

数据是描述事物的符号记录,具有多种表现形式,包括文字、图形、图像、声音和语言等。数据库是相互有关联关系的若干数据的集合,特点是数据间联系密切、冗余度小、独立性较高、易扩展,并且可为各类用户共享。数据库管理系统(DBMS)是负责数据库搭建、使用和维护的系统软件,通过组织、索引、查询、修改数据库文件,实现数据定义、组织、存储、管理以及数据库操作、运行、维护等主要功能。围绕DBMS构建包含硬件操作系统、数据库管理系统、数据库管理员以及相关机制配套在内的数据库系统(DBS),才能有组织、动态地存储大量相关数据,方便多用户访问。

发展历程

硬件技术、应用场景等快速变化,行业格局百花齐放

分类

数据库按照不同维度,分类方法多种多样

分布式现状

技术特性趋于融合,云化部署大势所趋,使用门槛不断降低

分布式数据库是通过计算机网络将物理分散的多个数据库单元连接组成的逻辑上统一的数据库。目前分布式数据库的技术路线分为三类:分库分表+中间件方案、共享存储分布式数据库、去中心化的分布式数据库。当下分布式数据库市场产品繁多,但其技术特性逐渐趋同,从两个角度分析:其一,系统架构。存储采用开源或者自研内核,用一主多从的数据副本保证数据完整性,计算通过SQL语句解析分发和结果汇聚,管控用于保证各模块的高可用和故障切换等管理功能。其二,开源和自研两条研发线路。开源主要基于 MySQL 和 PostGreSQL,难点在于源代码改造的技术难度大;自研周期长且技术要求高,国内完全自研产品屈指可数,如TiDB 和 OceanBase等。未来分布式数据库的核心竞争要素为分布式事务的稳定性、产品全面性以及生态工具的完备性。

分布式前瞻

加强底层故障隐患感知,提升异常处置能力,实现开箱即用

墨天轮数据显示,国产分布式数据库自2019年以来保持高速增长,热度持续高涨。而通过用户调研了解到,面对分布式数据库的故障时,运维人员往往束手无策。主要原因是相较集中式数据库,分布式数据库对IT 基础设施可靠性要求更高了,其核心代码主要覆盖了 SQL实现和数据存储,而未能自动感知各种对数据库稳定性、性能、并发能力有重大影响的故障隐患,也难以在代码层面对此类问题进行处理,从而实现故障自动规避。未来分布式数据库应提升基础数据探测和分析能力,随时针对出现的异常隐患提前处置,实现无需运维人员过多干预的高效自治运行,让分布式数据库从IT 工程化产品变为真正开箱即用的通用型产品。

 

HTAP现状

业务驱动HTAP技术成为重要底座,与分布式技术天然适配

随着业务系统接入数据源复杂性提升,混合负载需求愈发强烈,数据库技术正向多源异构、高实时并发、多SQL 标准接口的方向演进。过去,HTAP数据库的技术架构以扩展主行存技术,在行存基础上加列存的方式为主,典型代表有 SQL Server,Oracle 和 L-store等。随着分布式技术不断成熟,天然适配 HTAP 数据库,于是开启了分布式的架构实现,满足了高并发需求,典型代表有 SingleStore、MySQL Heatwave 和 Greenplum。我们认为未来 HTAP 仍应是在 OLTP数据库的基础上,引入原生分布式架构和低成本存储引擎以扩展大数据量 OLAP 能力。最后,为更好支持 OLAP的数据开发和建模能力,提升实时分析,HTAP 支持物化视图和外部表,并与各类数据开发工具和 BI 工具适配对接。

HTAP前瞻

运用内置流处理能力进一步加强AP和TP间的融合

墨天轮数据显示,自2020年以来国产 HTAP 数据库发展迅猛,几乎成为新兴数据库的必选项。Gartner 也指出 HTAP已经成为全球范围内新一代数据库的入场筹码,HTAP 能力成为数据库重要选项。随着数据技术的不断创新,未来 HTAP 数据库会进一步加强 AP 和 TP之间的连接和融合,在数据库内部实现 AP 和 TP 之间的内置流(Streaming)处理能力。通过将 ETL 工作内置于数据库当中,让 HTAP 数据库同时具备 AP、TP 和流(Streaming)能力。用户可以按需创建各类表,运用流处理能力将表连接,从而获得简单、便捷的数据处理能力。数据库技术的进一步融合会打破当下数据栈的割裂状态,HTAP、流批一体、湖仓一体等技术趋势最终会让数据集中在简单易用、安全可靠、高性价比的数据平台。

 

智能运维

融合智能技术实现复杂数据库环境的管理自治

DT时代数据库技术架构和运行环境日趋复杂,种类从单一产品转变为混合型商业数据库和开源数据库组合,依靠人工运维显得捉襟见肘。作为智能化的数据库周边工具,数据库管理平台将机器学习与数据管理在功能上融合统一,利用机器学习增强系统设计开发,以标准化、自动化、智能化的方式提供实时监控、健康巡检、智能诊断、多维分析等数据库管理服务。数据库管理平台的本质是数据库管理经验的代码化,核心方法论是云资源池化、分层解耦以及服务化,实现手段是基于微服务、分布式等云技术实现多元混合数据库环境的统一管理,目标是实现海量数据高安全、高可用、高性能的运维要求,助力数字化转型。

全球开源

热度持续,成为国产数据库走向国际化的重要途径

开源即开放源代码,用户可在源代码的基础上完成学习和修改。DB-Engines数据显示,截至2021年1月,开源数据库的全球部署首次超过商业数据库。此后,开源数据库凭借在成本、产品丰富度、社区活跃性等方面的突出优势,持续获得了全球的高关注度。开源成为驱动数据库技术和市场变革的重要力量。在此趋势下,开源成为数据库项目冷启动的最佳方式,也是构建国产自研数据库生态、加速技术迭代、让国产数据库走向国际化的重要途径。

国产开源

国产数据库开源时间不长,整体表现有待提升

近年来国内数据库厂商逐步推进开源策略。但因国内数据库开源时间不长,运营有待加强,整体表现有较大提升空间。以TiDB 为例,从开发者、使用者及代码角度分析,其开发者活跃、用户众多、代码变化较大,平均2-3年完成一次软件重构,侧面印证了上述特征。

 

中国数据库产业图谱

市场规模

受政策驱动和需求催化,2021年数据库市场规模达286.8亿

据艾瑞统计,2021年中国数据库市场总规模达286.8亿,较2020年增长16.1%,CAGR(2021-2026e)达13.4%。中国数据库市场虽受疫情影响,但整体稳步增长,由多方面因素促成:1)信创利好,国家对国产数据库的支持力度大;2)需求催化,数字化业务场景带动数据库多元化发展;3)供给侧厂商厚积薄发,技术创新涌现,产品性能显著提升;4)国内用户对基础软件的IT支出和国产数据库的付费意愿逐年提升。

发展特点

现阶段集中式数据库仍占据主流,分布式有待场景需求拉动

据艾瑞调研,若剔除数仓(绝大多数数仓采用分布式部署),集中式数据库的市场份额接近80%,而分布式部署不足20%。从技术角度看,虽然集中式数据库的水平扩展有限,但优点是足够简单和易用,在小规模数据量的场景下性能表现优异,而绝大多数业务场景的数据量并未大到必须使用分布式架构承载。分布式数据库的特征则恰好相反。从应用角度看,分布式部署更受行业头部用户青睐,其中信创环境下的国产化替代风潮起到了很大的推动作用。但运行场景多以非核心业务为主,用户的核心业务仍通过集中式数据库运行。因此,我们认为未来分布式数据库的发展一定是由业务场景的需求拉动。

事务型数据库增速放缓,分析型和HTAP数据库不断涌现

从收入规模来看,事务型数据库的市场份额占主导地位,分析型数据库占比不足20%。但预计未来3-5年内,分析型数据库的市场份额会有较为显著的提升,原因如下:各行业的数字化进程已取得了初步成果,企业核心业务的信息化过程主要是运用关系型数据库承载的事务类业务,因此当下事务型数据库增速已有所放缓。相反随着业务场景的丰富和数据复杂度的提升,诸如市场推广和营销分析类的分析型场景剧增,各类分析模式和分析方法不断涌现,最终都需要具体的分析型数据库执行。此外,HTAP理念也受到了热捧,但根据调研了解, HTAP 技术线路和产品实现尚未达成行业共识。

信创为国产数据库厂商提供发展沃土,未来市场空间可期

在国内数据库市场,传统的商业数据库有两类玩家:其一,以Oracle为代表的国外厂商;其二,以达梦、人大金仓、南大通用、神舟通用为代表的国产厂商。二者的此消彼长一方面源于国产厂商技术实力的不断增强,另一方面也反映了信创东风下,国家政策对以数据库为核心的基础软件领域的大力扶持。在此,我们希望通过分析国外厂商在国内数据库市场的商业模式,以反映未来国产化替代过程中,国产数据库厂商的市场空间之巨:据艾瑞调研了解, 一直以来国外厂商对国内用户的限制较低,导致在国内数据库市场的隐性规模尚未浮出水面。随着国产替代进程的不断深入,国外厂商的隐性市场份额被逐步释放,国产厂商潜在的市场空间可期。

 

用户画像

数据初具规模,数据结构向非关系型倾斜,分析需求增加

随着国内数字化转型节奏加快以及国产替代浪潮涌动,基础软件领域迎来了高速发展。数据库作为信息系统核心软件以及信创的关键环节,迎来产业黄金期,数据库产品的国内渗透率达到前所未有的高度。随着国内数据库用户不断增加,用户画像逐渐清晰,描绘出符合中国特色的数据库用户特征。

数据库用户的数据资产积累已初具规模,尤其是互联网、制造、政务、电信等领域多半已达到TB级别。用户的数据结构仍以关系型数据为主,但非关系型数据的比例有明显提升。用户的数据分析需求存在较大的行业偏差,互联网、金融、电信、零售、政务等领域需求较强烈,而能源、制造、物联网等领域相对较弱。

角色定位

数据库使用单位中不同角色对产品的考虑要素有所差异

产品部署

数据库趋于多元化部署,分布式架构和云部署渗透率提升

近年来,数据复杂度以及对数据的海量、多模、异构、弹性等要求不断提高,单一数据库难以满足当下的用数需求,数据库的多元化趋势显著。从调研数据可见,架构师和开发人员基于前端的数据使用需求呈现多样化,在研发规划之初便选择不同的数据库以满足开发需求。随着数据库技术的更新迭代,用户的选择灵活度更大,除功能、安全等传统因素之外,可从架构、研发、运维等多个维度考虑。在架构选型上,分布式架构的整体渗透率已超80%,其中仍以中间件+分库分表的实现方式为主。从部署模式看,云数据库的使用率接近80%,其中公有云占比60-70%。

产品体验

国产产品渗透率的头部效应明显,用户体验有待进一步完善

在调查数据库用户的使用体验时,我们收获的反馈相对集中:第一,数据库迁移难度大,占比19.2%,难点聚焦于迁移过程中的兼容性、数据安全、停机时间、数据校验和性能保证等。第二,缺乏数据库的一站式管理,占比14.8%,当前市场上的一站式管理平台以管控类为主,主要面向DBA等专业技术人员,而对开发、业务、运维等其他角色的门槛偏高。第三,运维与备份的复杂度高,占比14.3%,随着技术路线的灵活度和复杂度提升,运维与备份和难度势必增加。

具体到国产数据库的市场渗透情况,PolarDB 排名第一,MogDB 排名第二,达梦排名第三,TiDB排名第四。在云厂商中,阿里云的市场份额排名第一,华为云和腾讯云并列第二,亚马逊排名第三。

 

未来规划

深化多元化部署,技术选型更加注重安全稳定与服务能力

在调研数据库用户的未来部署规划时,我们发现超过60%的用户计划未来使用更多类型的数据库产品,以满足日趋复杂的数字化业务场景。在产品架构选择上,以单机或集中式架构为主的数据库用户中,超过50%计划未来选用分布式数据库,其中计划采用原生式和中间件+分库分表的比例接近1:1。而在产品部署形态上的调研结果较为有趣,当前采用本地化部署形态的数据库用户中,超过60%的用户表示未来上云的意愿不强。究其原因,主要是市场环境与体制因素导致的国内外云计算市场的显著差异,具体体现为传统企业上云以项目制、定制化解决方案为主,以混合云带动公有云发展,理论发展前景大,但实际增速明显低于海外。

趋势一:出海

国产数据库的全新增量逻辑,风险与机会并存

随着基础软件领域成为资本热土,仅2021年新成立数据库公司超30家,新兴厂商核心团队普遍来自大厂,技术扎实,经验丰富,产品各具特色,性能较佳,并且资金充裕。但另一方面,国内数据库市场的用户侧呈现如下特点:第一,互联网用户多采用开源或自研数据库,极少使用新兴的产品;第二,政企类用户具备完善的产品和服务生态,新兴厂商难切入;第三,缺乏互联网+新“风口”带动市场增量空间;第四,大量中小企业存续不稳定,对数据库需求不强烈。数据库厂商纷纷提出出海战略,创业公司自成立之初便定位国际化,但普遍面临信任度、监管、地理位置等障碍,而上云、开源、新技术敏感度成为除基础技术以外,国产数据库顺利出海的关键要素。

趋势二:云原生

上层需求驱动,底层技术支撑,存算分离,优化资源编排

数据库云托管解放了底层硬件的管理成本和计算资源约束,但底层存算一体的资源绑定导致无效成本和资源浪费。云原生数据库实现了云资源对数据库的细粒度资源拆解,符合业务的资源编排。尽管各家厂商的架构设计和创新思路不尽相同,但可总结为“软硬兼施”。在软件层面,计算层打包SQL语句解析、物理计划执行、事务处理等,共享存储层存放事务日志和数据存储,并通过分布式技术保障高可用和一致性,最后二者采用高速网络互联,通过数据传输协议或其他技术提升I/O 性能。此外,云原生数据库的分层架构还需结合新硬件技术的特性进行重构,如运用可扩展 CPU和高主频内核进行算力优化,运用持久内存 (PMEM) 重构二级缓存以提升 I/O 密集型场景下的读写性能。未来数据库将进入从硬件平台到架构层再到应用层的全栈优化时代。

趋势三:湖仓一体

数据库与大数据技术边界不断模糊,呈现融合趋势

以 Hadoop 为代表的大数据技术以低成本的方式提供海量数据的开发和运行处理,但缺点是结构化能力较差,早期不支持 SQL语句解析。随着大数据技术发展,基于 Hadoop 的数仓工具 Hive 开始提供 SQL查询功能,但整体性能较差。随后支持 SQL 查询的工具(如Spark SQL)开始涌现,大数据技术的分析处理能力提升,结构化趋势明显。另一方面,数据库天然具备强结构化能力,尤其关系型数据库原生支持SQL 查询,但早期存储成本高,对海量数据的支持能力不足。但随着对象存储(OSS)被广泛应用,其低成本、高可用、数据持久及按需付费的特点,让数据库产品能够应对轻体量的大数据场景。由此,随着数据技术的发展创新,数据库与大数据技术的边界不断模糊,二者互相延伸。我们认为传统大数据技术有着更为丰富的生态,但是对技术要求较高,相比较而言,从仓向湖的延伸路线,更适合传统企业和中小企业。

研究报告 | 2017年中国商业智能行业研究报告


温馨提示:菜单栏“免费报告—免费报告索取”项目已更新报告库系统,40个大行业1560份报告可在百度云盘下载,请先申请百度云盘账号转存后下载阅读!






研究报告 | 2017年中国商业智能行业研究报告


商业智能行业概念界定


供企业、投资人、券商、投行、风控等相关人员参考交流


商业智能的下一步,智能化与自动化

商业智能(BI,Business Intelligence)概念的提出可追溯至1958年,通常将其视为把企业中现有数据转化为知识,帮助企业做出明智的业务经营决策的工具。过去的商业智能不能给出决策方案,也不能自动处理企业运行过程中遇到的问题。借助于人工智能与其他相关学科的技术进步,现代商业智能已能在特定场景中实现商业经营的智能化与自动化。因此,本报告聚焦于将人工智能技术用于商业智能决策,试图对人工智能在商业落地的真实现状进行说明,凸显AI技术(不包括智能语音、计算机视觉等感知智能)在现阶段应用的价值。


研究报告 | 2017年中国商业智能行业研究报告



商业智能与大数据



大数据为商业智能的发展提供土壤


互联网、移动互联网高速发展,海量、高维度且可实时接入更新的数据随之而来,为机器学习等前沿技术在各领域中的探索及落地提供可能,进一步拓展了被服务人群且显著提升服务质量。另一面,产业缺乏通用标准约束,数据在采集及流转过程中污染程度不一,数据加密不规范引致的数据泄露时有发生,数据孤岛亦成为企业业务发展的掣肘(如金融方面,企业多为基于自身平台积累的独有数据做征信,评分适用范围将大大受限),通用标准的建立需要政府及产业界的共同努力。


研究报告 | 2017年中国商业智能行业研究报告



商业智能与大数据



从数据驱动认知,到数据驱动决策


智能技术的运用一方面将拓展大数据的应用场景,从帮助业务人员认知到实现企业最优决策,另一方面,自然语言处理的进步也正在解决人机交互的部分问题,自然语言查询、自然语言生成都将进一步释放商业智能的效率和价值。


研究报告 | 2017年中国商业智能行业研究报告



商业智能应用场景



商业智能主要应用于金融、电商、物流、出行等领域


类比人类智能,人工智能可分为赋予机器语音、图像等感知能力的感知智能和赋予机器思考能力的认知、决策智能。认知能提升感知(如对语义的理解判断将提升机器的语音识别率),感知也会辅助决策(如智慧商超中机器视觉对客流属性、消费行为的观察、记录可辅助商超做出营销决策),本报告聚焦于认知智能在商业场景中的应用情况。


研究报告 | 2017年中国商业智能行业研究报告



中美商业智能环境对比



中美同属商业智能第一方阵,发展态势各有千秋


过去的几十年中,中国科技智能环境不如西方几乎成了很多人的刻板印象,但在如今的商业智能领域,我国从“中国制造”到“中国智造”,从奋起直追到弯道超车,已进入商业智能领域第一方阵,成为发展最快的国家之一。总的来说,由于中美文化差异、人口差别、工作强度不同等因素,相比美国,中国将技术落地的加速度更快,新兴商业模式拓展力强,但业务的发展仍缺乏全面性与标准化。目前,中国通过单点突破弯道超车,并开始重视精细化运营,由局部最优逐渐向全局最优靠拢。


研究报告 | 2017年中国商业智能行业研究报告



中国商业智能技术环境



论文成果达到国际一线水平,企业积极应用创新性成果


AAAI(The Association for the Advancement of Artificial Intelligence)是人工智能领域顶级的综合性会议,会议论文涉及机器学习、自然语言处理、搜索、规划、视觉、知识表达等人工智能各分支的学术探讨和应用研究。2017年AAAI大会收到论文2571篇,创下新高,中国学者的论文提交量与录用率均达到国际一线水平,与美国持平。收录论文不仅有来自高校学者,还有来自百度、腾讯、华为、360、今日头条等企业研究人员,如百度的《Collaborative Company Profiling:Insights from an Employee’s Perspective》——从员工角度出发,尝试利用AI让企业人力价值最大化。

国内企业与高校间的合作也愈发紧密,腾讯即有与香港科技大学的实验室合作,高校可利用企业的海量数据与测试平台,企业则可将创新性成果落地实践。需要指出的是,尽管目前AI的商业应用中国并不落后甚至在某些维度领先美国,但在原创性研究、创新土壤、人才储备方面,中美仍有较大差距。


研究报告 | 2017年中国商业智能行业研究报告



商业智能产业图谱



研究报告 | 2017年中国商业智能行业研究报告



商业智能行业投融资梳理



行业集中度低,融资火热,天使轮、A轮居多


商业智能应用场景众多,包括营销、金融、交通等领域,各领域涉及企业众多,行业集中度较低,融资方面,2012-2016年最为火热,其中,2015年融资次数达到31次,同时有两家新三板挂牌企业,是2012-2016年中融资次数最多的一年;从融资轮次来看,大部分融资尚处于早期的天使轮、A轮阶段;另外,从企业所涉领域来看,服务于金融领域的企业最受资本市场青睐。


研究报告 | 2017年中国商业智能行业研究报告



商业智能核心技术剖析



了解技术是发展技术的前提


人工智能正在重塑科学、技术、商业、政治以及战争,而大众对技术的认知程度和该技术的重要性相比显得远远不够。即使只有工程师和机修工有必要知道汽车发动机如何运作,每位司机也都必须明白转动方向盘会改变汽车的方向、踩刹车会让车停下。另外,当今人工智能的各个分支其实在五十年前就已有相关基础,当时的一些科学家认为,人工智能的所有问题都将在十年内解决。但事实是直到今天,很多问题仍悬而未决并难以解决。过高的预期引致不当的失望,人工智能历史上的两次冬天无疑阻碍了技术、产业发展的步伐,并让踏实做事的人受到伤害。因此,我们有必要对商业智能技术的概念模型、发展现状与应用前景进行客观认知,了解它的能力与边界。


研究报告 | 2017年中国商业智能行业研究报告




核心技术之机器学习




机器学习概述


将数据输入计算机,一般算法会利用数据进行计算然后输出结果,机器学习的算法则大为不同,输入的是数据和想要的结果,输出的则为算法模型,即把数据转换成结果的算法模型。通过机器学习,计算机能够自己生成模型,进而提供相应的判断,实现某种人工智能。工业革命使手工业自动化,而机器学习则使自动化本身自动化。

研究报告 | 2017年中国商业智能行业研究报告



核心技术之机器学习



支持向量机、朴素贝叶斯、决策树、神经网络等经典算法


研究报告 | 2017年中国商业智能行业研究报告



核心技术之机器学习



人工智能、机器学习及深度学习的相互关系


近几年掀起人工智能热潮的深度学习,属于机器学习的一个子集,在思想和理论上并未显著超越二十世纪八十年代中后期神经网络学习的研究,但得益于海量数据的出现、计算能力的提升,原来复杂度很高的算法得以落地使用,并在边界清晰的领域获得比过去更精细的结果,大大推动了机器学习在工业实践中的应用。但值得指出的是,深度学习的应用范围还很有限,统计学习仍然在机器学习中被有效地普遍采用。另外,人工智能不是一种特定的技术方法,所有方法都是在对人工智能这个课题进行研究的产物。机器学习和象征着理性主义的知识工程、行为主义的机器人一样,是人工智能的一个分支。


研究报告 | 2017年中国商业智能行业研究报告



核心技术之知识图谱



知识图谱的应用


就覆盖范围而言,知识图谱可分为应用相对广泛的通用知识图谱和专属于某个特定领域的行业知识图谱。通用知识图谱注重广度,强调融合更多的实体,主要应用于智能搜索等领域。行业知识图谱需要考虑到不同的业务场景与使用人员,通常需要依靠特定行业(如金融、公安、医疗、电商等)的数据来构建,实体的属性与数据模式往往比较丰富。


研究报告 | 2017年中国商业智能行业研究报告



核心技术之运筹学



运筹学概述



研究报告 | 2017年中国商业智能行业研究报告



核心技术之运筹学



从军事到民用,优化各领域组织决策


最早期的较为正式的运筹学活动出现在第二次世界大战时期,有一批英国的科学家着手研究利用科学方法进行决策,以最佳使用战时资源,当时的工作小组将自己的工作称为Operational Research(简称OR)。战后的工业复苏时期,运筹学思想被引入民用领域,用来应对组织中与日俱增的复杂性和专业化所产生的问题,大幅提升了生产力。虽然运筹学的大部分实践应用产生的效益小于下表所列案例,但这些典型反映了大型的计划完善的运筹学的研究可能带来的重要影响。


研究报告 | 2017年中国商业智能行业研究报告



商业智能应用之广告营销



精准营销负责引流获客,个性化推荐促活留存


商业智能在广告营销领域的主要应用为精准营销与个性化推荐,两者均通过用户数据,对用户贴标签,并基于产品特征与投放需求,建立不同的决策模型进行营销;两者最大的不同在于,精准营销用于引流获客阶段,以短信或优惠券的方式进行营销,提升响应率,优化企业运营;个性化推荐用于留存促活阶段,使得消费者在最合适的时间,以最恰当的方式,获得最合意的产品、资讯以及服务的推荐。


研究报告 | 2017年中国商业智能行业研究报告



商业智能应用之电商



收益管理的本质是优化


商业智能在电商领域的主要应用为商品组合、定价策略、促销管理等多方面的优化,可归结为收益管理,即指在适当的时间和地点下,以合适的价格向不同的用户提供最恰当的服务或产品,以实现资源约束下,企业收益最大化的目标。收益管理最早起源于航空运输业,当时的民航处于价格管制状态,为解决旅客误机导致的座位虚耗、企业收益流失,出现了“超售”思想,除航空业外,收益管理也广泛应用于酒店服务、电子商务、交通出行以及物流运输等领域。


研究报告 | 2017年中国商业智能行业研究报告



商业智能应用之交通出行



通过人工智能+运筹学,最小化路程与出行时间


路径优化是指如何找到从出发地到达目的地之间最短时间、最优价格的最短路径;订单分配研究的是供需匹配问题,结合多维度影响因素(例如路途距离、路况、骑手骑行速度、需求时间段等)匹配需求和供给;另外,除路径优化与订单分配外,电商领域中提到的定价优化也应用于交通出行,例如网约车定价,但与电商不同的是,网约车因其需求的及时性要求较强,账号共享性弱,使其拥有更大的个性化定价空间。

路径优化可理解为寻求由起点出发,通过所有给定需求点后再回到原点的最短路径问题,路径优化诞生于TSP问题(Traveling Salesman Problem,旅行销售员问题),即访问除原出发结点以外的每个节点一次且仅一次,应用场景例如拼车实时路线规划、某些货物需在某一时间段送到(时间窗口)。

订单分配可理解为供需匹配问题,供需匹配可分为静态匹配与动态匹配,静态匹配即有n个需求,n个供给,每一个供给只能满足一个需求,每一个需求也只需要一个供给,应用场景例如物流追踪、车辆与乘客静态匹配等;当匹配双方并非事先确定时,则为动态匹配问题,动态匹配的本质在于优化结合随机建模,当匹配的一端实时产生时,以优化模型决定如何匹配能够达到最大价值,应用场景例如网约车随时产生的乘客与车辆匹配。


研究报告 | 2017年中国商业智能行业研究报告



商业智能应用之供应链



通过大数据与优化技术提升供应链系统效率与柔性



研究报告 | 2017年中国商业智能行业研究报告



商业智能应用之金融风控



利用数据与技术,提高风控准确率,布局全流程风控


金融的本质在于给风险定价,对于风险及时且有效的识别、预警、防控一直是金融机构的核心。金融风控强调数据与技术,智能风控企业结合高维度的大数据,利用决策树、神经网络等机器学习技术,针对信贷评级、授信、贷后预警,反欺诈等场景提供解决方案,传统金融机构由过去的以经验或小量数据对风险进行把控,到现在以大数据及技术进行风控,实现金融风控升级。但同时,精细化运营全覆盖也是风控市场需考虑的关键点,即从系统的第一层出发,做全流程的金融风控,识别真正符合金融产品的优质客户,当潜在用户的信用存在风险时,应从营销端就避免引入此类风险用户。

研究报告 | 2017年中国商业智能行业研究报告



商业智能应用之投研分析



人机协作,助力投研分析质效提升


商业智能在投研分析中的应用可与食材料理类比,将原始数据比喻成料理中的原料A,A被清洗择选后成为可用烹饪原料B,参考不同料理食谱,对B进行制作,最终生成佳肴,映射于投研分析领域中,清洗择选方法包括去重、数据排序、实体发现、实体关联、领域知识图谱等,食谱即不同算法与模型,最终生成可视化投研报告。与人工分析生成的报告不同,机器人报告最大的优势在于生成快、可以清晰明了的将大量数据进行罗列呈现;智能机器的效率相对高,但目前仍缺少创造性,在投研分析领域,机器人与分析师的协同合作将提升分析质量与效率。

研究报告 | 2017年中国商业智能行业研究报告



商业智能应用之智能投顾



自动化程度逐步提高,AI+投顾新模式将用户资金自动对接


智能投顾,顾名思义即人工智能+投资顾问。传统的投资顾问相当于私人银行中的客户经理通过与客户的深度沟通,结合客户个人的风险偏好和理财目标,传达给后台技术人员制定理财配置模型,再由客户经理将此方案给到客户;智能投顾可被理解为将私人银行的后台标准服务线上化。相比传统投顾,智能投顾拥有可简化流程、适合全民理财、可定制短/中/长多周期投资方案、可进行风险预警等优势,同时也面临客户对机器的弱信任感问题、现阶段政策以及所需客户财务状况全面性等限制与挑战。


研究报告 | 2017年中国商业智能行业研究报告



商业智能的挑战与未来



从强调单一技术,到各领域融会贯通


在大数据的背景下,商业场景中任一问题的解决,往往是多学科思想的交融,而非对单一方法的依赖。在计算机科学、人工智能、运筹学、博弈论等诸多学科领域的综合与交叉中,一个个贴合实际业务场景的解决方案应运而生,使得商业智能切实优化企业决策方式,助力业务增长。融合也表现在人工智能的各分支上,如关于语义网的研究,自然语言理解、机器学习、人机交互都很重要。最后,任何一种学习算法都有自己的优势和局限,所谓的解决一切问题的终极算法,很有可能是对现有算法的兼容并包。当然,如何让各算法相遇相融并在不大幅降低效率的前提下提升通用性,仍是一个非常复杂但值得探索的难题。

研究报告 | 2017年中国商业智能行业研究报告



商业智能的挑战与未来



技术以外,对场景的理解是产业升级的关键


在人工智能成为产业界、学术圈、投资人以及媒体关注的焦点以来,大众对深度学习等技术尤为关注。但在工业实践中,对具体业务场景的理解与对实际问题的界定,与采用何种模型、算法同等重要,前者在很大程度上决定了后者是否能够有效降低企业运营成本或者帮助相关业务增加收入,这是技术能够落地、产业得以升级的关键。

在AAAI2017中,Uber人工智能实验室主任Gary Marcus即表示当前飞速发展的深度学习等技术可能只是在不断逼近通用人工智能的一个局部最优点,而这样的逼近方式可能让我们错过那些真正更好地实现通用人工智能的方法。因此,在运用技术解决某个问题之前,绝不应先入为主地认定要是用某个具体的机器学习算法,而应首先对业务场景加以分析,抓住核心问题要素,这是做出最优技术选择的前提。


研究报告 | 2017年中国商业智能行业研究报告


商业智能的挑战与未来


智能的落地是一项系统工程,企业的工程实践能力有待增强


商业智能业务应用的落地需要建立在完善的数据整合、管理之上,再由相应的算法、模型基于高效的计算框架将数据转化为可视化的业务规律,进一步驱动或直接生成企业决策,因此商业智能是一项系统工程,算法设计、架构搭建、系统配合、流程控制、质量监督、危机处理等缺一不可,项目工程经验非常重要。

另一方面,类比国际顶级SaaS企业Salesforce,其产品通用功能大概只占50%,产品背后依然有大量供应商及自身服务团队结合客户差异化的场景做定制服务,因此尚处早期的商业智能领域,在很长一段时期内,服务方式仍将以定制化的解决方案为主(尤其面对大企业的时候),以SaaS等标准化的产品为辅,并在部分场景中以PaaS服务接入客户ERP、CRM等信息系统,快速、低成本地将商业智能赋能于企业。


精彩推荐


1. 

2. 

3. 


公众号ID:report58
免费提供460个细分行业研究报告!

行业研究报告(report88的子号)


文章非声明均来源于网络,如有侵权请联系我们删除!


商务合作,关注以下联系方式:

邮箱2047003700@qq.com   报告咨询:156 2525 9716   项目投融咨询微信x6229927

以上是关于2022年中国数据库研究报告的主要内容,如果未能解决你的问题,请参考以下文章

超融合中国力量崛起,IDC2022年Q1报告出炉浪潮中国市场位列前三

AppCube视角浅析: 艾瑞咨询《2022年中国低代码行业研究报告》

2022年中国智能驾驶产品的量产应用研究

2022年中国智能驾驶产品的量产应用研究

2022年全球及中国抑菌卫生巾行业头部企业市场占有率及排名调研报告

阿里云丨2022年中国机器人产业图谱