企业首次创建云数据仓库时应该注意什么?

Posted 机房360网

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了企业首次创建云数据仓库时应该注意什么?相关的知识,希望对你有一定的参考价值。


在新的十年中,影响企业的主要技术发展趋势一定是云计算和大数据的应用!对于大多数企业来说,都选用了混合云策略,下面简要介绍下企业在首次构建云数据仓库时要注意哪些方面?


来源 | 企业网 

编辑 | Harris 


  在进入新的十年之际,社会经济因素将进一步推动企业成为业界关注的焦点。但是,如果要真正充分发挥企业市场对社会贸易的价值,并巩固其作为二十一世纪世界经济中心的地位,企业必须将不断的技术创新与开拓视为重中之重。未来十年,影响企业的主要技术发展趋势一定是云计算和大数据应用。

  对于大多数企业来说,根据调研机构Gartner公司的调查报告,实时、双向数据同步(更不用说无缝的、支持SDS的混合文件系统)尚未广泛部署。

  对于已经使用云计算进行备份的组织,合乎逻辑的第一步是添加存储网关,并在可用时利用提供云计算支持的存储阵列中的功能。这些将更紧密地将本地文件系统与云计算基础设施集成在一起,并使个人和应用程序能够使用熟悉的网络协议来访问云存储服务。

  对于许多混合用例而言,网关就足够了,例如,将数据提供给基于云计算的数据仓库或机器学习模型,以及将诸如用户目录和远程应用程序之类的远程办公室文件系统聚合到中央云存储库。

  追求集成混合云存储环境的企业应首先评估其业务和应用程序需求,以及现有存储系统的局限性或不足之处,以优先考虑功能并指导设计。在评估产品时,请寻求那些支持标准协议和多个云供应商的产品-至少是三大供应商:AWS、Azure和Google Cloud,以最大化其IaaS选项并避免锁定。

    人们需要了解如何集成这个技术并使所有硬件、软件和服务有效地工作。传统上,大部分数据先在本地采集,然后传输回中央数据中心进行处理。然而,这种模式要求大量的数据流在云端进行传输。数据是聚合智能技术解决方案的粘合剂。而如今,数据在大部分企业中只发挥着非常基础的作用。对大多数企业来说,被采集、存储和保护的数据通常主要服务于企业运营目标和收益。

  大多数企业都有某种形式的混合云和云数据仓库策略。但是,其中许多内容都通过易于实施且显示出快速投资回报率的简单项目而进入市场。

  但是,初次尝试使用这种云数据仓库技术的组织可能想知道从哪里开始,并且如果失误将在时间和费用方面的代价很高。那么,组织应该怎么做才能最大程度地降低风险,并确保获得回报?  


1.

提高劳动力技能


  需要努力解决的一个问题是确保组织的员工技能已为过渡做好准备。

  云数据仓库技术的一个主要方面是它提供了大量的数据,并且在监控客户行为方面非常有益,但是如果组织的员工没有足够的技能来知道如何正确地利用它,就无法发挥它的潜力。

  SolarWinds公司首席技术官ThomasLaRock说,“在全球范围内建立数据仓库,具有低延迟和巨大的计算能力,已经不再是标准业务无法企及的。在以往花费数百万美元才能实现的工作,如今只需几百美元和一些PowerShell脚本就可以完成。组织可以轻松利用MicrosoftAzure和AWS之类的云计算提供商来为其数据分析需求分配硬件资源。但是,处理大数据需要认真的技能提升,这是毫无疑问的。但是这些新技能将拓宽组织IT专业人员的视野。对数据处理需要有着充分的了解,再加上传统的网络工程,最终将促进IT专业人员的职业发展,因此应被视为一项必要的投资。”


2.

建立充分的数据治理


  LaRock继续强调说,必须确保以不会产生无用的重复数据或孤立数据的方式管理组织数据的重要性。

  他说:“在实现数据仓库时,最常见的陷阱是管理、收集和聚合同一数据的多个副本。企业通常有很多数据仓库,如果它们构成数据仓库的一部分,就会产生冗余。如果要开始构建云数据仓库,则必须考虑建立适当的数据治理策略。有了这样的策略,就可以在实施数据仓库之前确定孤岛。”

  使用自助服务方式的非代码类型工具。这种结合意味着组织可以寻求快速获得价值,学习所做的并没有给组织带来价值,然后也可以快速发展,而不会遇到代价非常昂贵的失败,而失败本身就是一个获得价值的学习过程。


3.

规划新的架构是关键


  除了从小处做起,组织还必须通过仔细规划其云数据仓库架构来保持耐心,这一点至关重要。

  WhereScape公司副总裁兼欧洲、中东和非洲地区总经理RobMellor说:“组织需要注意在研究过程中会听到的一些误导。组织不仅可以将所有数据都放入云平台中,而且无需进行任何设计或架构即可开始对其进行分析。分析环境是经过计划和架构的,因此所有用户都可以理解和使用它。组织也无需将所有数据仓库迁移到云端,而无需重新设计。组织原有的数据仓库在清理过程中会遇到很多麻烦。但这是组织清除低效流程,浪费未使用资产(例如原有报表、可视化和分析已不再使用)空间的好时机。这也是使许多流程自动化以提高其效率的绝好机会。”


4.

利用现有模型


  企业第一次将数据仓库迁移到云中的决定可能不需要完全的新工作,并且可能需要从需要改进的现有体系结构中吸取教训。Exasol公司市场情报经理HelenaSchwenk表示:“应将迁移视为合理化和修改现有本地数据仓库的机会。组织需要确定可以修改、扩充或添加哪些数据资产和源,并采用渐进式迁移策略,以实现具有凝聚力的云数据仓库平台,包括适当的治理和监督。”


5.

确保可能的演变


  Schwenk表示,组织需要了解如何使用内部经常使用的数据以外的其他种类数据的重要性。云计算的大数据(尤其是公共云)可以从外部影响的整合中受益。

  她说:“组织需要研究公共云如何支持新的数据工作负载或业务用例。例如,考虑通过利用云数据仓库的规模和弹性来支持更多的数据可供分析使用,从而在云数据仓库中支持高级分析和数据科学。那些更新的云原生数据源(例如社交媒体数据和来自传感器的数据),在提供对业务的更深入,更深刻的理解方面可能会极大地受益。”


6.

考虑采用无服务器技术


  UnravelData公司国际区域副总裁JustynGoodenough建议考虑使用无服务器技术。

  他说:“无服务器关系数据库是商业智能应用程序和发布数据以供其他系统使用的常见选择。它们提供了规模,性能以及最重要的是对准备好的数据的基于SQL的访问。供应商的示例包括AWSRedshift、GoogleBigQuery和AzureSQL数据仓库。这些对大小适中和相对简单的数据结构非常有用。对于更高的性能和复杂的关系数据模型,大规模并行处理(MPP)数据库在内存中存储大量数据,并且可以快速发展,但往往代价高昂。”


7.

研究和寻求专业知识


  最后,首次开始使用云数据仓库技术时应考虑的两个技巧可能适用于任何新的业务活动,甚至是生活中的风险。除了开展自己的研究之外,组织还应与具有该领域框架和经验的专家合作。这将有助于最大程度地降低采用云数据仓库的任何风险或挑战,并确保组织获得竞争优势,以充分利用其带来的收益。

  可以肯定的是,结合多种技术以实现价值的最大化将成为所有企业,尤其是智慧企业的普遍要求。


END.



有需求,找方案?

发邮件至 h_juanjuan@163.com 

或 微信:15110253765

好方案,寻报道?

发邮件至 h_juanjuan@163.com 

或 微信:15110253765


以上是关于企业首次创建云数据仓库时应该注意什么?的主要内容,如果未能解决你的问题,请参考以下文章

数据仓库,大数据和云计算有什么区别和联系?

火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0 (Ⅴ)

火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0 (Ⅳ)

火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0 (Ⅵ)

火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0(中)

7大云计算数据仓库