大数据与云计算期末复习

Posted -巴黎的雨

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据与云计算期末复习相关的知识,希望对你有一定的参考价值。

大数据与云计算期末复习

文章目录

练习一

选择题

  1. “云计算”名称中的“云”,其渊源来源于以下哪种说法?
    A. 云计算某些方面向云一样不可捉摸
    B. 云计算的支撑技术互联网常以一个云状图案来表示,因此提供资源的网络常被成为“云”。
    C. 云计算的规模一般像云一样广阔
    D. 用户无法看到云计算中包含的资源,如同隐藏在云的后面
  2. 以下哪一项不是云计算的特点?
    A. 按需自助服务
    B. 广泛的网络接入
    C. 资源互补
    D. 快速弹性伸缩
  3. 以下哪种服务与云计算无关?
    A. 百度网盘
    B. 瞩目会议系统
    C. 有道云笔记
    D. 钱龙股票交易系统
  4. 以下关于资源池化的说法哪些是错误的?
    A. 资源池化是实现按需自助服务的前提之一
    B. 资源池化相当于资源归类
    C. 资源池化需将所有的资源分解到最小单位
    D. 资源池化可以屏蔽不同资源的差异性

填空题

  1. 云计算技术将计算资源、存储资源以及其他各类资源通过网络以服务的形式提供给资源用户。
  2. 网络技术是云计算的基础支撑。云时刻都离不开互联网网络。
  3. 为云服务提供网络接入服务的互联网服务提供商的英文简称为ISP
  4. . 按照云计算的运营模式分类,云可以分为公共云私有云
  5. IaaS以服务形式提供基于服务器和存储等硬件资源的可高度扩展和按需变化的IT能力。通常按照所消耗资源的成本进行收费。
  6. PaaS位于云计算三层服务的中间,通常也称为“云操作系统”,提供给终端用户基于互联网的应用开发环境,包括应用编程接口和运行平台等。

练习二

选择题

  1. 关于云计算的快速弹性伸缩,以下哪些说法是错误的?
    A. 弹性化扩张能力被认为是吸引用户拥抱云计算的核心理由之一。
    B. 快速弹性伸缩是指云用户可以根据自己的需要,自动透明地扩展IT资源。
    C. 快速弹性伸缩必须人为手动扩容或减容。
    D. 快速弹性伸缩能使用户在保证业务或者应用稳定运行的前提下节省成本。
  2. 关于云计算的计量服务,以下哪些说法是错误的?
    A. 计量是计费的基础。
    B. 云计算中的服务都是根据使用时间来进行计量的。
    C. 云计算系统中一般都有计费管理系统,专门用于收集和处理使用数据。
    D. 使用配额的计费系统,超出配额时会阻止云用户的进一步使用请求。
  3. 以下哪些服务不属于云计算提供的服务?
    A. IaaS
    B. PaaS
    C. SaaS
    D. RaaS
  4. 以下哪些因素不是云计算技术诞生和发展的主要推动力?
    A. 网络带宽的提升
    B. 深度学习技术的出现
    C. 虚拟化技术的出现
    D. 移动互联网的发展
    E. 进入大数据时代
  5. 云计算带来的好处不包括:
    A. 节省成本
    B. 数据可以随时随地即时访问
    C. 提高适应能力,灵活扩展IT需求
    D. 增强了对用户隐私的保护
  6. 多租户技术是云计算的重要支撑技术。以下哪些因素不是多租户应用的一般特点?
    A. 使用隔离
    B. 数据安全
    C. 可恢复性
    D. 可扩展性
    E. 可协同性

练习三

选择题

  1. 以下属于计算虚拟化的是( )
    A.CPU虚拟化
    B.网络虚拟化
    C.内存虚拟化
    D.I/O虚拟化
    E.磁盘虚拟化
  2. 在华为FusionCompute架构中,担任主机角色的是( )
    A.CNA
    B.UVP
    C.KVM
    D.VRM
    FusionCompute,简称FC。有两部分组成:CNA+VRM。CNA又由两部分组成:UVP+VNA。UVP实现底层硬件的虚拟化,VNA实现对接VRM。VRM是集群级的一个管理平台。
  3. 以下描述能体现虚拟化优势的是( )
    A.使用虚拟化后,一台物理主机上可以同时运行多台虚拟机
    B.使用虚拟化后,一台物理主机的CPU利用率可以稳定在65%左右
    C.使用虚拟化后,虚拟机可以在多台主机间进行迁移
    D.使用虚拟化后,一台物理主机的操作系统上可以同时运行多个应用程序

练习四

思考题

  1. Google云计算技术包括哪些内容?
  2. 当前主流分布式文件系统有哪些?各有什么优缺点?
  3. GFS采用了哪些容错措施来确保整个系统的可靠性?
  4. MapReduce与传统的分布式程序设计相比有何优点?
  5. Google App Engine提供了哪些服务?
  6. 描述一个基于Amazon AWS的应用实例。
  7. 微软云计算平台包含几部分?每部分的作用是什么?
  8. Windows Azure存储服务提供了几种类型的存储方式?阐述每种存储方式主要的存储对象。

练习五

选择题

  1. 云计算是对( )技术的发展与运用。
    A. 并行计算
    B. 网格计算
    C. 分布式计算
    D. 以上都是
  2. 将基础设施作为服务的云计算服务类型是( )。
    A. IaaS
    B. PaaS
    C. SaaS
    D. 以上都不是
  3. 下列不属于Google云计算平台技术架构的是( )。
    A. 并行数据处理MapReduce
    B. 分布式锁Chubby
    C. 结构化数据表BigTable
    D. 弹性云计算EC2
  4. Google文件系统GFS通过( )方式提高可靠性。
    A. 双备份
    B. 冗余
    C. 日志
    D. 校验码
  5. Google文件系统GFS中客户端直接从( )处完成数据存取。
    A. 主服务器
    B. 桶
    C. 数据块服务器
    D. 管理块服务器
  6. 从研究现状上看,下面不属于云计算特点的是( )。
    A. 超大规模
    B. 虚拟化
    C. 私有化
    D. 高可靠性
  7. 与网格计算相比,不属于云计算特征的是( )。
    A. 资源高度共享
    B. 适合紧耦合科学计算
    C. 支持虚拟机
    D. 适用于商业领域
  8. 下列哪个特性不是虚拟化的主要特征( )。
    A. 高扩展性
    B. 高可用性
    C. 高安全性
    D. 实现技术简单
  9. 与开源云计算系统Hadoop HDFS行对应的商用云计算软件系统是( )。
    A.Google GFS
    B.Google MapReduce
    C.Google Bigtable
    D.Google Chubby
  10. MapReduce适用于( )
    A.任意应用程序
    B. 任意可在windows server 2008上运行的程序
    C.可以串行处理的应用程序
    D.可以并行处理的应用程序
  11. 以下服务器虚拟化技术中,需要修改GuestOS内核是( )
    A.CPU虚拟化
    B.全虚拟化
    C.内存虚拟化
    D.半虚拟化
  12. 迁移存储设备的最大障碍在于需要占用大量时间和网络带宽,通常的解决办法是( ),而非真正迁移。
    A.使用外存储设备进行迁移
    B.增大网络带宽
    C.使用分布式存储架构
    D.以共享的方式共享数据和文件系统
  13. 以下关于BigTable正确的说法有哪些( )?
    A.可以为应用提供简单的数据查询功能
    B.可以为MapReduce提供数据源或者数据结构的存储
    C.为第三方应用提供数据结构存储功能
    D.以上都对
  14. 以下关于Google文件系统GFS不正确的说法是哪个( )?
    A.GFS是一个开源的系统
    B.GFS处于Google云计算架构所有核心技术的底层
    C.GFS可以为第三方应用提供大尺寸文件存储功能
    D. GFS可以用来存储BigTable的子表文件
  15. 在Bigtable中,( )主要用来存储子表数据以及一些日志文件。
    A.SSTable
    B.Chubby
    C.GFS
    D.MapReduce
  16. 下面选项不属于Amazon提供的云计算服务是( )
    A.弹性云计算EC2
    B.简单存储服务S3
    C.简单队列服务SQS
    D.Net服务
  17. 云架构共分为( )两大部分。
    A.服务部分和管理部分
    B.服务部分和应用部分
    C.管理部分和维护部分
    D.维护部分和应用部分
  18. Xen提出的虚拟化产品交付中心结构不包括下面那条生产线( )
    A.服务器虚拟化
    B.应用虚拟化
    C.桌面虚拟化
    D.数据中心搭建支持
  19. 下列四种云计算方案中,服务间的耦合度最高的是( )
    A.亚马逊AWS
    B.微软Azure
    C.Google App Engine
    D.IBM的蓝云
  20. 亚马逊AWS提供的云计算服务类型( )
    A.SaaS
    B.Iaas
    C.PaaS
    D.三个选项都是
  21. 云计算技术的研究重点是( )
    A服务器制造
    B.将资源整合
    C.网络设备制造
    D.数据中心制造
  22. Amazon公司通过( )计算云,可以让客户通过WEB Service方式租用计算机来运行自己的程序。
    A.S3
    B.HDFS
    C.EC2
    D.GFS
  23. 以下关于PaaS和SaaS平台的说法中不正确的是( )
    A.SaaS软件必须部署在PaaS平台
    B.二者互为补充
    C.PaaS是SaaS企业为提高自己影响力、增加用户黏度而做出的一种尝试
    D.PaaS是SaaS发展的结果

填空题

  1. 网络计算是利用因特网技术,把分散在不同地理位置的计算机组成一台虚拟超级计算机。
  2. 基于平台服务与SaaS不同的,这种“云”计算形式把开发环境或者运行平台也作为一种服务给用户提供
  3. Hadoop分布式文件系统HDFS被设计成适合运行在通用硬件上的分布式文件系统
  4. BigTable是Google设计的分布式数据存储系统,用来处理海量的数据的一种非关系型的数据库。
  5. BigTable属于分布式存储技术。
  6. 云计算是对并行计算、网格计算和分布式计算技术的发展与运用。
  7. Google文件系统将整个系统的节点分为客户端、主服务器和数据块服务器的角色。
  8. 对提供者而言,云计算可以三种部署模式:即共有云、私有云和混合云
  9. Amazon公司通过EC2计算云,可以让用户通过WEB Service方式租用计算机来运行自己的应用程序。
  10. IaaS计算实现机制中,系统管理模块的核心功能是负载均衡
  11. 云安全的两个研究方向包括云计算安全和安全云
  12. SQL Azure主要提供基于云的操作系统数据库各种信息数据的服务。
  13. Windows Azure属于PaaS模式,平台包括一个云计算操作系统和一系列为开发者提供的服务。
  14. 云计算安全从云端到云中可划分为三个层次:云端安全性、应用服务层和基础设施
  15. Docker以容器为资源分割和调度的基本单位,封装整个软件运行时环境,为开发者和系统管理员提供用于构建、发布和运行分布式应用的平台。

判断题

  1. 云计算的消费者需要管理或者控制云计算的基础设施,例如网络,操作系统、存储等。✖
  2. 基于WEB服务同PaaS类似,服务提供者利用Web服务,通过Internet给软件开发者提供API应用接口,而不是整个应用程序。✔
  3. “云”计算服务可信性依赖于计算平台的安全性。✖
  4. 云计算是从网格计算演化而来的,能够随需应变地提供资源。✔
  5. 互联网就是一个超大云。✖
  6. MapReduce编程模型中的map和reduce每个过程都由不同的计算机进行并行计算处理。✖
  7. SaaS软件必须部署在PaaS平台。✖
  8. 云计算是可伸缩的,网格计算不是可伸缩的。✖
  9. SaaS 是一种基于互联网提供软件服务的应用模式。✔
  10. 简单的理解为云计算等于资源的闲置而产生的。✔
  11. BigTable 需要对存储在其中的数据做解析。✖
  12. 云计算产业的发展瞬息万变,具有强大的活力,这种不确定性也是战略性新兴产业的特征。✔

简答题

  1. 简述云计算的三种服务模式及其功能。
    • SaaS :软件即服务,这层的作用是将应用作为 服务提供给客户。
    • PaaS :平台即服务,这层的作用是将一个开发平台作为服务提供给用户。
    • Iaas :基础设施即服务,这层的作用 提供虚拟机或者其他资源作为服务提供给用户。
  2. 简述虚拟化与云计算的关系。
    虚拟化技术以及各种计算机科学概念,如效用计算、SOA等,的发展和商业实现打开了云计算的大门,而云计算本质上说应该就是虚拟化服务。 从虚拟化和云计算的过程,我们实现了跨系统的资源调度,将大量的计算机资源组成资源池,用于动态地创建高度虚拟化的资源提供给用户,从而最终实现应用、数据、IT资源以服务的方式通过网络提供给客户,可以说云计算是虚拟化的最高境界,虚拟化是云计算的底层结构。
  3. 简述云计算核心架构安全中的各项关键技术。
    • IaaS 层是云计算的基础。通过建立大规模数据中心, IaaS 层为上层云计算服务提供海量硬件资源。
    • PaaS 层作为 3 层核心服务的中间层,既为上层应用提供简单、可靠的分布式编程框架,又需要基于底层的资源信息调度作业、管理数据,屏蔽底层系统的复杂性。
    • SaaS 层面向的是云计算终端用户,提供基于互联网的软件应用服务。
    • 服务管理层,为了使云计算核心服务高效、安全地运行,需要服务管理技术加以支持。
  4. 简述云平台上开发应用的优势。
    • 提供高级编程接口,简单易用,缩短编程人员上手时间
    • 应用的开发与运行基于相同的平台,兼容性问题较少
    • 开发者无需考虑应用的可伸缩性、服务容量问题
    • 平台层的运营管理功能还能够帮助开发人员对应用进行监控和计费

练习六(详情见学习通PPT)

简答题

  1. 何谓大数据,大数据的基本特征有哪些?
  2. 简述科学研究的四种范式?
  3. 简述数据产生方式经历了哪几个阶段?
  4. 试述大数据对社会发展的重要影响主要体现在那些方面。
  5. 简述大数据计算模式。
  6. 简述大数据处理的基本流程。

论述题

  1. 举一个发生在身边的大数据具体应用的例子。
  2. 论述大数据、云计算和物联网三者之间存在何关联?
  3. 论述目前大数据所面临的问题及挑战有哪些?

练习七

单选题

  1. 下面关于数据的说法,错误的是:
    A 数据的根本价值在于可以为人们找出答案
    B 数据的价值会因为不断使用而削减
    C 数据的价值会因为不断重组而产生更大的价值
    D 目前阶段,数据的产生不以人的意志为转移
  2. 第3次信息化浪潮的标志是:
    A 个人计算机的普及
    B 互联网的普及
    C 云计算、大数据和物联网技术的普及
    D 人工智能的普及
  3. 物联网的发展最终导致了人类社会数据量的第三次跃升,使得数据产生方式进入了:
    A 手工创建阶段
    B 运营式系统阶段
    C 用户原创内容阶段
    D 感知式系统阶段
  4. 以下哪个不是大数据的“4V”特性:
    A 数据量大
    B 数据类型繁多
    C 处理速度快
    D 价值密度高
  5. 以下关于大数据、云计算和物联网的区别,描述错误的是:
    A 大数据侧重于对海量数据的存储、处理与分析,从海量数据中发现价值,服务于生产和生活
    B 云计算本质上旨在整合和优化各种IT资源并通过网络以服务的方式,廉价地提供给用户
    C 云计算旨在从海量数据中发现价值,服务于生产和生活
    D 物联网的发展目标是实现物物相连,应用创新是物联网发展的核心

多选题

  1. 数据的类型主要包括:
    A 文本
    B 图片
    C 音频
    D 视频
  2. 计算机系统中的数据组织形式主要有两种,分别是:
    A 文件
    B 视频
    C 音频
    D 数据库
  3. 为了让数据变得可用,需要对数据进行三个步骤的处理,分别是:
    A 数据清洗
    B 数据抽样
    C 数据管理
    D 数据分析
  4. 信息科技为大数据时代提供技术支撑,主要体现在哪三个方面:
    A 存储设备容量不断增加
    B CPU处理能力大幅提升
    C 量子计算机全面普及
    D 网络带宽不断增加
  5. 关于“大数据摩尔定律”,以下说法正确的是:
    A 人类社会产生的数据一直都在以每年50%的速度增长
    B 人类社会的数据量大约每两年就增加一倍
    C 人类在最近两年产生的数据量相当于之前产生的全部数据量之和
    D 人类社会的数据量以每年10%的速度增长
  6. 人类自古以来在科学研究上先后历经了哪几种范式:
    A 实验科学
    B 理论科学
    C 计算科学
    D 数据密集型科学
  7. 大数据将会对社会发展产生深远的影响,具体表现在以下哪几个方面:
    A 大数据决策成为一种新的决策方式
    B 大数据成为提升国家治理能力的新途径
    C 大数据应用促进信息技术与各行业的深度融合
    D 大数据开发推动新技术和新应用的不断涌现
  8. 大数据产业是指一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合。以下哪些属于大数据产业的某个环节:
    A IT基础设施层
    B 数据源层
    C 数据管理层
    D 数据分析层
  9. 以下关于大数据、云计算和物联网的联系,描述正确的是:
    A 从整体上看,大数据、云计算和物联网这三者是相辅相成的
    B 大数据根植于云计算,大数据分析的很多技术都来自于云计算
    C 大数据为云计算提供了“用武之地”
    D 物联网需要借助于云计算和大数据技术,实现物联网大数据的存储、分析和处理

练习八

  1. 简述HDFS的基本体系结构?
    HDFS是一个主/从(Master/Slave)式的结构,从最终用户的角度来看,HDFS就像传统的文件系统一样,可以通过目录路径对文件执行CRUD(增加(Create)、读取查询(Retrieve)、更新(Update)和删除(Delete),即增删查改)操作,但由于分布式存储的性质,HDFS拥有一个NameNode和一些DataNode。NameNode管理文件系统的元数据,DataNode存储实际的数据,而客户端通过与NameNode和DataNode的交互来访问文件系统。
  2. Hadoop的主要组成部分有哪些?
    HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Pig、Avro、Sqoop。
  3. MapReduce工作流程是什么?
    MapReduce处理大数据集的计算过程就是将大数据集分解为成百上千的小数据集,每个(或若干个)数据集分别由集群中的一个节点(通常就是一台普通的计算机)进行处理并生成中间结果,然后这些中间结果又由大量的节点进行合并,从而形成最终结果。
  4. MapReduce工作组件有哪些?
    Client、JobTracker、TaskTracker以及Task

以上是关于大数据与云计算期末复习的主要内容,如果未能解决你的问题,请参考以下文章

大数据期末复习重点

数据科学与大数据技术专业 —— 云计算●虚拟化 课程 期末复习卷及其简答

数据科学与大数据技术专业 —— 云计算●虚拟化 课程 期末复习卷及其简答

数据科学与大数据技术专业 —— 云计算●虚拟化 课程 期末复习卷及其简答

数据科学与大数据技术专业 —— 云计算●虚拟化 课程 期末复习卷及其简答

行业大数据期末复习