位置:首页 > 题库频道 > 其它分类 > 招考类其它 > 企事业内部考试类电力电力计算机相关多选题

Spark比MapReduce计算快的原因有()。

发布时间:2024-07-13

A.基于内存的计算

B.基于DAG的调度框架

C.基于Lineage的容错机制

D.基于分布式计算的框架

试卷相关题目

  • 1Spark支持的计算模型有()。

    A.批处理

    B.实时计算

    C.机器学习模型

    D.交互式查询

    开始考试点击查看答案
  • 2Spark组件包含()两个算子。

    A.Map

    B.Action

    C.Transformation

    D.Reduce

    开始考试点击查看答案
  • 3下列关于Spark中RDD的描述正确的有()。    "

    A.RDD(Resilient Distributed Dataset)叫作弹性分布式数据集,是Spark中最基本的数据抽象"

    B.Resilient:表示弹性的

    C.Destributed:分布式,可以并行在集群计算

    D.Dataset:就是一个集合,用于存放数据

    开始考试点击查看答案
  • 4Spark容错性的方式有()。

    A.数据检查点

    B.存储原始数据

    C.记录数据的更新

    D.自建数据版本

    开始考试点击查看答案
  • 5RDD的特征有()。

    A.可容错性

    B.简洁性

    C.并行数据结构

    D.结构化

    开始考试点击查看答案
  • 6Spark的技术架构可以分为()。

    A.资源管理层

    B.Spark核心层

    C.应用层

    D.服务层

    开始考试点击查看答案
  • 7相对于Hadoop MapReduce,Spark的特点有()。

    A.通用性

    B.易用性

    C.速度快

    D.容错性

    开始考试点击查看答案
  • 8Spark的关键技术包括()。

    A.RDD

    B.Scheduler

    C.Storage

    D.Shuffle

    开始考试点击查看答案
  • 9Spark中的Scheduler模块可以分为()。

    A.DAGScheduler

    B.ResourceScheduler

    C.TaskScheduler

    D.JobScheduler

    开始考试点击查看答案
  • 10下列关于Pig的说法正确的有()。

    A.弥补MapReduce编程复杂性

    B.封装MapReduce处理过程

    C.PigLatin是一种数据分析语言

    D.适用于并行处理

    开始考试点击查看答案
返回顶部