继续教育 (835,268)

  • MapReduce main接口设置和运行命令分别如下,请问MapReduce的输入文件为()

    public void main (string[] args)
    {
      String[] otherArgs = new GeneriOptionsParser(conf, args).getRemainingArgs();
      FileInputFormat.addInputPath(job, newPath(otherArgs[0]));
      FileOutputFormat.setOutputPath(job, newPath(otherArgs[1]));
    }

    命令:

    hadoop jar WordCount.jar /user/hadoop/hdfs/test.txt
    /user/hadoop/hdfs/out

    A. WordCount.jar

    B. /user/hadoop

    C. /user/hadoop/hdfs/test.txt

    D. /user/hadoop/hdfs/out

  • 对文件test.txt采用MapReduce进行分析, 输入文件处理阶段将文件分为10个分片,Map的中间处理数据被分为 3 个区,请问MapReduce 处理过程中Map 任务数和Reduce 任务数分别为多少( )

    A. 10 3

    B. 10 10

    C. 3 3

    D. 3 10

  • 在 mapreduce任务中,下列哪一项会由 hadoop 系统自动排序()

    A、keys of mapper's output

    B、values of mapper's output

    C、keys of reducer's output

    D、values of reducer's output

  • 关于基于 Hadoop的 MapReduce编程的环境配置, 下面哪一步是不必要的()

    A、安装 linux 或者在 Windows下安装 Cgywin

    B、安装 java

    C、安装 MapReduce

    D、配置 Hadoop参数

  • 关于 mapreduce框架中一个作业的 reduce 任务的数目, 下列说法正确的是()

    A、由自定义的 Partitioner 来确定

    B、是分块的总数目一半

    C、可以由用户来自定义,通过 JobConf.setNumReducetTask(int) 来设定一个作业中 reduce 的任务数目

    D、由 MapReduce随机确定其数目

  • MapReduce框架分为 Map和 Reduce, 下列对 Reduce阶段叙述正确的是()

    A、主要分为 shuffle 和 sort 这 2 个阶段

    B、这个阶段过程中, key 的分组规则是不可更改的

    C、其中的 shuffle 和 sort 是同时进行的

    D、Reduce 数目的增加不会增加系统的开销

  • Hadoop中, Reducer 的三个阶段是()

    A、Shuffle ——Sort ——Reduce

    B、Shuffle ——Reduce——Sort

    C、Reduce——Shuffle ——Sort

    D、Sort ——Shuffle ——Reduce

  • 请问在 Hadoop体系结构中,按照由下到上顺序,排列正确的是()

    A、Common Hive HDFS

    B、Common MapReduce Pig

    C、HDFS MapReduceHBase

    D、HDFS Avro HBase

  • 关于 Hadoop下列说法错误的是()

    A、HDFS采用了 Master/Slave 的架构模型

    B、Namenode负责维护文件系统的命名空间

    C、Datanode 执行比如打开、关闭、重命名文件操作

    D、HDFS暴露了文件系统的命名空间,允许用户以文件的形式在上面存储数据

  • 下面哪个选项不是我们需要 Hadoop的主要原因()

    A、我们需要处理 PB级别的数据

    B、为每个应用建立一个可靠的系统是很昂贵的

    C、几乎每天都有结点坏掉

    D、把一个任务分割成多个子任务的方式是不好的