继续教育 (835,268)

  • MapReduce main接口设置和运行命令分别如下,请问MapReduce的输入文件为()

    public void main (string[] args)
    {
      String[] otherArgs = new GeneriOptionsParser(conf, args).getRemainingArgs();
      FileInputFormat.addInputPath(job, newPath(otherArgs[0]));
      FileOutputFormat.setOutputPath(job, newPath(otherArgs[1]));
    }

    命令:

    hadoop jar WordCount.jar /user/hadoop/hdfs/test.txt
    /user/hadoop/hdfs/out

    A. WordCount.jar

    B. /user/hadoop

    C. /user/hadoop/hdfs/test.txt

    D. /user/hadoop/hdfs/out

  • 对文件test.txt采用MapReduce进行分析, 输入文件处理阶段将文件分为10个分片,Map的中间处理数据被分为 3 个区,请问MapReduce 处理过程中Map 任务数和Reduce 任务数分别为多少( )

    A. 10 3

    B. 10 10

    C. 3 3

    D. 3 10

  • 关于 mapreduce框架中一个作业的 reduce 任务的数目, 下列说法正确的是()

    A、由自定义的 Partitioner 来确定

    B、是分块的总数目一半

    C、可以由用户来自定义,通过 JobConf.setNumReducetTask(int) 来设定一个作业中 reduce 的任务数目

    D、由 MapReduce随机确定其数目

  • 请问在 Hadoop体系结构中,按照由下到上顺序,排列正确的是()

    A、Common Hive HDFS

    B、Common MapReduce Pig

    C、HDFS MapReduceHBase

    D、HDFS Avro HBase

  • MapReduce框架中,在 Map和 Reduce之间的 combiner 的作用是()

    A、对 Map的输出结果排序

    B、对中间过程的输出进行本地的聚集

    C、对中间结果进行混洗

    D、对中间格式进行压缩

  • 下面哪个不是 Hadoop的输出数据格式()

    A、文本输出

    B、二进制输出

    C、单一输出

    D、多输出

  • 下列说法错误的是()

    A、Partitioner 负责控制 map输出结果 key 的分割

    B、Reporter 用于 MapReduce应用程序报告进度

    C、OutputCollector 收集 Mapper或 Reducer 输出数据

    D、Reduce的数目不可以是 0

  • Hadoop的哪个包的功能是表示层,将各种数据编码 / 解码,方便在网络上传输()

    A、fs

    B、ipc

    C、io

    D、net

  • 关于 FsShell 的说法,下面哪一项是正确的()

    A、FsShell 和 UNIX系统中的 shell 一样功能强大

    B、FsShell 实际上是一个 Java 应用程序

    C、可以在 FsShell 中执行 HDFS文件系统中的可执行文件

    D、FsShell 实际上是调用 UNIX的 shell 命令来实现复制操作

  • Hadoop中节点之间的进程通信是通过什么协议来实现的()

    A、HTTP

    B、SMTP

    C、SSH

    D、RPC