更多“批处理的源数据通常是封闭的,通常将需要处理的大批量数据存入硬盘,处理的时候再从硬盘中读取数据进行一次性处理,如果产生了中间结果,需将中间结果写入外存,再继续后面的处理,因此批处理的I/O操作相对更加频…”相关的问题
第1题
根据本讲,()指出大数据是为更新网络搜索索引需要同时进行批量处理或分析的大量数据集。
点击查看答案
第2题
Storm流式计算框架结构中包括Spout和Bolt两种组件。
点击查看答案
第3题
Bolt用于从外部数据源接收数据,然后将其喷发到拓扑中的相应组件中去。
点击查看答案
第4题
Storm集群中守护进程Supervisor运行在主结点上,负责代码分发,为工作结点分配任务故障监测;守护进程Nimbus运行在工作结点上,负责监听分配给所在工作结点的任务,即根据Nimbus的任务分配来决定启动或停止工作进程执行Storm拓扑,一个Supervisor可能执行拓扑的一部分,也可能执行完整的拓扑。
点击查看答案
第5题
Storm集群中Supervisor保存了Storm的状态信息。
点击查看答案
第6题
MapReduce中,Map任务接收从不同Reduce任务得到的键相同的键-值对,执行用户编写的Map函数,将键相同的键-值对中的所有值以Map函数指定的方式组合起来,得到键-值对并输出。
点击查看答案
第7题
推荐系统通过研究用户的兴趣爱好,帮助用户从大数据中发觉自己潜在的需求,进行个性化推荐,缓解或解决信息过载问题。
点击查看答案
第8题
基于内容推荐方法根据用户兴趣模型与每一个物项特征模型之间的相似性来进行推荐。
点击查看答案
第9题
基于用户的协同过滤推荐方法是根据用户相似性进行推荐。
点击查看答案
第10题
基于物项的协同过滤推荐方法是根据物项相似性推荐。
点击查看答案