内容摘要
失效链接处理 MapReduce编程实战 PDF 下载 本站整理下载: 链接: https://pan.baidu.com/s/1yqwelFNOfxkKFSggYTaxEQ 提取码: vyac 相关截图: 主要内容: 3.2 设计思路 计算学生平均成绩是一个仿"WordCount"例子,用来重温一下开发MapReduce程序的流程。程序包括两部分的内容:Map部分和Reduce部分,分别实现了map和reduce的功能。 Map处理的是一个纯文本文件,文件中存放的数据时每一行表示一个学生的姓名和他相应一科成绩。Mapper处理的数据是由InputFormat分解过的数据集,其中InputFormat的作用是将数据集切割成小数据集InputSplit,每一个InputSlit将由一个Mapper负责处理。此外,InputFormat中还提供了一个RecordReader的实现,并将一个InputSplit解析成
对提供给了map函数。InputFormat的默认值是TextInputFormat,它针对文本文件,按行将文本切割成InputSlit,并用LineRecordReader将InputSplit解析成
对,key是行在文本中的位置,value是文件中的一行。 Map的结果会通过partion分发到Reducer,Reducer做完Reduce操作后,将通过以格式OutputFormat输出。 Mapper最终处理的结果对
,会送到Reducer中进行合并,合并的时候,有相同key的键/值对则送到同一个Reducer上。Reducer是所有用户定制Reducer类地基础,它的输入是key和这个key对应的所有value的一个迭代器,同时还有Reducer的上下文。Reduce的结果由Reducer.Context的write方法输出到文件中。 3.3 程序代码 程序代码如下所示: package com.
本站为你提供的『MapReduce编程实战 PDF 下载』为【百度云搜搜】搜索整理的结果,信息来源于第三方网站,本站只提供检索服务,不存储任何资源。本页面由蜘蛛程序自动抓取生成,如有侵权违规,可点击下方联系我们举报,我们立即删除。