伊在人亚洲香蕉精品区麻豆,久久久久久亚洲精品,亚洲高清不卡视频

<rt id="bn8ez"></rt>

<label id="bn8ez"></label>

<span id="bn8ez"></span>

<label id="bn8ez"><meter id="bn8ez"></meter></label>

<var id="pptmc"><address id="pptmc"><strong id="pptmc"></strong></address></var>

<label id="pptmc"><dl id="pptmc"></dl></label><cite id="pptmc"><fieldset id="pptmc"></fieldset></cite>

<ol id="pptmc"><dl id="pptmc"><meter id="pptmc"></meter></dl></ol>

首頁(yè) 新隨筆新文章聯(lián)系聚合

posts - 495,comments - 227,trackbacks - 0

mapreduce job讓一個(gè)文件只由一個(gè)map來(lái)處理

http://www.rigongyizu.com/mapreduce-job-one-map-process-one-file/

有一批數(shù)據(jù)用hadoop mapreduce job處理時(shí)，業(yè)務(wù)特點(diǎn)要求一個(gè)文件對(duì)應(yīng)一個(gè)map來(lái)處理，如果兩個(gè)或多個(gè)map處理了同一個(gè)文件，可能會(huì)有問(wèn)題。開(kāi)始想通過(guò)設(shè)置 dfs.blocksize 或者 mapreduce.input.fileinputformat.split.minsize/maxsize 參數(shù)來(lái)控制map的個(gè)數(shù)，后來(lái)想到其實(shí)不用這么復(fù)雜，在自定義的InputFormat里面直接讓文件不要進(jìn)行split就可以了。

public class CustemDocInputFormat extends TextInputFormat {

@Override

public RecordReader<LongWritable, Text> createRecordReader(InputSplit split, TaskAttemptContext context) {

DocRecordReader reader = null;

try {

reader = new DocRecordReader(); // 自定義的reader

} catch (IOException e) {

e.printStackTrace();

}

return reader;

}

@Override

protected boolean isSplitable(JobContext context, Path file) {

return false;

}

}

這樣，輸入文件有多少個(gè)，job就會(huì)啟動(dòng)多少個(gè)map了。

相關(guān)文章

2014年8月19日 Hadoop : 一個(gè)目錄下的數(shù)據(jù)只由一個(gè)map處理
2014年6月27日一個(gè)Hadoop程序的優(yōu)化過(guò)程 – 根據(jù)文件實(shí)際大小實(shí)現(xiàn)CombineFileInputFormat
2013年9月23日 hadoop用MultipleInputs/MultiInputFormat實(shí)現(xiàn)一個(gè)mapreduce job中讀取不同格式的文件
2012年1月9日 hadoop mapreduce和hive中使用SequeceFile+lzo格式數(shù)據(jù)
2014年3月11日 hadoop集群DataNode起不來(lái)：“DiskChecker$DiskErrorException: Invalid volume failure config value: 1”

posted on 2014-09-16 09:28 SIMONE 閱讀(531) 評(píng)論(0) 編輯收藏所屬分類(lèi): hadoop

新用戶(hù)注冊(cè) 刷新評(píng)論列表


只有注冊(cè)用戶(hù)登錄后才能發(fā)表評(píng)論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問(wèn)
相關(guān)文章: Storm集成Kafka編程模型 Hadoop作業(yè)調(diào)優(yōu)參數(shù)整理及原理 mapreduce job讓一個(gè)文件只由一個(gè)map來(lái)處理 hadoop用MultipleInputs/MultiInputFormat實(shí)現(xiàn)一個(gè)mapreduce job中讀取不同格式的文件一個(gè)Hadoop程序的優(yōu)化過(guò)程 – 根據(jù)文件實(shí)際大小實(shí)現(xiàn)CombineFileInputFormat

主站蜘蛛池模板：亚洲精品欧洲精品| 久久久亚洲精品视频| 日本黄页网址在线看免费不卡| 亚洲中文字幕伊人久久无码| 四虎影视成人永久免费观看视频| 亚洲成人免费网址| 亚洲精品线路一在线观看| 一区二区三区四区免费视频| 日本免费高清视频| 色窝窝亚洲AV网在线观看| 亚洲成a人片在线观看日本| 国产在线国偷精品产拍免费| 国产精品美女久久久免费| 亚洲一级在线观看| 亚洲毛片网址在线观看中文字幕| 亚洲欧洲中文日韩av乱码| 久久亚洲中文字幕精品一区四| 毛片免费在线视频| 亚洲免费观看视频| 美女黄网站人色视频免费| 亚洲国产超清无码专区| 国产精品亚洲片在线va| 亚洲AV永久无码精品一百度影院| 免费乱理伦在线播放| 日韩人妻一区二区三区免费| 国产精品高清免费网站| 久久久精品国产亚洲成人满18免费网站| 亚洲欧洲日韩极速播放| 亚洲国产成人久久综合一| 亚洲成a人片在线观看久| 在线观看人成视频免费| 91网站免费观看| 黄网站色视频免费在线观看的a站最新| 青青草原1769久久免费播放| 亚洲三级高清免费| 99ee6热久久免费精品6| AV免费网址在线观看| 亚洲国产精品日韩| 亚洲乱亚洲乱淫久久| 亚洲欧美日韩一区二区三区| 亚洲免费在线观看视频|

<u id="xxzmo"><form id="xxzmo"></form></u>

<abbr id="xxzmo"><dl id="xxzmo"><acronym id="xxzmo"></acronym></dl></abbr>