<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    Skynet

    ---------- ---------- 我的新 blog : liukaiyi.cublog.cn ---------- ----------

      BlogJava :: 首頁 :: 聯系 :: 聚合  :: 管理
      112 Posts :: 1 Stories :: 49 Comments :: 0 Trackbacks
    參考:
      http://hadoop.apache.org/common/docs/r0.15.2/streaming.html

    注意
      目前 streaming 對 linux pipe #也就是 cat |wc -l 這樣的管道 不支持,但不妨礙我們使用perl,python 行式命令??!
      原話是 :
      Can I use UNIX pipes? For example, will -mapper "cut -f1 | sed s/foo/bar/g" work?
        Currently this does not work and gives an "java.io.IOException: Broken pipe" error.
        This is probably a bug that needs to be investigated.
      但如果你是強烈的 linux shell pipe 發燒友 ! 參考下面
      $> perl -e 'open( my $fh, "grep -v null tt |sed -n 1,5p |");while ( <$fh> ) {print;} '
         #不過我沒測試通過 ??!

    環境 :hadoop-0.18.3
    $> find . -type f -name "*streaming*.jar"
    ./contrib/streaming/hadoop-0.18.3-streaming.jar


    測試數據:
    -bash-3.00$ head tt 
    null    false    3702    208100
    6005100    false    70    13220
    6005127    false    24    4640
    6005160    false    25    4820
    6005161    false    20    3620
    6005164    false    14    1280
    6005165    false    37    7080
    6005168    false    104    20140
    6005169    false    35    6680
    6005240    false    169    32140
    ......


    運行:
    c1="  perl -ne  'if(/.*\t(.*)/){\$sum+=\$1;}END{print \"\$sum\";}'  "
    # 注意 這里 $ 要寫成 \$    " 寫成 \"
    echo $c1; # 打印輸出  perl -ne 'if(/.*"t(.*)/){$sum+=$1;}END{print $sum;}'
    hadoop jar hadoop-0.18.3-streaming.jar
      
    -input file:///data/hadoop/lky/jar/tt 
       -
    mapper   "/bin/cat" 
       -
    reducer "$c1" 
      
    -output file:///tmp/lky/streamingx8


    結果:
    cat /tmp/lky/streamingx8/*
    1166480

    本地運行輸出:
    perl -ne 'if(/.*"t(.*)/){$sum+=$1;}END{print $sum;}' < tt
    1166480

    結果正確!!!!


    命令自帶文檔:
    -bash-3.00$ hadoop jar hadoop-0.18.3-streaming.jar -info
    09/09/25 14:50:12 ERROR streaming.StreamJob: Missing required option -input
    Usage: $HADOOP_HOME
    /bin/hadoop [--config dir] jar \
              $HADOOP_HOME
    /hadoop-streaming.jar [options]
    Options:
      
    -input    <path>     DFS input file(s) for the Map step
      
    -output   <path>     DFS output directory for the Reduce step
      
    -mapper   <cmd|JavaClassName>      The streaming command to run
      
    -combiner <JavaClassName> Combiner has to be a Java class
      
    -reducer  <cmd|JavaClassName>      The streaming command to run
      
    -file     <file>     File/dir to be shipped in the Job jar file
      
    -dfs    <h:p>|local  Optional. Override DFS configuration
      
    -jt     <h:p>|local  Optional. Override JobTracker configuration
      
    -additionalconfspec specfile  Optional.
      
    -inputformat TextInputFormat(default)|SequenceFileAsTextInputFormat|JavaClassName Optional.
      
    -outputformat TextOutputFormat(default)|JavaClassName  Optional.
      
    -partitioner JavaClassName  Optional.
      
    -numReduceTasks <num>  Optional.
      
    -inputreader <spec>  Optional.
      
    -jobconf  <n>=<v>    Optional. Add or override a JobConf property
      
    -cmdenv   <n>=<v>    Optional. Pass env.var to streaming commands
      
    -mapdebug <path>  Optional. To run this script when a map task fails 
      
    -reducedebug <path>  Optional. To run this script when a reduce task fails 
      
    -cacheFile fileNameURI
      
    -cacheArchive fileNameURI
      
    -verbose




    整理 m.tkk7.com/Good-Game
    posted on 2009-09-25 14:33 劉凱毅 閱讀(3369) 評論(0)  編輯  收藏 所屬分類: perl 、集群開發 、數據挖掘
    主站蜘蛛池模板: 久久亚洲一区二区| 99精品免费视频| 亚洲AV电影院在线观看| 四虎永久成人免费影院域名| 无码国产精品一区二区免费虚拟VR | 亚洲人精品午夜射精日韩| 国产成人免费ā片在线观看| 国产卡一卡二卡三免费入口| 久久免费观看国产99精品| 高清永久免费观看| 国产精品一区二区三区免费| 在线精品自拍亚洲第一区| 亚洲精品第一综合99久久| 亚洲成人网在线观看| 亚洲a在线视频视频| 亚洲韩国精品无码一区二区三区| 国产91精品一区二区麻豆亚洲 | 久久久亚洲精华液精华液精华液 | 成人久久免费网站| 羞羞视频免费网站在线看| 一级黄色片免费观看| 黄色免费网址大全| 美女免费视频一区二区三区| 亚洲AV无码成人精品区狼人影院| 一本色道久久综合亚洲精品蜜桃冫 | 亚洲色欲色欲www| 亚洲国产精品久久网午夜| 亚洲自偷自拍另类图片二区| 久久久无码精品亚洲日韩蜜臀浪潮| 久久九九亚洲精品| 亚洲av激情无码专区在线播放| 亚洲免费视频网站| 亚洲视屏在线观看| 亚洲18在线天美| 亚洲色无码国产精品网站可下载| 久久乐国产综合亚洲精品| 亚洲欧洲无码一区二区三区| 亚洲精品久久久久无码AV片软件| 大桥未久亚洲无av码在线| 免费精品久久久久久中文字幕| 一级毛片成人免费看a|