<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-314  評論-209  文章-0  trackbacks-0
    Spark1.4發布,支持了窗口分析函數(window functions)。
    在離線平臺中,90%以上的離線分析任務都是使用Hive實現,其中必然會使用很多窗口分析函數,如果SparkSQL支持窗口分析函數,

    那么對于后面Hive向SparkSQL中的遷移的工作量會大大降低,使用方式如下:


    1、初始化數據

    創建表

    [sql] view plain copy
    1. create table window_test2 (url string, rate int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';  


    準備測試數據
    [plain] view plain copy
    1. url1,12  
    2. url2,11  
    3. url1,23  
    4. url2,25  
    5. url1,58  
    6. url3,11  
    7. url2,25  
    8. url3,58  
    9. url2,11  

    加載數據:

    [sql] view plain copy
    1. load  data local  inpath  '/opt/bin/short_opt/windows2.data' overwrite into table window_test2 ;  



    2、窗口函數測試

    查詢所有數據

    [sql] view plain copy
    1. select * from window_test2;  
    +-------+-------+
    |  url  | rate  |
    +-------+-------+
    | url1  | 12    |
    | url2  | 11    |
    | url1  | 23    |
    | url2  | 25    |
    | url1  | 58    |
    | url3  | 11    |
    | url2  | 25    |
    | url3  | 58    |
    | url2  | 11    |
    +-------+-------+


    分組排序:
    [sql] view plain copy
    1. select url,rate,row_number() over(partition by url order by rate descas r from window_test2;  
    +-------+-------+----+
    |  url  | rate  | r  |
    +-------+-------+----+
    | url1  | 58    | 1  |
    | url1  | 23    | 2  |
    | url1  | 12    | 3  |
    | url2  | 25    | 1  |
    | url2  | 25    | 2  |
    | url2  | 11    | 3  |
    | url2  | 11    | 4  |
    | url3  | 58    | 1  |
    | url3  | 11    | 2  |
    +-------+-------+----+


    分組統計sum
    [sql] view plain copy
    1. select url,rate,sum(rate) over(partition by url ) as r from window_test2;  
    +-------+-------+-----+
    |  url  | rate  |  r  |
    +-------+-------+-----+
    | url1  | 12    | 93  |
    | url1  | 23    | 93  |
    | url1  | 58    | 93  |
    | url2  | 11    | 72  |
    | url2  | 25    | 72  |
    | url2  | 25    | 72  |
    | url2  | 11    | 72  |
    | url3  | 11    | 69  |
    | url3  | 58    | 69  |
    +-------+-------+-----+



    分組統計avg
    [sql] view plain copy
    1. select url,rate,avg(rate) over(partition by url ) as r from window_test2;  
    +-------+-------+-------+
    |  url  | rate  |   r   |
    +-------+-------+-------+
    | url1  | 12    | 31.0  |
    | url1  | 23    | 31.0  |
    | url1  | 58    | 31.0  |
    | url2  | 25    | 18.0  |
    | url2  | 11    | 18.0  |
    | url2  | 11    | 18.0  |
    | url2  | 25    | 18.0  |
    | url3  | 11    | 34.5  |
    | url3  | 58    | 34.5  |
    +-------+-------+-------+


    分組統計count
    [sql] view plain copy
    1. select url,rate,count(rate) over(partition by url ) as r from window_test2;  
    +-------+-------+----+
    |  url  | rate  | r  |
    +-------+-------+----+
    | url1  | 12    | 3  |
    | url1  | 23    | 3  |
    | url1  | 58    | 3  |
    | url2  | 11    | 4  |
    | url2  | 25    | 4  |
    | url2  | 25    | 4  |
    | url2  | 11    | 4  |
    | url3  | 11    | 2  |
    | url3  | 58    | 2  |
    +-------+-------+----+



    分組lag
    [sql] view plain copy
    1. select url,rate,lag(rate) over(partition by url ) as r from window_test2;  
    +-------+-------+-------+
    |  url  | rate  |   r   |
    +-------+-------+-------+
    | url1  | 12    | NULL  |
    | url1  | 23    | 12    |
    | url1  | 58    | 23    |
    | url2  | 25    | NULL  |
    | url2  | 11    | 25    |
    | url2  | 11    | 11    |
    | url2  | 25    | 11    |
    | url3  | 11    | NULL  |
    | url3  | 58    | 11    |
    +-------+-------+-------+



    3、spark-1.4以后,支持所有的窗口函數了,有利用于hive作業向spark-sql來轉換。
    posted on 2017-10-23 22:04 xzc 閱讀(695) 評論(0)  編輯  收藏 所屬分類: hadoop
    主站蜘蛛池模板: 国产精彩免费视频| 男女免费观看在线爽爽爽视频 | 999久久久免费精品国产| 亚洲成色在线综合网站| 国产中文字幕在线免费观看 | 99国产精品免费视频观看| 亚洲AV无码久久| 嫩草成人永久免费观看 | 91丁香亚洲综合社区| 成人免费a级毛片| 亚洲国产精品无码久久九九大片| 波多野结衣久久高清免费| 成人精品国产亚洲欧洲| 中文字幕亚洲日韩无线码| 99久久精品毛片免费播放| 夜夜亚洲天天久久| 青春禁区视频在线观看直播免费| 亚洲女女女同性video| 免费在线观看的黄色网址| 丝袜捆绑调教视频免费区| 亚洲A∨无码一区二区三区| 亚洲日本在线免费观看| 亚洲AV成人影视在线观看| 免费一级毛片在线观看| 青柠影视在线观看免费高清| 亚洲综合久久久久久中文字幕| 成人免费一区二区三区在线观看| 日本精品久久久久久久久免费| 亚洲精品乱码久久久久久自慰| 18禁黄网站禁片免费观看不卡| 亚洲欧美熟妇综合久久久久| 亚洲日韩在线中文字幕第一页| 欧洲精品99毛片免费高清观看| 在线观看日本亚洲一区| 伊人亚洲综合青草青草久热| 最近中文字幕电影大全免费版| 亚洲AV无码国产精品永久一区| 亚洲中文字幕无码一区二区三区 | v片免费在线观看| 亚洲国产成人精品无码区在线网站| 日本免费福利视频|