<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    ivaneeo's blog

    自由的力量,自由的生活。

      BlogJava :: 首頁 :: 聯(lián)系 :: 聚合  :: 管理
      669 Posts :: 0 Stories :: 64 Comments :: 0 Trackbacks

    http://code.google.com/p/nutla/ 

    1、概述
     不管程序性能有多高,機(jī)器處理能力有多強(qiáng),都會有其極限。能夠快速方便的橫向與縱向擴(kuò)展是Nut設(shè)計最重要的原則。
     Nut是一個Lucene+Hadoop分布式搜索框架,能對千G以上索引提供7*24小時搜索服務(wù)。在服務(wù)器資源足夠的情況下能達(dá)到每秒處理100萬次的搜索請求。
     Nut開發(fā)環(huán)境:jdk1.6.0.21+lucene3.0.2+eclipse3.6.1+hadoop0.20.2+zookeeper3.3.1+hbase0.20.6+memcached+linux

    2、特新
     a、熱插拔
     b、可擴(kuò)展
     c、高負(fù)載
     d、易使用,與現(xiàn)有項目無縫集成
    e、支持排序
    f、7*24服務(wù)
    g、失敗轉(zhuǎn)移

    3、搜索流程
    Nut由Index、Search、Client、Cache和DB五部分構(gòu)成。(Cache默認(rèn)使用memcached,DB默認(rèn)使用hbase)
    Client處理用戶請求和對搜索結(jié)果排序。Search對請求進(jìn)行搜索,Search上只放索引,數(shù)據(jù)存儲在DB中,Nut將索引和存儲分離。Cache緩存的是搜索條件和結(jié)果文檔id。DB存儲著數(shù)據(jù),Client根據(jù)搜索排序結(jié)果,取出當(dāng)前頁中的文檔id從DB上讀取數(shù)據(jù)。

    用戶發(fā)起搜索請求給由Nut Client構(gòu)成的集群,由某個Nut Client根據(jù)搜索條件查詢Cache服務(wù)器是否有該緩存,如果有緩存根據(jù)緩存的文檔id直接從DB讀取數(shù)據(jù),如果沒有緩存將隨機(jī)選擇一組搜索服務(wù)器組(Search Group i),將查詢條件同時發(fā)給該組搜索服務(wù)器組里的n臺搜索服務(wù)器,搜索服務(wù)器將搜索結(jié)果返回給Nut Client由其排序,取出當(dāng)前頁文檔id,將搜索條件和當(dāng)前文檔id緩存,同時從DB讀取數(shù)據(jù)。


    4、索引流程
    Hadoop Mapper/Reducer 建立索引。再將索引從HDFS分發(fā)到各個索引服務(wù)器。
    對索引的更新分為兩種:刪除和添加(更新分解為刪除和添加)。
    a、刪除
    在HDFS上刪除索引,將生成的*.del文件分發(fā)到所有的索引服務(wù)器上去或者對HDFS索引目錄刪除索引再分發(fā)到對應(yīng)的索引服務(wù)器上去。
    b、添加
    新添加的數(shù)據(jù)用另一臺服務(wù)器來生成。
    刪除和添加步驟可按不同定時策略來實現(xiàn)。

    5、Zookeeper服務(wù)器狀態(tài)管理策略

    在架構(gòu)設(shè)計上通過使用多組搜索服務(wù)器可以支持每秒處理100萬個搜索請求。
    每組搜索服務(wù)器能處理的搜索請求數(shù)在1萬—1萬5千之間。如果使用100組搜索服務(wù)器,理論上每秒可處理100萬個搜索請求。


    假如每組搜索服務(wù)器有100份索引放在100臺正在運行中搜索服務(wù)器(run)上,那么將索引按照如下的方式放在備用中搜索服務(wù)器(bak)上:index 1,index 2,index 3,index 4,index 5,index 6,index 7,index 8,index 9,index 10放在B 1 上,index 6,index 7,index 8,index 9,index 10,index 11,index 12,index 13,index 14,index 15放在B 2上。。。。。。index 96,index 97,index 98,index 99,index 100,index 5,index 4,index 3,index 2,index 1放在最后一臺備用搜索服務(wù)器上。那么每份索引會存在3臺機(jī)器中(1份正在運行中,2份備份中)。
    盡管這樣設(shè)計每份索引會存在3臺機(jī)器中,仍然不是絕對安全的。假如運行中的index 1,index 2,index 3同時宕機(jī)的話,那么就會有一份索引搜索服務(wù)無法正確啟用。這樣設(shè)計,作者認(rèn)為是在安全性和機(jī)器資源兩者之間一個比較適合的方案。

    備用中的搜索服務(wù)器會定時檢查運行中搜索服務(wù)器的狀態(tài)。一旦發(fā)現(xiàn)與自己索引對應(yīng)的服務(wù)器宕機(jī)就會向lock申請分布式鎖,得到分布式鎖的服務(wù)器就將自己加入到運行中搜索服務(wù)器組,同時從備用搜索服務(wù)器組中刪除自己,并停止運行中搜索服務(wù)器檢查服務(wù)。

    為能夠更快速的得到搜索結(jié)果,設(shè)計上將搜索服務(wù)器分優(yōu)先等級。通常是將最新的數(shù)據(jù)放在一臺或幾臺內(nèi)存搜索服務(wù)器上。通常情況下前幾頁數(shù)據(jù)能在這幾臺搜索服務(wù)器里搜索到。如果在這幾臺搜索服務(wù)器上沒有數(shù)據(jù)時再向其他舊數(shù)據(jù)搜索服務(wù)器上搜索。
    優(yōu)先搜索等級的邏輯是這樣的:9最大為搜索全部服務(wù)器并且9不能作為level標(biāo)識。當(dāng)搜索等級level為1,搜索優(yōu)先級為1的服務(wù)器,當(dāng)level為2時搜索優(yōu)先級為1和2的服務(wù)器,依此類推。

    posted on 2011-01-21 19:06 ivaneeo 閱讀(255) 評論(0)  編輯  收藏 所屬分類:
    主站蜘蛛池模板: 三级片免费观看久久| 亚洲国产成人综合| 一区在线免费观看| 国产一区二区免费在线| 亚洲成aⅴ人片久青草影院按摩| 57PAO成人国产永久免费视频| 亚洲视频一区在线| 亚欧免费视频一区二区三区 | 国产92成人精品视频免费| 亚洲AV区无码字幕中文色| 久久久久久AV无码免费网站下载 | 免费h黄肉动漫在线观看| 国产青草亚洲香蕉精品久久| 日本免费一本天堂在线| 美女被羞羞网站免费下载| 亚洲精品无码专区2| a级毛片免费全部播放| 亚洲国产第一页www| 免费福利视频导航| 在线视频亚洲一区| 国产福利电影一区二区三区,亚洲国模精品一区| 看一级毛片免费观看视频| 亚洲女人被黑人巨大进入| 免费一级不卡毛片| 亚洲av永久综合在线观看尤物| 成人免费视频软件网站| 亚洲色无码专区一区| 亚洲AV无码一区二三区 | 猫咪免费人成网站在线观看| 亚洲av乱码一区二区三区| 又粗又硬又黄又爽的免费视频| 好男人资源在线WWW免费| 亚洲高清无在码在线无弹窗 | 国产JIZZ中国JIZZ免费看| 亚洲成A人片在线观看无码不卡| 99久久久精品免费观看国产 | 亚洲欧美日韩一区二区三区 | 国产亚洲精品久久久久秋霞 | 亚洲AV成人一区二区三区观看| 亚洲无线一二三四区手机| 99国产精品免费观看视频|