<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    走在架構師的大道上 Jack.Wang's home

    Java, C++, linux c, C#.net 技術,軟件架構,領域建模,IT 項目管理 Dict.CN 在線詞典, 英語學習, 在線翻譯

    BlogJava 首頁 新隨筆 聯系 聚合 管理
      195 Posts :: 3 Stories :: 728 Comments :: 0 Trackbacks

    本人作為一位web工程師,著眼最多之處莫過于 性能與架構,本次幸得參與sd2.0大會,得以與同行廣泛交流,于此二方面,有些心得,不敢獨享,與眾博友分享,本文是這次參會與眾同撩交流的心得,有興趣者可以查看視頻

    架構設計的幾個心得:


    一,不要過設計:never over design

    這是一個常常被提及的話題,但是只要想想你的架構里有多少功能是根本沒有用到,或者最后廢棄的,就能明白其重要性了,初涉架構設計,往往傾向于設計大而化一的架構,希望設計出具有無比擴展性,能適應一切需求的增加架構,web開發領域是個非常動態的過程,我們很難預測下個星期的變化,而又需要對變化做出最快最有效的響應。。

    ebay的工程師說過,他們的架構設計從來都不能滿足系統的增長,所以他們的系統永遠都在推翻重做。請注意,不是ebay架構師的能力有問題,他們設計的架構總是建立舊版本的瓶頸上,希望通過新的架構帶來突破,然而新架構帶來的突破總是在很短的時間內就被新增需求淹沒,于是他們不得不又使用新的架構
    web開發,是個非常敏捷的過程,變化隨時都在產生,用戶需求千變萬化,許多方面偶然性非常高,較之軟件開發,希望用一個架構規劃以后的所有設計,是不現實的

    二,web架構生命周期:web architecture‘s life cycle


    既然要杜絕過設計,又要保證一定的前瞻性,那么怎么才能找到其中的平衡呢?希望下面的web架構生命周期能夠幫到你

    architecture_life_cycle

    設計的架構需要在1-10倍的增長下,通過簡單的增加硬件容量就能夠勝任,而在5-10倍的增長期間,請著手下一個版本的架構設計,使之能承受下一個10倍間的增長

    google之所以能夠稱霸,不完全是因為搜索技術和排序技術有多先進,其實包括baidu和yahoo,所使用的技術現在也已經大同小異,然而,google能在一個月內通過增加上萬臺服務器來達到足夠系統容量的能力確是很難被復制的


    三,緩存:Cache


    空間換取時間,緩存永遠計算機設計的重中之重,從cpu到io,到處都可以看到緩存的身影,web架構設計重,緩存設計必不可少,關于怎樣設計合理的緩存,jbosscache的創始人,淘寶的創始人是這樣說的:其實設計web緩存和企業級緩存是非常不同的,企業級緩存偏重于邏輯,而web緩存,簡單快速為好。。

    緩存帶來的問題是什么?是程序的復雜度上升,因為數據散布在多個進程,所以同步就是一個麻煩的問題,加上集群,復雜度會進一步提高,在實際運用中,采用怎樣的同步策略常常需要和業務綁定

    老錢為搜狐設計的帖子設計了鏈表緩存,這樣既可以滿足靈活插入的需要,又能夠快速閱讀,而其他一些大型社區也經常采用類此的結構來優化帖子列表,memcache也是一個常常用到的工具

    錢宏武談架構設計視頻 http://211.100.26.82/CSDN_Live/140/qhw.flv

    Cache的常用的策略是:讓數據在內存中,而不是在比較耗時的磁盤上。從這個角度講,mysql提供的heap引擎(存儲方式)也是一個值得思考的方法,這種存儲方法可以把數據存儲在內存中,并且保留sql強大的查詢能力,是不是一舉兩得呢?

    我們這里只說到了讀緩存,其實還有一種寫緩存,在以內容為主的社區里比較少用到,因為這樣的社區最主要需要解決的問題是讀問題,但是在處理能力低于請求能力時,或者單個希望請求先被緩存形成塊,然后批量處理時,寫緩存就出現了,在交互性很強的社區設計里我們很容易找到這樣的緩存

    四,核心模塊一定要自己開發:DIY your core module


    這點我們是深有體會,錢宏武和云風也都有談到,我們經常傾向于使用一些開源模塊,如果不涉及核心模塊,確實是可以的,如果涉及,那么就要小心了,因為當訪問量達到一定的程度,這些模塊往往都有這樣那樣的問題,當然我們可以把問題歸結為對開源的模塊不熟悉,但是不管怎樣,核心出現問題的時候,不能完全掌握其代碼是非常可怕的


    五,合理選擇數據存儲方式:reasonable data storage


    我們一定要使用數據庫嗎,不一定,雷鳴告訴我們搜索不一定需要數據庫,云風告訴我們,游戲不一定需要數據庫,那么什么時候我們才需要數據庫呢,為什么不干脆用文件來代替他呢?
    首先我們需要先承認,數據庫也是對文件進行操作。我們需要數據庫,主要是使用下面這幾個功能,一個是數據存儲,一個是數據檢索,在關系數據庫中,我們其實非常在乎數據庫的復雜搜索的能力,看看一個統計用的tsql就知道了(不用仔細讀,掃一眼就可以了)

    select   c.Class_name,d.Class_name_2,a.Creativity_Title,b.User_name,(select   count(Id)   from   review   where   Reviewid=a.Id)   as   countNum   from   Creativity   as   a,User_info   as   b,class   as   c,class2   as   d   where   a.user_id=b.id   and   a.Creativity_Class=c.Id   and   a.Creativity_Class_2=d.Id
    select   a.Id,max(c.Class_name),(max(d.Class_name_2),max(a.Creativity_Title),max(b.User_name),count(e.Id)   as   countNum   from   Creativity   as   a,User_info   as   b,class   as   c,class2   as   d,review   as   e   where   a.user_id=b.id   and   a.Creativity_Class=c.Id   and   a.Creativity_Class_2=d.Id   and   a.Id=e.Reviewid   group   by   a.Id ..............................................

    我們可以看出需要數據庫關聯,排序的能力,這個能力在某些情況下非常重要,但是如果你的網站的常規操作,全是這樣復雜的邏輯,那效率一定是非常低的,所以我們常常在數據庫里加入許多冗余字段,來減小簡單查詢時關聯等操作帶來的壓力,我們看看下面這張圖,可以看到數據庫的設計重心,和網站(指內容型社區)需要面對的問題實際是有一些偏差的

    database

    同樣其他一些軟件產品也遇到同樣的問題所以具我了解,有許多特殊的運用都有自己設計的特殊數據存儲結構與方法,比如有的大型服務程序采取樹形數據存儲結構,lucene使用文件來存儲索引和文件

    從另外一個角度上看,使用數據庫,意味著數據和表現是完全分離的(這當然是經典的設計思路),也就是說當需要展示數據時,不得不需要一個轉換的過程,也可以說是綁定的過程,當網站具備一定規模的時候,數據庫往往成為效率的瓶頸,所以許多網站也采用直接書寫靜態文件的方法來避免讀取操作時的綁定

    這并不是說我們從今天起就可以把我們親愛的數據庫打入冷宮,而是我們在設計數據的持久化時,需要根據實際情況來選擇存儲方式,而數據庫不過是其中一個選項


    六,搞清楚誰是最重要的人:who's the most important guy


    在用例需求分析的時候常常講到涉眾,就是和你的設計息息相關的人,在web中我們一定以為最重要的涉眾莫過于用戶了。,在一個傳統的互動社區開發中,最重要的東西是內容,用戶產生內容,所以用戶就是上帝,至于內容挑選工具,不就是給坐我后面三排的妹妹們用的嗎?湊或行了,實在有問題我就在數據里手動幫你加得了。。這大概是眼下許多小型甚至中型網站技術人員的普遍想法。錢宏武在他的講座里談到了這個問題:實際上網站每天產生的內容非常的多,普通人是不可能看完的,而編輯負責把精華的內容推薦到首頁上,所以很多用戶讀到的內容其實都依賴于編輯的推薦,所以設計讓編輯工作方便的工具也是非常重要,有時甚至是最重要的。


    七,不要執著于文檔:don't be crazy about document


    web開發的文檔重要嗎?什么文檔最重要?我的看法是web開發中交流>文檔,

    現在大的軟件公司比較流行的做法是:
    注重產品設計文檔,在這種方法里,產品文檔非常詳盡,并且沒有歧義,開發人員基于設計文檔開發,測試人員基于設計文檔制定測試方案,任何新人都可以通過閱讀產品設計文檔來了解項目的概況

    而web項目從概念到實現的時間是非常短的,而且越短越好,并且由于變化迅速,要想寫出完整的產品和需求文檔是幾乎不可能的,大多數情況是等你寫出完備的文檔,項目早就是另外一個樣子,但是沒有文檔的問題是,如果團隊發生變化,添加新成員怎樣才能了解軟件的結構和概念呢,一種是每個人都了解軟件的整個結構,除非你的團隊整體消失,否則任何一個人都能夠擔當培養新人的責任,這種face2face交流比文檔有效率很多。

    于是就有了前office開發者,現任yahoo中國某產品開發負責人的劉振飛所感覺到的落差,他說,我們的項目是吵出來的,我聽完會心一笑


    八,團隊:team


    不要專家團隊,而要外科手術式的團隊,你的團隊里一定要有清道夫,需要有弓箭手,讓他們和項目一起成長,才是項目負責人的最大成就

     

    總結:

    0)架構是一種權衡

    architecture

    1)web開發的特點是是:沒有太復雜的技術難點,一切在于迅速的把握需求,其實這正式敏捷開發的要旨所在,一切都可以非常快速的建立,非常快速的重構,我們的開發工具,底層庫和框架,包括搜索引擎和web文檔提供的幫助,都提我們供給了敏捷的能力。

    2)此外,相應的,最有效率的交流方式必須留給web開發,那就是face2face(面對面),不要太擔心你的設計不能被完備的文檔所保留下來,他們會以交流,代碼和小卡片的方式保存下來

    3)人的因素會更加重要,無論是對用戶的需求,還是開發人員的素質。

     

    另:有關web效率,有著名的14條規則,由yahoo性能效率小組所總結,并廣為流傳。業已出現相關插件(YSlow),針對具體網頁按彼規則評分,這次該小組負責人Tenni Theurer也受邀來到此次大會,我把Tenni小姐(之前真的沒有想到她是個女孩,并且如此年輕)和她的團隊的14 rules列在下面

  • Make Fewer HTTP Requests
  • Use a Content Delivery Network
  • Add an Expires Header
  • Gzip Components
  • Put CSS at the Top
  • Move Scripts to the Bottom
  • Avoid CSS Expressions
  • Make JavaScript and CSS External
  • Reduce DNS Lookups
  • Minify JavaScript
  • Avoid Redirects
  • Remove Duplicate Scripts
  • Configure ETags
  • Make Ajax Cacheable

     

    通過安裝firebugYSlow這兩個firefox插件(請注意要先安裝firebug再安裝yslow,下載后拖動到firefox里即可)我們可以看到你的網頁根據下面的規則的評分,這是我在博客園博客首頁的評分截圖,上面D表示總分,下面是單項評分,A最好F最差,不知道還有沒有G :)

    YSlow

     

    文章來源: http://blog.csdn.net/yizhu2000/archive/2007/12/04/1915554.aspx

    相關連接

    yahoo性能團隊:http://developer.yahoo.com/performance/


  •  

    程序開發是一方面,系統架構設計(硬件+網絡+軟件)是另一方面。

    中國的網絡分南北電信和網通,訪問的ip就要區分南北進入不同的網絡;

    然后是集群,包括應用服務器集群和web服務器集群,應用服務器集群可以采用apache+tomcat集群和weblogic集群等,web服務器集群可以用反向代理,也可以用NAT的方式,或者多域名解析都可以;

    軟件架構方面,做網站首先需要很多web服務器存儲靜態資源,比如圖片、視頻、靜態頁等,千萬不要把靜態資源和應用服務器放在一起;

    頁面數據調用更要認真設計,一些數據查詢可以不通過數據庫的方式,實時性要求不高的可以使用lucene來實現,即使有實時性的要求也可以用lucene,lucene+compass還是非常優秀的;

    不能用lucene實現的可以用緩存,分布式緩存可以用memcached,如果有錢的話用10來臺機器做緩存,>10G的存儲量相信存什么都夠了;如果沒錢的話可以在頁面緩存和數據緩存上下功夫,多用OSCACHE和EHCACHE,SWARMCACHE也可以,不過據說同步性不是很好;

    然后很重要的一點就是數據庫,大型網站要用oracle,數據方面操作盡量多用存儲過程,絕對提升性能;同時要讓DBA對數據庫進行優化,優化后的數據庫與沒優化的有天壤之別;同時還可以擴展分布式數據庫,以后這方面的研究會越來越多;

    新聞類的網站可以用靜態頁存儲,采用定時更新機制減輕服務器負擔;首頁每個小模塊可以使用oscache緩存,這樣不用每次都拉數據;

    最后是寫程序了,一個好的程序員寫出來的程序會非常簡潔、性能很好,一個初級程序員可能會犯很多低級錯誤,這也是影響網站性能的原因之一。





    本博客為學習交流用,凡未注明引用的均為本人作品,轉載請注明出處,如有版權問題請及時通知。由于博客時間倉促,錯誤之處敬請諒解,有任何意見可給我留言,愿共同學習進步。
    posted on 2008-04-27 21:10 Jack.Wang 閱讀(12999) 評論(4)  編輯  收藏 所屬分類: 架構師篇

    Feedback

    # re: web架構設計經驗分享 2008-04-27 23:16 和風細雨
    留個記號先  回復  更多評論
      

    # re: web架構設計經驗分享 2008-04-28 10:57 王能
    http://www.tudousee.cn 土豆網電視劇前線 這個網站的web設計如何呢?  回復  更多評論
      

    # re: web架構設計經驗分享 2008-04-29 13:46 過河卒
    拜讀,先前在那看過,今天又一次看 很有啟發。  回復  更多評論
      

    # re: web架構設計經驗分享 2008-05-26 22:41 葉澍成
    這個文章理想大于實踐  回復  更多評論
      

    主站蜘蛛池模板: 亚洲欧洲AV无码专区| 国产成人高清精品免费观看| 四虎影在线永久免费四虎地址8848aa | 亚洲日韩一区精品射精| 又粗又大又猛又爽免费视频| a级在线观看免费| 亚洲黄页网在线观看| 亚洲无码高清在线观看| 1000部免费啪啪十八未年禁止观看| 亚洲国产精品自在自线观看| 国产精品亚洲аv无码播放| 91黑丝国产线观看免费 | 亚洲精品免费在线观看| 亚洲av乱码中文一区二区三区| 亚洲乱码中文字幕综合| 成人无遮挡裸免费视频在线观看| 国产精品免费视频观看拍拍| 亚洲AV男人的天堂在线观看| 亚洲午夜福利AV一区二区无码| 最近中文字幕无免费视频| a级毛片100部免费观看| 亚洲精品乱码久久久久蜜桃 | 亚洲AV无码久久精品色欲| 全免费A级毛片免费看网站| 秋霞人成在线观看免费视频| 久久久久久亚洲av无码蜜芽| 7777久久亚洲中文字幕蜜桃| 亚洲日本韩国在线| 永久免费视频v片www| 999任你躁在线精品免费不卡| 日韩精品无码永久免费网站| avtt天堂网手机版亚洲| 久久精品亚洲综合| 亚洲第一区精品日韩在线播放| 国产v精品成人免费视频400条| 精品国产麻豆免费人成网站| 精品成人一区二区三区免费视频| 456亚洲人成在线播放网站| 久久夜色精品国产噜噜噜亚洲AV | 精品久久久久久亚洲中文字幕| 亚洲第一页在线播放|