容災是一個范疇比較廣泛的概念,廣義上,我們可以把所有與業務連續性相關的內容都納入容災。容災是一個系統工程,它包括支持用戶業務的方方面面。而容災對于IT而言,就是提供一個能防止用戶業務系統遭受各種災難影響破壞的計算機系統。容災還表現為一種未雨綢繆的主動性,而不是在災難發生后的“亡羊補牢”。
從狹義的角度,我們平常所談論的容災是指,除了生產站點以外,用戶另外建立的冗余站點,當災難發生,生產站點受到破壞時,冗余站點可以接管用戶正常的業務,達到業務不間斷的目的。為了達到更高的可用性,許多用戶甚至建立多個冗余站點。
容災系統是指在相隔較遠的異地,建立兩套或多套功能相同的IT系統,互相之間可以進行健康狀態監視和功能切換,當一處系統因意外(如火災、地震等)停止工作時,整個應用系統可以切換到另一處,使得該系統功能可以繼續正常工作。容災技術是系統的高可用性技術的一個組成部分,容災系統更加強調處理外界環境對系統的影響,特別是災難性事件對整個IT節點的影響,提供節點級別的系統恢復功能。
從技術上看,衡量容災系統有兩個主要指標:RPO(RecoveryPointObject)和RTO(RecoveryTimeObject),其中RPO代表了當災難發生時允許丟失的數據量,而RTO則代表了系統恢復的時間。RPO與RTO越小,系統的可用性就越高,當然用戶需要的投資也越大。
從其對系統的保護程度來分,容災系統分為數據容災和應用容災
數據容災:所謂數據容災,就是指建立一個異地的數據系統,該系統是本地關鍵應用數據的一個可用復制。在本地數據及整個應用系統出現災難時,系統至少在異地保存有一份可用的關鍵業務的數據。該數據可以是與本地生產數據的完全實時復制,也可以比本地數據略微落后,但一定是可用的。采用的主要技術是數據備份和數據復制技術。
數據容災技術,又稱為異地數據復制技術,按照其實現的技術方式來說,主要可以分為同步傳輸方式和異步異步傳輸方式(各廠商在技術用語上可能有所不同),另外,也有如“半同步”這樣的方式。半同步傳輸方式基本與同步傳輸方式相同,只是在Read占I/O比重比較大時,相對同步傳輸方式,可以略微提高I/O的速度。而根據容災的距離,數據容災又可以分成遠程數據容災和近程數據容災方式。下面,我們將主要按同步傳輸方式和異步異步傳輸方式對數據容災展開討論,其中也會涉及到遠程容災和程容災的概念,并作相應的分析。
應用容災:所謂應用容災,是在數據容災的基礎上,在異地建立一套完整的與本地生產系統相當的備份應用系統(可以是互為備份)。建立這樣一個系統是相對比較復雜的,不僅需要一份可用的數據復制,還要有包括網絡、主機、應用、甚至IP等資源,以及各資源之間的良好協調。主要的技術包括負載均衡、集群技術。數據容災是應用容災的技術,應用容災是數據容災的目標。
在選擇容災系統的構造時,還要建立多層次的廣域網絡故障切換機制。本地的高可用系統指在多個服務器運行一個或多種應用的情況下,應確保任意服務器出現任何故障時,其運行的應用不能中斷,應用程序和系統應能迅速切換到其它服務器上運行,即本地系統集群和熱備份。
在遠程的容災系統中,要實現完整的應用容災,既要包含本地系統的安全機制、遠程的數據復制機制,還應具有廣域網范圍的遠程故障切換能力和故障診斷能力。也就是說,一旦故障發生,系統要有強大的故障診斷和切換策略制訂機制,確保快速的反應和迅速的業務接管。實際上,廣域網范圍的高可用能力與本地系統的高可用能力應形成一個整體,實現多級的故障切換和恢復機制,確保系統在各個范圍的可靠和安全。
集群系統是在冗余的通常可用性系統基礎之上,運行高可靠性軟件而構成。高可靠性軟件用于自動檢測系統的運行狀態,在一臺服務器出現故障的情況下,自動地把設定的服務轉到另一臺服務器上。當運行服務器提供的服務不可用時,備份服務器自動接替運行服務器的工作而不用重新啟動系統,而當運行服務器恢復正常后,按照使用者的設定以自動或手動方式將服務切換到運行服務上運行。備份服務器除了在運行服務器出現故障時接替其服務,還可以執行其他應用程序。因此,一臺性能配備充分的主機可同時作為某一服務的運行服務器和另一服務的備份服務器使用,即兩臺服務器互為備份。一臺主機可以運行多個服務,也可作為多個服務的備份服務器。
數據容災系統,對于IT而言,就是為計算機信息系統提供的一個能應付各種災難的環境。當計算機系統在遭受如火災、水災、地震、戰爭等不可抗拒的自然災難以及計算機犯罪、計算機病毒、掉電、網絡/通信失敗、硬件/軟件錯誤和人為操作錯誤等人為災難時,容災系統將保證用戶數據的安全性(數據容災),甚至,一個更加完善的容災系統,還能提供不間斷的應用服務(應用容災)。可以說,容災系統是數據存儲備份的最高層次。
數據容災與數據備份的聯系
企業關鍵數據丟失會中斷企業正常商務運行,造成巨大經濟損失。要保護數據,企業需要備份容災系統。但是很多企業在搭建了備份系統之后就認為高枕無憂了,其實還需要搭建容災系統。數據容災與數據備份的聯系主要體現在以下幾個方面:
1.數據備份是數據容災的基礎
數據備份是數據高可用的最后一道防線,其目的是為了系統數據崩潰時能夠快速的恢復數據。雖然它也算一種容災方案,但這種容災能力非常有限,因為傳統的備份主要是采用數據內置或外置的磁帶機進行冷備份,備份磁帶同時也在機房中統一管理,一旦整個機房出現了災難,如火災、盜竊和地震等災難時,這些備份磁帶也隨之銷毀,所存儲的磁帶備份也起不到任何容災功能。
2.容災不是簡單備份
真正的數據容災就是要避免傳統冷備份所具有先天不足,它能在災難發生時,全面、及時地恢復整個系統。容災按其容災能力的高低可分為多個層次,例如國際標準SHARE78定義的容災系統有七個層次:從最簡單的僅在本地進行磁帶備份,到將備份的磁帶存儲在異地,再到建立應用系統實時切換的異地備份系統,恢復時間也可以從幾天到小時級到分鐘級、秒級或0數據丟失等。
無論是采用哪種容災方案,數據備份還是最基礎的,沒有備份的數據,任何容災方案都沒有現實意義。但光有備份是不夠的,容災也必不可少。容災對于IT而言,就是提供一個能防止各種災難的計算機信息系統。從技術上看,衡量容災系統有兩個主要指標:RPO(RecoveryPointObject)和RTO(RecoveryTimeObject),其中RPO代表了當災難發生時允許丟失的數據量;而RTO則代表了系統恢復的時間。
3.容災不僅是技術
容災是一個工程,而不僅僅是技術。目前很多客戶還停留在對容災技術的關注上,而對容災的流程、規范及其具體措施還不太清楚。也從不對容災方案的可行性進行評估,認為只要建立了容災方案即可高枕無憂,其實這具有很大風險的。特別是在一些中小企業中,認為自己的企業為了數據備份和容災,整年花費了大量的人力和財力,而結果幾年下來根本就沒有發生任何大的災難,于是放松了警惕。可一旦發生了災難時,后悔晚矣!這一點國外的跨國公司就做得非常好,盡管幾年下來的確未出現大的災難,備份了那么磁帶,幾乎沒有派上任何用場,但仍一如既往、非常認真地做好每一步,并且基本上每月都有對現行容災方案的可行性進行評估,進行實地演練。
容災與備份的不同
從定義上看,備份是指用戶為應用系統產生的重要數據(或者原有的重要數據信息)制作一份或者多份拷貝,以增強數據的安全性。因此,備份與容災所關注的對象有所不同,備份關系數據的安全,容災關心業務應用的安全,我們可以把備份稱作是“數據保護”,而容災稱作“業務應用保護”。備份最多表現為通過備份軟件使用磁帶機或者磁帶庫將數據進行拷貝,也有用戶使用磁盤、光盤作為存儲介質;容災則表現為通過高可用方案將兩個站點連接起來。
備份與容災是存儲領域兩個極其重要的部分,二者有著緊密的聯系。首先,在備份與容災中都有數據保護工作,備份大多采用磁帶方式,性能低,成本低;容災采用磁盤方式進行數據保護,數據隨時在線,性能高,成本高。其次,備份是存儲領域的一個基礎,在一個完整的容災方案中必然包括備份的部分;同時備份還是容災方案的有效補充,因為容災方案中的數據始終在線,因此存儲有完全被破壞的可能,而備份提供了額外的一條防線,即使在線數據丟失也可以從備份數據中恢復。
容災是一項系統工程
由于容災所承擔的是用戶最關鍵的核心業務,其重要作用勿庸置疑,容災本身的復雜性也是十分明顯的,這就決定了容災成為一項系統工程。容災首先涉及到眾多技術以及眾多廠商的各類解決方案。性能、靈活性以及價格都是必須考慮的因素,更重要的是,用戶需要根據自己的實際需求量身打造。許多用戶的生產站點都是經過長期積累、多次改造后形成的,對于特殊的應用還采用特定的設備。那么當用戶考慮構建容災站點時就必須把所有的情況都考慮進來,“選擇適合自己的”是構建容災方案的一條基本準則。與此同時用戶還要考慮長遠一些,盡量采用先進而不是將要淘汰的技術,畢竟冗余站點與生產站點一樣會長期使用。
轉:http://bolichuang.chen.blog.163.com/blog/static/1311683532010044173161/
posted on 2010-08-15 10:12
cheng 閱讀(1042)
評論(0) 編輯 收藏 所屬分類:
通信業務