摘要: 什么是HTTP協(xié)議協(xié)議是指計算機通信網(wǎng)絡(luò)中兩臺計算機之間進行通信所必須共同遵守的規(guī)定或規(guī)則,超文本傳輸協(xié)議(HTTP)是一種通信協(xié)議,它允許將超文本標(biāo)記語言(HTML)文檔從Web服務(wù)器傳送到客戶端的瀏覽器 目前我們使用的是HTTP/1.1 版本W(wǎng)eb服務(wù)器,瀏覽器,代理服務(wù)器當(dāng)我們打開瀏覽器,在地址欄中輸入URL,然后我們就看到了網(wǎng)頁。 原理是怎樣的呢?實際上我們輸入URL后,我們的瀏...
閱讀全文
基于 HTTP 長連接的“服務(wù)器推”技術(shù)
Comet 簡介
瀏覽器作為 Web 應(yīng)用的前臺,自身的處理功能比較有限。瀏覽器的發(fā)展需要客戶端升級軟件,同時由于客戶端瀏覽器軟件的多樣性,在某種意義上,也影響了瀏覽器新技術(shù)的推廣。在 Web 應(yīng)用中,瀏覽器的主要工作是發(fā)送請求、解析服務(wù)器返回的信息以不同的風(fēng)格顯示。AJAX 是瀏覽器技術(shù)發(fā)展的成果,通過在瀏覽器端發(fā)送異步請求,提高了單用戶操作的響應(yīng)性。但 Web 本質(zhì)上是一個多用戶的系統(tǒng),對任何用戶來說,可以認為服務(wù)器是另外一個用戶。現(xiàn)有 AJAX 技術(shù)的發(fā)展并不能解決在一個多用戶的 Web 應(yīng)用中,將更新的信息實時傳送給客戶端,從而用戶可能在“過時”的信息下進行操作。而 AJAX 的應(yīng)用又使后臺數(shù)據(jù)更新更加頻繁成為可能。
圖 1. 傳統(tǒng)的 Web 應(yīng)用模型與基于 AJAX 的模型之比較
“服務(wù)器推”是一種很早就存在的技術(shù),以前在實現(xiàn)上主要是通過客戶端的套接口,或是服務(wù)器端的遠程調(diào)用。因為瀏覽器技術(shù)的發(fā)展比較緩慢,沒有為“服務(wù)器推”的實現(xiàn)提供很好的支持,在純?yōu)g覽器的應(yīng)用中很難有一個完善的方案去實現(xiàn)“服務(wù)器推”并用于商業(yè)程序。最近幾年,因為 AJAX 技術(shù)的普及,以及把 IFrame 嵌在“htmlfile“的 ActiveX 組件中可以解決 IE 的加載顯示問題,一些受歡迎的應(yīng)用如 meebo,gmail+gtalk 在實現(xiàn)中使用了這些新技術(shù);同時“服務(wù)器推”在現(xiàn)實應(yīng)用中確實存在很多需求。因為這些原因,基于純?yōu)g覽器的“服務(wù)器推”技術(shù)開始受到較多關(guān)注,Alex Russell(Dojo Toolkit 的項目 Lead)稱這種基于 HTTP 長連接、無須在瀏覽器端安裝插件的“服務(wù)器推”技術(shù)為“Comet”。目前已經(jīng)出現(xiàn)了一些成熟的 Comet 應(yīng)用以及各種開源框架;一些 Web 服務(wù)器如 Jetty 也在為支持大量并發(fā)的長連接進行了很多改進。關(guān)于 Comet 技術(shù)最新的發(fā)展?fàn)顩r請參考關(guān)于 Comet 的 wiki。
下面將介紹兩種 Comet 應(yīng)用的實現(xiàn)模型。
基于 AJAX 的長輪詢(long-polling)方式
如 圖 1 所示,AJAX 的出現(xiàn)使得 JavaScript 可以調(diào)用 XMLHttpRequest 對象發(fā)出 HTTP 請求,JavaScript 響應(yīng)處理函數(shù)根據(jù)服務(wù)器返回的信息對 HTML 頁面的顯示進行更新。使用 AJAX 實現(xiàn)“服務(wù)器推”與傳統(tǒng)的 AJAX 應(yīng)用不同之處在于:
- 服務(wù)器端會阻塞請求直到有數(shù)據(jù)傳遞或超時才返回。
- 客戶端 JavaScript 響應(yīng)處理函數(shù)會在處理完服務(wù)器返回的信息后,再次發(fā)出請求,重新建立連接。
- 當(dāng)客戶端處理接收的數(shù)據(jù)、重新建立連接時,服務(wù)器端可能有新的數(shù)據(jù)到達;這些信息會被服務(wù)器端保存直到客戶端重新建立連接,客戶端會一次把當(dāng)前服務(wù)器端所有的信息取回。
圖 2. 基于長輪詢的服務(wù)器推模型
一些應(yīng)用及示例如 “Meebo”, “Pushlet Chat” 都采用了這種長輪詢的方式。相對于“輪詢”(poll),這種長輪詢方式也可以稱為“拉”(pull)。因為這種方案基于 AJAX,具有以下一些優(yōu)點:請求異步發(fā)出;無須安裝插件;IE、Mozilla FireFox 都支持 AJAX。
在這種長輪詢方式下,客戶端是在 XMLHttpRequest 的 readystate 為 4(即數(shù)據(jù)傳輸結(jié)束)時調(diào)用回調(diào)函數(shù),進行信息處理。當(dāng) readystate 為 4 時,數(shù)據(jù)傳輸結(jié)束,連接已經(jīng)關(guān)閉。Mozilla Firefox 提供了對 Streaming AJAX 的支持, 即 readystate 為 3 時(數(shù)據(jù)仍在傳輸中),客戶端可以讀取數(shù)據(jù),從而無須關(guān)閉連接,就能讀取處理服務(wù)器端返回的信息。IE 在 readystate 為 3 時,不能讀取服務(wù)器返回的數(shù)據(jù),目前 IE 不支持基于 Streaming AJAX。
基于 Iframe 及 htmlfile 的流(streaming)方式
iframe 是很早就存在的一種 HTML 標(biāo)記, 通過在 HTML 頁面里嵌入一個隱蔵幀,然后將這個隱蔵幀的 SRC 屬性設(shè)為對一個長連接的請求,服務(wù)器端就能源源不斷地往客戶端輸入數(shù)據(jù)。
圖 3. 基于流方式的服務(wù)器推模型
上節(jié)提到的 AJAX 方案是在 JavaScript 里處理 XMLHttpRequest 從服務(wù)器取回的數(shù)據(jù),然后 Javascript 可以很方便的去控制 HTML 頁面的顯示。同樣的思路用在 iframe 方案的客戶端,iframe 服務(wù)器端并不返回直接顯示在頁面的數(shù)據(jù),而是返回對客戶端 Javascript 函數(shù)的調(diào)用,如“<script type="text/javascript">js_func(“data from server ”)</script>
”。服務(wù)器端將返回的數(shù)據(jù)作為客戶端 JavaScript 函數(shù)的參數(shù)傳遞;客戶端瀏覽器的 Javascript 引擎在收到服務(wù)器返回的 JavaScript 調(diào)用時就會去執(zhí)行代碼。
從 圖 3 可以看到,每次數(shù)據(jù)傳送不會關(guān)閉連接,連接只會在通信出現(xiàn)錯誤時,或是連接重建時關(guān)閉(一些防火墻常被設(shè)置為丟棄過長的連接, 服務(wù)器端可以設(shè)置一個超時時間, 超時后通知客戶端重新建立連接,并關(guān)閉原來的連接)。
使用 iframe 請求一個長連接有一個很明顯的不足之處:IE、Morzilla Firefox 下端的進度欄都會顯示加載沒有完成,而且 IE 上方的圖標(biāo)會不停的轉(zhuǎn)動,表示加載正在進行。Google 的天才們使用一個稱為“htmlfile”的 ActiveX 解決了在 IE 中的加載顯示問題,并將這種方法用到了 gmail+gtalk 產(chǎn)品中。Alex Russell 在 “What else is burried down in the depth's of Google's amazing JavaScript?”文章中介紹了這種方法。Zeitoun 網(wǎng)站提供的 comet-iframe.tar.gz,封裝了一個基于 iframe 和 htmlfile 的 JavaScript comet 對象,支持 IE、Mozilla Firefox 瀏覽器,可以作為參考。(請參見 參考資源)
回頁首
使用 Comet 模型開發(fā)自己的應(yīng)用
上面介紹了兩種基于 HTTP 長連接的“服務(wù)器推”架構(gòu),更多描述了客戶端處理長連接的技術(shù)。對于一個實際的應(yīng)用而言,系統(tǒng)的穩(wěn)定性和性能是非常重要的。將 HTTP 長連接用于實際應(yīng)用,很多細節(jié)需要考慮。
不要在同一客戶端同時使用超過兩個的 HTTP 長連接
我們使用 IE 下載文件時會有這樣的體驗,從同一個 Web 服務(wù)器下載文件,最多只能有兩個文件同時被下載。第三個文件的下載會被阻塞,直到前面下載的文件下載完畢。這是因為 HTTP 1.1 規(guī)范中規(guī)定,客戶端不應(yīng)該與服務(wù)器端建立超過兩個的 HTTP 連接, 新的連接會被阻塞。而 IE 在實現(xiàn)中嚴格遵守了這種規(guī)定。
HTTP 1.1 對兩個長連接的限制,會對使用了長連接的 Web 應(yīng)用帶來如下現(xiàn)象:在客戶端如果打開超過兩個的 IE 窗口去訪問同一個使用了長連接的 Web 服務(wù)器,第三個 IE 窗口的 HTTP 請求被前兩個窗口的長連接阻塞。
所以在開發(fā)長連接的應(yīng)用時, 必須注意在使用了多個 frame 的頁面中,不要為每個 frame 的頁面都建立一個 HTTP 長連接,這樣會阻塞其它的 HTTP 請求,在設(shè)計上考慮讓多個 frame 的更新共用一個長連接。
服務(wù)器端的性能和可擴展性
一般 Web 服務(wù)器會為每個連接創(chuàng)建一個線程,如果在大型的商業(yè)應(yīng)用中使用 Comet,服務(wù)器端需要維護大量并發(fā)的長連接。在這種應(yīng)用背景下,服務(wù)器端需要考慮負載均衡和集群技術(shù);或是在服務(wù)器端為長連接作一些改進。
應(yīng)用和技術(shù)的發(fā)展總是帶來新的需求,從而推動新技術(shù)的發(fā)展。HTTP 1.1 與 1.0 規(guī)范有一個很大的不同:1.0 規(guī)范下服務(wù)器在處理完每個 Get/Post 請求后會關(guān)閉套接口連接; 而 1.1 規(guī)范下服務(wù)器會保持這個連接,在處理兩個請求的間隔時間里,這個連接處于空閑狀態(tài)。 Java 1.4 引入了支持異步 IO 的 java.nio 包。當(dāng)連接處于空閑時,為這個連接分配的線程資源會返還到線程池,可以供新的連接使用;當(dāng)原來處于空閑的連接的客戶發(fā)出新的請求,會從線程池里分配一個線程資源處理這個請求。 這種技術(shù)在連接處于空閑的機率較高、并發(fā)連接數(shù)目很多的場景下對于降低服務(wù)器的資源負載非常有效。
但是 AJAX 的應(yīng)用使請求的出現(xiàn)變得頻繁,而 Comet 則會長時間占用一個連接,上述的服務(wù)器模型在新的應(yīng)用背景下會變得非常低效,線程池里有限的線程數(shù)甚至可能會阻塞新的連接。Jetty 6 Web 服務(wù)器針對 AJAX、Comet 應(yīng)用的特點進行了很多創(chuàng)新的改進,請參考文章“AJAX,Comet and Jetty”(請參見 參考資源)。
控制信息與數(shù)據(jù)信息使用不同的 HTTP 連接
使用長連接時,存在一個很常見的場景:客戶端網(wǎng)頁需要關(guān)閉,而服務(wù)器端還處在讀取數(shù)據(jù)的堵塞狀態(tài),客戶端需要及時通知服務(wù)器端關(guān)閉數(shù)據(jù)連接。服務(wù)器在收到關(guān)閉請求后首先要從讀取數(shù)據(jù)的阻塞狀態(tài)喚醒,然后釋放為這個客戶端分配的資源,再關(guān)閉連接。
所以在設(shè)計上,我們需要使客戶端的控制請求和數(shù)據(jù)請求使用不同的 HTTP 連接,才能使控制請求不會被阻塞。
在實現(xiàn)上,如果是基于 iframe 流方式的長連接,客戶端頁面需要使用兩個 iframe,一個是控制幀,用于往服務(wù)器端發(fā)送控制請求,控制請求能很快收到響應(yīng),不會被堵塞;一個是顯示幀,用于往服務(wù)器端發(fā)送長連接請求。如果是基于 AJAX 的長輪詢方式,客戶端可以異步地發(fā)出一個 XMLHttpRequest 請求,通知服務(wù)器端關(guān)閉數(shù)據(jù)連接。
在客戶和服務(wù)器之間保持“心跳”信息
在瀏覽器與服務(wù)器之間維持一個長連接會為通信帶來一些不確定性:因為數(shù)據(jù)傳輸是隨機的,客戶端不知道何時服務(wù)器才有數(shù)據(jù)傳送。服務(wù)器端需要確保當(dāng)客戶端不再工作時,釋放為這個客戶端分配的資源,防止內(nèi)存泄漏。因此需要一種機制使雙方知道大家都在正常運行。在實現(xiàn)上:
- 服務(wù)器端在阻塞讀時會設(shè)置一個時限,超時后阻塞讀調(diào)用會返回,同時發(fā)給客戶端沒有新數(shù)據(jù)到達的心跳信息。此時如果客戶端已經(jīng)關(guān)閉,服務(wù)器往通道寫數(shù)據(jù)會出現(xiàn)異常,服務(wù)器端就會及時釋放為這個客戶端分配的資源。
- 如果客戶端使用的是基于 AJAX 的長輪詢方式;服務(wù)器端返回數(shù)據(jù)、關(guān)閉連接后,經(jīng)過某個時限沒有收到客戶端的再次請求,會認為客戶端不能正常工作,會釋放為這個客戶端分配、維護的資源。
- 當(dāng)服務(wù)器處理信息出現(xiàn)異常情況,需要發(fā)送錯誤信息通知客戶端,同時釋放資源、關(guān)閉連接。
Pushlet - 開源 Comet 框架
Pushlet 是一個開源的 Comet 框架,在設(shè)計上有很多值得借鑒的地方,對于開發(fā)輕量級的 Comet 應(yīng)用很有參考價值。
觀察者模型
Pushlet 使用了觀察者模型:客戶端發(fā)送請求,訂閱感興趣的事件;服務(wù)器端為每個客戶端分配一個會話 ID 作為標(biāo)記,事件源會把新產(chǎn)生的事件以多播的方式發(fā)送到訂閱者的事件隊列里。
客戶端 JavaScript 庫
pushlet 提供了基于 AJAX 的 JavaScript 庫文件用于實現(xiàn)長輪詢方式的“服務(wù)器推”;還提供了基于 iframe 的 JavaScript 庫文件用于實現(xiàn)流方式的“服務(wù)器推”。
JavaScript 庫做了很多封裝工作:
- 定義客戶端的通信狀態(tài):
STATE_ERROR
、STATE_ABORT
、STATE_NULL
、STATE_READY
、STATE_JOINED
、STATE_LISTENING
; - 保存服務(wù)器分配的會話 ID,在建立連接之后的每次請求中會附上會話 ID 表明身份;
- 提供了
join()
、leave()
、subscribe()
、 unsubsribe()
、listen()
等 API 供頁面調(diào)用; - 提供了處理響應(yīng)的 JavaScript 函數(shù)接口
onData()
、onEvent()
…
網(wǎng)頁可以很方便地使用這兩個 JavaScript 庫文件封裝的 API 與服務(wù)器進行通信。
客戶端與服務(wù)器端通信信息格式
pushlet 定義了一套客戶與服務(wù)器通信的信息格式,使用 XML 格式。定義了客戶端發(fā)送請求的類型:join
、leave
、subscribe
、unsubscribe
、listen
、refresh
;以及響應(yīng)的事件類型:data
、join_ack
、listen_ack
、refresh
、heartbeat
、error
、abort
、subscribe_ack
、unsubscribe_ack
。
服務(wù)器端事件隊列管理
pushlet 在服務(wù)器端使用 Java Servlet 實現(xiàn),其數(shù)據(jù)結(jié)構(gòu)的設(shè)計框架仍可適用于 PHP、C 編寫的后臺客戶端。
Pushlet 支持客戶端自己選擇使用流、拉(長輪詢)、輪詢方式。服務(wù)器端根據(jù)客戶選擇的方式在讀取事件隊列(fetchEvents)時進行不同的處理。“輪詢”模式下 fetchEvents()
會馬上返回。”流“和”拉“模式使用阻塞的方式讀事件,如果超時,會發(fā)給客戶端發(fā)送一個沒有新信息收到的“heartbeat“事件,如果是“拉”模式,會把“heartbeat”與“refresh”事件一起傳給客戶端,通知客戶端重新發(fā)出請求、建立連接。
客戶服務(wù)器之間的會話管理
服務(wù)端在客戶端發(fā)送 join
請求時,會為客戶端分配一個會話 ID, 并傳給客戶端,然后客戶端就通過此會話 ID 標(biāo)明身份發(fā)出subscribe
和 listen
請求。服務(wù)器端會為每個會話維護一個訂閱的主題集合、事件隊列。
服務(wù)器端的事件源會把新產(chǎn)生的事件以多播的方式發(fā)送到每個會話(即訂閱者)的事件隊列里。
回頁首
小結(jié)
本文介紹了如何在現(xiàn)有的技術(shù)基礎(chǔ)上選擇合適的方案開發(fā)一個“服務(wù)器推”的應(yīng)用,最優(yōu)的方案還是取決于應(yīng)用需求的本身。相對于傳統(tǒng)的 Web 應(yīng)用, 目前開發(fā) Comet 應(yīng)用還是具有一定的挑戰(zhàn)性。
“服務(wù)器推”存在廣泛的應(yīng)用需求,為了使 Comet 模型適用于大規(guī)模的商業(yè)應(yīng)用,以及方便用戶構(gòu)建 Comet 應(yīng)用,最近幾年,無論是服務(wù)器還是瀏覽器都出現(xiàn)了很多新技術(shù),同時也出現(xiàn)了很多開源的 Comet 框架、協(xié)議。需求推動技術(shù)的發(fā)展,相信 Comet 的應(yīng)用會變得和 AJAX 一樣普及。
vTCP連接的建立
v
第一次握手:客戶端TCP首先給服務(wù)器端TCP發(fā)送一個特殊的TCP數(shù)據(jù)
段。該數(shù)據(jù)段不包含應(yīng)用層數(shù)據(jù),并將頭部中的SYN位設(shè)置為1,所以該數(shù)
據(jù)段被稱為SYN數(shù)據(jù)段。另外,客戶選擇一個初始序列號SEQ,設(shè)SEQ=x
并將這個編號放到初始的TCP SYN數(shù)據(jù)段的序列號字段中。該數(shù)據(jù)段被封
裝到一個IP數(shù)據(jù)報中,并發(fā)送給服務(wù)器。
第二次握手:一旦裝有TCP SYN數(shù)據(jù)段的IP數(shù)據(jù)報到達了服務(wù)器主機,服
務(wù)器將從該數(shù)據(jù)報中提取出TCP SYN數(shù)據(jù)段,給該連接分配TCP緩沖區(qū)和
變量,并給客戶TCP發(fā)送一個允許連接的數(shù)據(jù)段。這個允許連接的數(shù)據(jù)段
也不包含任何應(yīng)用層數(shù)據(jù)。但是,它的頭部中裝載著3個重要信息。首先,
SYN被設(shè)置為1;其次,TCP數(shù)據(jù)段頭部的確認字段被設(shè)置為x+1;最后,
服務(wù)器選擇自己的初始順序號,SEQ=y,并將該值放到TCP數(shù)據(jù)段頭部的
序列號字段中。
第三次握手:在接收到允許連接數(shù)據(jù)段之后,客戶也會給連接分配緩沖區(qū)
和變量。客戶端主機還會給服務(wù)器發(fā)送另一個數(shù)據(jù)段,對服務(wù)器的允許連
接數(shù)據(jù)段給出確認。議中連接過程.png)
以前發(fā)現(xiàn)在Ubuntu重啟后,hosts
文件又恢復(fù)到了修改前,十分奇怪。
一開始覺得是Linux的問題,最近在Mac上同樣的現(xiàn)象又出現(xiàn)了。
查看 /etc/目錄下,發(fā)現(xiàn)了兩個一摸一樣的文件,hosts
和hosts.ac
,vimdiff一下,居然一模一樣!
看來原因找到了。
Cisco AnyConnect 搗的鬼
仔細回想了一下,發(fā)現(xiàn)/ect/hosts.ac是出現(xiàn)在 VPN 客戶端:Cisco AnyConnect
后,hosts.ac應(yīng)該是any client的縮寫。
這貨每次在重啟后,都會把/etc/hosts重新覆蓋一遍。
所以,除非你同時修改了/etc/hosts.ac 文件,否則單獨只修改/etc/hosts都會被重置。
下面開始實驗證明一下
首先測試下做個軟鏈?zhǔn)欠裼行В?/h5>刪除原來hosts.ac sudo rm /etc/hosts.ac 建立軟鏈 sudo ln -s /etc/hosts.ac /etc/hosts
重啟后發(fā)現(xiàn),兩個hosts文件都不在了。。。悲劇 。
嘗試反著操作
刪除原來hosts sudo rm /etc/hosts 建立軟鏈 sudo ln -s /etc/hosts /etc/hosts.ac
再次重啟,發(fā)現(xiàn)軟連接消失了,依舊變成了連個一模一樣的hosts.ac 。
實驗證明
每次重啟,hosts.ac都會重新復(fù)制給hosts,
所以如果你希望hosts保留的話,每次修改hosts后,請同時復(fù)制給hosts.ac文件
如果不小心被誤刪除了,可以使用原始的hosts文件內(nèi)容恢復(fù):
255.255.255.255 broadcasthost ::1 localhost fe80::1%lo0 localhost
偷懶的解決方案
在BASH的PATH目錄下,創(chuàng)建mh
腳本,以后通過這個腳本修改hosts文件
#!/bin/bash #!/bin/bash
modify hosts
if [ -f /etc/hosts ];then echo "/etc/hosts exists,back up to ~/hosts.bak" cp /etc/hosts ~/hosts.bak sudo rm /etc/hosts fi if [ ! -L /etc/hosts ];then echo "link /etc/hosts.ac => /etc/hosts" sudo ln -s /etc/hosts.ac /etc/hosts fi sudo vi /etc/hosts.ac