Posted on 2006-11-07 13:29
nemo 閱讀(4858)
評論(4) 編輯 收藏
今天研究SHA-1算法源碼,發現注釋中一個詞怎么也搞不懂:Big-Endian. 在網上查了才知道是大端在前的意思。在http://blog.vckbase.com/smileonce/archive/2005/02/22/3202.aspx?和 http://blog.myrice.com/reddenedmaple/archives/50001922.html中有比較多地介紹。但是很亂,我整理了一下,并加入了自己的一些理解。感謝提供信息的人們。
這兩個術語來自于?Jonathan?Swift?的《《格利佛游記》其中交戰的兩個派別無法就應該從哪一端--小端還是大端--打開一個半熟的雞蛋達成一致。
在那個時代,Swift是在諷刺英國和法國之間的持續沖突,Danny?Cohen,一位網絡協議的早期開創者,第一次使用這兩個術語來指代字節順序,后來這個術語被廣泛接納了,成為計算機專用名詞。除網絡傳輸之外,在計算機硬件中也有使用,通常表示邏輯最小處理單元大于物理最小處理單元時邏輯單元與物理單元的映射方式。
由于這個概念第一次提出時是來指代字節順序,而且計算機物理最小處理單元通常為一個字節,所以通常情況下無論是大端還是小端都是以字節(8bit)計,在字節之內都是以大端順序排列。但不排除以后隨著計算機的發展將這個數字擴充。
字節排序 | 含義 |
---|
Big-Endian | 高位在前,低位在后。 |
Little-Endian | 低位在前,高位在后 |
請看下面這個例子:
如果我們將0x1234abcd寫入到以0x0000開始的內存中,則結果為
??????????????? big-endian???? little-endian
0x0000???? 0x12????????????? 0xcd
0x0001???? 0x34????????????? 0xab
0x0002???? 0xab????????????? 0x34
0x0003???? 0xcd????????????? 0x12
然后,假如需要從內存中取32位整數0x1234abcd中的高16位整數,就需要知道是不是big-endian,如果是,需要從0x0002地址中去取,如果是little-endian,則需要從0x0000中取。也即怎么存就怎么取。
為什么會出現這樣的情況呢?為什么要有這兩種方式來排列數據?我們可以看看Dr. William T. Verts所作的說明: