件的大小其實就是文件內容實際具有的字節數,它以Byte為衡量單位,只要文件內容和格式不發生變化,文件大小就不會發生變化。但文件在磁盤上的所占空間卻不是以Byte為衡量單位的,它最小的計量單位是“簇(Cluster)”。
文件系統是操作系統與驅動器之間的接口,當操作系統請求從硬盤里讀取一個文件時,會請求相應的文件系統(FAT
16/32/NTFS)打開文件。扇區是磁盤最小的物理存儲單元,但由于操作系統無法對數目眾多的扇區進行尋址,所以操作系統就將相鄰的扇區組合在一起,
形成一個簇,然后再對簇進行管理。每個簇可以包括2、4、8、16、32或64個扇區。顯然,簇是操作系統所使用的邏輯概念,而非磁盤的物理特性。
為了更好地管理磁盤空間和更高效地從硬盤讀取數據,操作系統規定一個簇中只能放置一個文件的內容,因此文件所占用的空間,只能是簇的整數倍;而如果文件實
際大小小于一簇,它也要占一簇的空間。所以,一般情況下文件所占空間要略大于文件的實際大小,只有在少數情況下,即文件的實際大小恰好是簇的整數倍時,文
件的實際大小才會與所占空間完全一致。
什么是卷
卷,就是一種邏輯硬盤。這么說你可能很容易就想到分區,一個分區就可以構成一個邏輯硬盤。但是卷與分區最大的不同就是卷可以跨越物理硬盤。
動態磁盤的5種卷:
1、簡單卷:構成單個物理磁盤空間的卷。它可以由磁盤上的單個區域或同一磁盤上連接在一起的多個區域組成,可以在同一磁盤內擴展簡單卷。
2、跨區卷:簡單卷也可以擴展到其它的物理磁盤,這樣由多個物理磁盤的空間組成的卷就稱為跨區卷。簡單卷和跨區卷都不屬于RAID范疇。
3、帶區卷:以帶區形式在兩個或多個物理磁盤上存儲數據的卷。帶區卷上的數據被交替、平均(以帶區形式)地分配給這些磁盤,帶區卷是所有
Windows 2000
可用的卷中性能最佳的,但它不提供容錯。如果帶區卷上的任何一個磁盤數據損壞或磁盤故障,則整個卷上的數據都將丟失。帶區卷可以看作硬件RAID中的
RAID0。
4、鏡像卷:在兩個物理磁盤上復制數據的容錯卷。它通過使用卷的副本(鏡像)復制該卷中的信息來提供數據冗余,鏡像總位于另一個磁盤上。如果其中一個物理
磁盤出現故障,則該故障磁盤上的數據將不可用,但是系統可以使用未受影響的磁盤繼續操作。鏡像卷可以看作硬件RAID中的RAID1。
5、RAID-5卷:具有數據和奇偶校驗的容錯卷,有時分布于三個或更多的物理磁盤,奇偶校驗用于在陣列失效后重建數據。如果物理磁盤的某一部分失敗,您
可以用余下的數據和奇偶校驗信息重新創建磁盤上失敗的那一部分上的數據。類似硬件RAID中的RAID5,在硬件IDE
RAID中,RAID5是很少見的,通常在SCSI RAID卡和高檔IDE RAID卡中才能提供,普通IDE
RAID卡僅提供RAID0、RAID1和RAID0+1。
微軟操作系統(DOS、WINDOWS等)中磁盤文件存儲管理的最小單位叫做“簇”
一個文件通常存放在一個或多個簇里,但至少要單獨占據一個“簇”。 也就是說兩個文件不能存放在同一個簇中。
簇(CLUST)的本意就是“一群”、“一組”,即一組扇區(一個磁道可以分割成若干個大小相等的圓弧,叫扇區)的意思。因為扇區的單位太小,因此把它捆
在一起,組成一個更大的單位更方便進行靈活管理。簇的大小通常是可以變化的,是由操作系統在所謂“(高級)格式化”時規定的,因此管理也更加靈活。
通俗地講文件就好比是一個家庭,數據就是人,即家庭成員;所謂簇就是一些單元套房;扇區是組成這些單元套房的一個個大小相等的房間。
一個家庭可能住在一套或多套單元房子里,但一套房子不能同時住進兩個家庭的成員。
簇越大 則浪費的空間越大 因為 文件大小是簇大小的整數倍的情況很少 當不是整數倍的時候 最后一個簇會有或多或少的空間被浪費 一個硬盤有許多的文件 這樣的話 將導致大量的簇空間被浪費 即硬盤存儲空間的浪費 所以 簇越小的文件系統 如NTFS,越能夠節約硬盤。