GFS的新穎之處不在於它采用的令人驚訝的新技術,而在於它使用廉價的商用計算機集群來構建分布式文件系統,在降低成本的同時經受住了實際應用的考驗。
GFS提供了原子添加操作:記錄追加。在傳統的寫操作中,客戶端指定寫入數據的偏移位置,對同壹區間的並發寫操作是不連續的:區間可能包含來自多個客戶端的數據碎片。在記錄追加中,客戶端只指定數據。GFS至少在選定的偏移量處將數據自動添加到文件中壹次,並將偏移量返回給客戶端。
擴展數據
GFS集群文件系統可以分布在多個層中。壹般來說,成千上萬的塊服務器分布在不同的機架上,這些塊服務器由分布在不同機架上的客戶訪問。因此,不同機架上的兩臺機器之間的通信可能會通過壹個或多個交換機。
數據塊的冗余分配策略應該達到三個目標:最大的數據可靠性和可用性,以及最大的網絡帶寬利用率。所以,如果只是將數據的副本放在不同的機器上,很難滿足這兩個要求,必須在不同的機架上進行數據備份。這樣即使整個機架被破壞或斷開,也能保證數據的正常使用。這也使得數據傳輸,尤其是讀取數據,可以充分利用帶寬和訪問多個機架,而寫入操作不得不涉及更多機架。
百度百科-GFS(谷歌文件系統)