當前位置:編程學習大全網 - 源碼下載 - goland map底層原理

goland map底層原理

map 是Go語言中基礎的數據結構,在日常的使用中經常被用到。但是它底層是如何實現的呢?

總體來說golang的map是hashmap,是使用數組+鏈表的形式實現的,使用拉鏈法消除hash沖突。

golang的map由兩種重要的結構,hmap和bmap(下文中都有解釋),主要就是hmap中包含壹個指向bmap數組的指針,key經過hash函數之後得到壹個數,這個數低位用於選擇bmap(當作bmap數組指針的下表),高位用於放在bmap的[8]uint8數組中,用於快速試錯。然後壹個bmap可以指向下壹個bmap(拉鏈)。

Golang中map的底層實現是壹個散列表,因此實現map的過程實際上就是實現散表的過程。在這個散列表中,主要出現的結構體有兩個,壹個叫 hmap (a header for a go map),壹個叫 bmap (a bucket for a Go map,通常叫其bucket)。這兩種結構的樣子分別如下所示:

hmap :

圖中有很多字段,但是便於理解map的架構,妳只需要關心的只有壹個,就是標紅的字段: buckets數組 。Golang的map中用於存儲的結構是bucket數組。而bucket(即bmap)的結構是怎樣的呢?

bucket :

相比於hmap,bucket的結構顯得簡單壹些,標紅的字段依然是“核心”,我們使用的map中的key和value就存儲在這裏。“高位哈希值”數組記錄的是當前bucket中key相關的“索引”,稍後會詳細敘述。還有壹個字段是壹個指向擴容後的bucket的指針,使得bucket會形成壹個鏈表結構。例如下圖:

由此看出hmap和bucket的關系是這樣的:

而bucket又是壹個鏈表,所以,整體的結構應該是這樣的:

哈希表的特點是會有壹個哈希函數,對妳傳來的key進行哈希運算,得到唯壹的值,壹般情況下都是壹個數值。Golang的map中也有這麽壹個哈希函數,也會算出唯壹的值,對於這個值的使用,Golang也是很有意思。

Golang把求得的值按照用途壹分為二:高位和低位。

如圖所示,藍色為高位,紅色為低位。 然後低位用於尋找當前key屬於hmap中的哪個bucket,而高位用於尋找bucket中的哪個key。上文中提到:bucket中有個屬性字段是“高位哈希值”數組,這裏存的就是藍色的高位值,用來聲明當前bucket中有哪些“key”,便於搜索查找。 需要特別指出的壹點是:我們map中的key/value值都是存到同壹個數組中的。數組中的順序是這樣的:

並不是key0/value0/key1/value1的形式,這樣做的好處是:在key和value的長度不同的時候,可 以消除padding(內存對齊)帶來的空間浪費 。

現在,我們可以得到Go語言map的整個的結構圖了:(hash結果的低位用於選擇把KV放在bmap數組中的哪壹個bmap中,高位用於key的快速預覽,用於快速試錯)

map的擴容

當以上的哈希表增長的時候,Go語言會將bucket數組的數量擴充壹倍,產生壹個新的bucket數組,並將舊數組的數據遷移至新數組。

加載因子

判斷擴充的條件,就是哈希表中的加載因子(即loadFactor)。

加載因子是壹個閾值,壹般表示為:散列包含的元素數 除以 位置總數。是壹種“產生沖突機會”和“空間使用”的平衡與折中:加載因子越小,說明空間空置率高,空間使用率小,但是加載因子越大,說明空間利用率上去了,但是“產生沖突機會”高了。

每種哈希表的都會有壹個加載因子,數值超過加載因子就會為哈希表擴容。

Golang的map的加載因子的公式是:map長度 / 2^B(這是代表bmap數組的長度,B是取的低位的位數)閾值是6.5。其中B可以理解為已擴容的次數。

當Go的map長度增長到大於加載因子所需的map長度時,Go語言就會將產生壹個新的bucket數組,然後把舊的bucket數組移到壹個屬性字段oldbucket中。註意:並不是立刻把舊的數組中的元素轉義到新的bucket當中,而是,只有當訪問到具體的某個bucket的時候,會把bucket中的數據轉移到新的bucket中。

如下圖所示:當擴容的時候,Go的map結構體中,會保存舊的數據,和新生成的數組

上面部分代表舊的有數據的bucket,下面部分代表新生成的新的bucket。藍色代表存有數據的bucket,橘黃色代表空的bucket。

擴容時map並不會立即把新數據做遷移,而是當訪問原來舊bucket的數據的時候,才把舊數據做遷移,如下圖:

註意:這裏並不會直接刪除舊的bucket,而是把原來的引用去掉,利用GC清除內存。

map中數據的刪除

如果理解了map的整體結構,那麽查找、更新、刪除的基本步驟應該都很清楚了。這裏不再贅述。

值得註意的是,找到了map中的數據之後,針對key和value分別做如下操作:

1

2

3

4

1、如果``key``是壹個指針類型的,則直接將其置為空,等待GC清除;

2、如果是值類型的,則清除相關內存。

3、同理,對``value``做相同的操作。

4、最後把key對應的高位值對應的數組index置為空。

  • 上一篇:塑料的組成與特性
  • 下一篇:學編程作文
  • copyright 2024編程學習大全網