PHP數(shù)組的底層實(shí)現(xiàn)原理是:1、哈希表,將不同的關(guān)鍵字映射到不同單元的一種數(shù)據(jù)結(jié)構(gòu);2、鏈表,就是由不同的鏈表節(jié)點(diǎn)組成的一種數(shù)據(jù)結(jié)構(gòu);3、php數(shù)組,使用鏈接法解決哈希沖突的方式。
一、哈希表
哈希表,顧名思義,即將不同的關(guān)鍵字映射到不同單元的一種數(shù)據(jù)結(jié)構(gòu)。而將不同關(guān)鍵字映射到不同單元的方法就叫做哈希函數(shù)
理想情況下,經(jīng)過哈希函數(shù)處理,關(guān)鍵字和單元是會(huì)進(jìn)行一一對(duì)應(yīng)的;但是如果關(guān)鍵字值足夠多的情況下,就容易出現(xiàn)多個(gè)關(guān)鍵字映射到同一單元的情況,即出現(xiàn)哈希沖突
哈希沖突的解決方案,要么使用鏈接法,要么使用開放尋址法
鏈接法
即當(dāng)不同的關(guān)鍵字映射到同一單元時(shí),在同一單元內(nèi)使用鏈表來保存這些關(guān)鍵字
開放尋址法
即當(dāng)插入數(shù)據(jù)時(shí),如果發(fā)現(xiàn)關(guān)鍵字被映射到的單元存在數(shù)據(jù)了,說明發(fā)生了沖突,就繼續(xù)尋找下一個(gè)單元,直到找到可用單元為止
而因?yàn)殚_放尋址法方案屬于占用其他關(guān)鍵字映射單元的位置,所以后續(xù)的關(guān)鍵字更容易出現(xiàn)哈希沖突,因此容易出現(xiàn)性能下降
二、鏈表
既然上面提到了鏈表,這里我們簡(jiǎn)單聊一下鏈表的基礎(chǔ)知識(shí)。鏈表分為很多種類型,常用的數(shù)據(jù)結(jié)構(gòu)包括:隊(duì)列,棧,雙向鏈表等
鏈表,就是由不同的鏈表節(jié)點(diǎn)組成的一種數(shù)據(jù)結(jié)構(gòu)。鏈表節(jié)點(diǎn)一般由元素+指向下一節(jié)點(diǎn)的指針組成。而雙向鏈表,顧名思義,則是由指向上一節(jié)點(diǎn)的指針+元素+指向下一節(jié)點(diǎn)的指針組成
對(duì)于數(shù)據(jù)結(jié)構(gòu)的內(nèi)容,我們不過多展開,我們之后會(huì)有專門的內(nèi)容去詳細(xì)介紹數(shù)據(jù)結(jié)構(gòu)
三、php數(shù)組
php解決哈希沖突的方式是使用了鏈接法,所以php數(shù)組是由哈希表+鏈表實(shí)現(xiàn),準(zhǔn)確來說,是由哈希表+雙向鏈表實(shí)現(xiàn)
四、內(nèi)部結(jié)構(gòu)-哈希表
HashTable結(jié)構(gòu)體主要用來存放哈希表的基本信息 typedef struct _hashtable { uint nTableSize; // hash Bucket的大小,即哈希表的容量,最小為8,以2x增長(zhǎng)。 uint nTableMask; // nTableSize-1 , 索引取值的優(yōu)化 uint nNumOfElements; // hash Bucket中當(dāng)前存在的元素個(gè)數(shù),count()函數(shù)會(huì)直接返回此值 ulong nNextFreeElement; // 下一個(gè)可使用的數(shù)字鍵值 Bucket *pInternalPointer; // 當(dāng)前遍歷的指針(foreach比for快的原因之一) Bucket *pListHead; // 存儲(chǔ)整個(gè)哈希表的頭元素指針 Bucket *pListTail; // 存儲(chǔ)整個(gè)哈希表的尾元素指針 Bucket **arBuckets; // 存儲(chǔ)hash數(shù)組 dtor_func_t pDestructor; // 在刪除元素時(shí)執(zhí)行的回調(diào)函數(shù),用于資源的釋放 zend_bool persistent; //指出了Bucket內(nèi)存分配的方式。如果persisient為TRUE,則使用操作系統(tǒng)本身的內(nèi)存分配函數(shù)為Bucket分配內(nèi)存,否則使用PHP的內(nèi)存分配函數(shù)。 unsigned char nApplyCount; // 標(biāo)記當(dāng)前hash Bucket被遞歸訪問的次數(shù)(防止多次遞歸) zend_bool bApplyProtection;// 標(biāo)記當(dāng)前hash桶允許不允許多次訪問,不允許時(shí),最多只能遞歸3次 #if ZEND_DEBUG int inconsistent; #endif } HashTable;
Bucket結(jié)構(gòu)體則用于保存數(shù)據(jù)的具體內(nèi)容
typedef struct bucket { ulong h; // 對(duì)char *key進(jìn)行hash后的值,或者是用戶指定的數(shù)字索引值 uint nKeyLength; // hash關(guān)鍵字的長(zhǎng)度,如果數(shù)組索引為數(shù)字,此值為0 void *pData; // 指向value,一般是用戶數(shù)據(jù)的副本,如果是指針數(shù)據(jù),則指向pDataPtr void *pDataPtr; // 如果是指針數(shù)據(jù),此值會(huì)指向真正的value,同時(shí)上面pData會(huì)指向此值 struct bucket *pListNext; // 指向整個(gè)哈希表的該單元的下一個(gè)元素 struct bucket *pListLast; // 指向整個(gè)哈希表的該單元的上一個(gè)元素 struct bucket *pNext; // 指向由于哈希沖突導(dǎo)致存放在同一個(gè)單元的鏈表中的下一個(gè)元素 struct bucket *pLast; // 指向由于哈希沖突導(dǎo)致存放在同一個(gè)單元的鏈表中的上一個(gè)元素 // 保存當(dāng)前值所對(duì)于的key字符串,這個(gè)字段只能定義在最后,實(shí)現(xiàn)變長(zhǎng)結(jié)構(gòu)體 char arKey[1]; } Bucket;
相關(guān)學(xué)習(xí)推薦:PHP編程從入門到精通