本篇文章給大家?guī)砹岁P(guān)于PHP的相關(guān)知識(shí),其中主要跟大家介紹數(shù)組是怎么靈活支持多數(shù)據(jù)類型的,感興趣的朋友下面一起來看一下吧,希望對大家有幫助。
在PHP中,數(shù)組數(shù)據(jù)結(jié)構(gòu)的應(yīng)用處理是使用頻率非常高的,相對于Java、C++ 這種強(qiáng)類型語言來說,PHP的數(shù)組簡直可以說是太好用了,可以存儲(chǔ)各種類型的數(shù)據(jù)(如:數(shù)字、字符串甚至對象等),為開發(fā)帶來了極大的便利。
基于 PHP 數(shù)組的強(qiáng)大特性,我們可以輕易實(shí)現(xiàn)更加復(fù)雜的數(shù)據(jù)結(jié)構(gòu),比如棧、隊(duì)列、列表、集合、字典等。
你是否迫不及待的想要一探究竟:PHP到底是如何實(shí)現(xiàn)數(shù)組的呢?
1、PHP數(shù)組底層數(shù)據(jù)結(jié)構(gòu)
PHP 數(shù)組其內(nèi)部是使用 HashTable 結(jié)構(gòu)來實(shí)現(xiàn)的,那就先來簡單說說HashTable吧!
HashTable又稱散列表,是通過key-value的方式來高效地訪問數(shù)據(jù)的一種結(jié)構(gòu)。哈希表是數(shù)組和鏈表的一種合并,集成了數(shù)組的尋址快,鏈表的插入快的特點(diǎn)于一身。
HashTable主要分為兩個(gè)環(huán)節(jié):
1. 哈希函數(shù):哈希函數(shù)將要查找的值轉(zhuǎn)換成數(shù)字索引,通過數(shù)字索引可以快速的找到值存在的位置。
2. 哈希碰撞:理想情況下,不同的值通過哈希函數(shù)后,出來的結(jié)果是不一樣的;如果不一樣的值,哈希后出來一樣的數(shù)字,我們稱之為哈希碰撞。
因此應(yīng)用 HashTable 就必須要面臨解決哈希碰撞的問題,主要的解法有兩種:鏈表法,開放尋址法。
在zend_type.h文件中,可以找到 HashTable 的主要結(jié)構(gòu)定義如下:
zend_數(shù)組 類型
挑選幾個(gè)重點(diǎn)成員介紹一下:
-
gc: 引用計(jì)數(shù),垃圾回收使用。
-
arData:散列表中保存存儲(chǔ)元素的數(shù)組,其內(nèi)存是連續(xù)的,arData指向數(shù)組的起始位置;
-
nTableSize:數(shù)組的總?cè)萘?,即可以容納的元素?cái)?shù),arData 的內(nèi)存大小就是根據(jù)這個(gè)值確定的,它的大小的是2的冪次方,最小為8,然后按照 8、16、32…依次遞增;
Bucket 類型
Bucket 的結(jié)構(gòu)比較簡單,主要用來保存元素的 key 和 value,以及一個(gè)整型的 h(散列值,或者叫哈希值)。
-
如果元素是數(shù)值索引,則其值就是數(shù)值索引的值;
-
如果是字符串索引,那么其值就是 key 通過 Time33 算法計(jì)算得到的散列值。
h 的值用來最終映射元素的存儲(chǔ)位置。
2、PHP 數(shù)組的基本實(shí)現(xiàn)
上面部分我們了解了 zend_數(shù)組 的數(shù)據(jù)結(jié)構(gòu),那接著看看數(shù)組的初始化吧:
數(shù)組的初始化主要是針對 HashTable 成員的設(shè)置,初始化時(shí)并不會(huì)立即分配 arData 的內(nèi)存,插入第一個(gè)元素之后才會(huì)分配 arData 的內(nèi)存。
為了更好的理解整個(gè)hash結(jié)構(gòu),我們來舉個(gè)例子說明一下這個(gè)結(jié)構(gòu):
$data = array( 'hello' => 'haha', 1 => 'me to' 'world' => 'world', 2 => 2 ); unset($data[1]);
那上面的hash結(jié)構(gòu)應(yīng)該是什么樣的呢?arData存儲(chǔ)的結(jié)果應(yīng)該是什么樣呢?
畫個(gè)圖例來看看吧,更直觀一些:
arData是Bucket類型的指針,用來具體存儲(chǔ)每個(gè)元素的key,value,按照插入元素的順序存儲(chǔ)數(shù)據(jù)的,所以數(shù)組的順序也是靠這個(gè)來保證。
每個(gè)arData數(shù)組的元素,從圖中可以看到,左邊負(fù)數(shù)是哈希值取模后的值,存儲(chǔ)的是右邊arData的索引;如-8沖突了,則存儲(chǔ)了鏈表的頭元素。
arData[0]: key='hello',h=xx(具體某個(gè)值),val = 'haha'
arData[1]: val是 type=IS_UNDEF 的zval(被unset后,不是立即被刪除,而是置成IS_UNDEF)
arData[2]: key='world',h=xx(具體某個(gè)值),val = 'world'
arData[3]: key=NULL,h=2(可能會(huì)哈希值沖突),val = 2
….
上面的例子很具體地解釋了nNumUsed,nNumOfElements,arData的意義。
3、PHP 數(shù)組的有序性
數(shù)組中各元素的順序和插入順序一致,這個(gè)是怎么實(shí)現(xiàn)的呢?
為了實(shí)現(xiàn) PHP 數(shù)組的有序性,PHP 底層的散列表在散列函數(shù)與元素?cái)?shù)組之間加了一層映射表,這個(gè)映射表也是一個(gè)數(shù)組,大小和存儲(chǔ)元素的數(shù)組相同,存儲(chǔ)元素的類型為整型,用于保存元素在實(shí)際存儲(chǔ)的有序數(shù)組中的下標(biāo) —— 元素按照先后順序依次插入實(shí)際存儲(chǔ)數(shù)組,然后將其數(shù)組下標(biāo)按照散列函數(shù)散列出來的位置存儲(chǔ)在新加的映射表中:
這樣,就可以完成最終存儲(chǔ)數(shù)據(jù)的有序性了。
PHP 數(shù)組底層結(jié)構(gòu)中并沒有顯式標(biāo)識(shí)這個(gè)中間映射表,而是與 arData 放到了一起,在數(shù)組初始化的時(shí)候并不僅僅分配用于存儲(chǔ) Bucket 的內(nèi)存,還會(huì)分配相同數(shù)量的 uint32_t 大小的空間,這兩塊空間是一起分配的,然后將 arData 偏移到存儲(chǔ)元素?cái)?shù)組的位置,而這個(gè)中間映射表就可以通過 arData 向前訪問到。
總結(jié)
PHP中的數(shù)組其特點(diǎn)就是將 values 映射到 keys 的類型。與其他語言不同的是,PHP中數(shù)組的 key 可以是字符串,而values可以是任意類型。
除常規(guī)增刪改查之外,數(shù)組還有很多其他操作,比如復(fù)制、合并、銷毀、重置等,這些操作對應(yīng)的代碼都位于 zend_hash.c 中,感興趣的同學(xué)可以去了解一下。
推薦學(xué)習(xí):《PHP視頻教程》