當前位置:首頁 > PHP教程 > php高級應用 > 列表

為何說PHP引用是個坑,要慎用

發布:smiling 來源: PHP粉絲網  添加日期:2018-11-04 13:43:36 瀏覽: 評論:0 

前言:去年我參加了很多次會議,其中八次會議里我進行了相關發言,這其中我多次談到了 PHP 的引用問題,因為很多人對它的理解有所偏差。在深入討論這個問題之前,我們先回顧一下引用的基本概念,明確什么是“引用傳遞”。

在 PHP 中引用意味著用不同的名字訪問同一個變量內容,不論你用哪個名字對變量做出了運算,其他名字訪問的內容也將改變。

讓我們通過代碼來加深對此的理解。 首先我們寫幾個簡單的語句,把一個變量賦值給另一個變量,并且改變另一個變量:

  1. $a = 23; 
  2. $b = $a
  3. $b = 42; 
  4. var_dump($a); // int(23) 
  5. var_dump($b); // int(42) 

這個腳本顯示 $a 值仍然為 23  ,而 $b 則等于 42 。出現這個情況的原因是我們得到的是一個拷貝(具體發生了什么稍后講解。。。)現在我們使用引用來做同樣的事情:

  1. <?php 
  2. $a = 23; 
  3. $b = &$a
  4. $b = 42; 
  5. var_dump($a); // int(42) 
  6. var_dump($b); // int(42) 
  7. ?> 

現在 $a 的值也改變成了 42 ,事實上,$a 和 $b 之間沒有任何區別,它們都使用了同一個變量容器(又名: zval ),將這兩者分開的唯一方法是使用 unset() 函數銷毀其中任何一個變量。

在 PHP 中,引用不僅能用在普通語句中,還能用于函數參數和返回值:

  1. <?php 
  2. function &foo(&$param) { 
  3.  $param = 42; 
  4.  return $param
  5.  
  6. $a = 23; 
  7. echo "\$a before calling foo(): $a\n"
  8. $b = foo($a); 
  9. echo "\$a after the call to foo(): $a\n"
  10. $b = 23; 
  11. echo "\$a after touching the returned variable: $a\n"
  12. ?> 

你認為上面的結果是什么呢?—— 沒錯,就像下面這樣:

$a before calling foo(): 23

$a after the call to foo(): 42

$a after touching the returned variable: 42

這里我們初始化了一個變量,并把它作為一個引用參數傳給了一個函數。函數改變了它,它有了新值。該函數返回同一個變量,我們更改了返回的變量和它的原始值。。。 等等!它沒變,不是嗎!? —— 沒錯,可引用就是這樣。 具體發生了如下事情:該函數返回了一個引用,引用了 $a 的變量容器 zval,并且通過 = 賦值操作符為它創建了一個副本。

為了修復這個問題,我們需要添加一個額外的 & 操作符:

$b = &foo($a);

結果和我們所期望的一樣:

$a before calling foo(): 23

$a after the call to foo(): 42

$a after touching the returned value: 23

總結一下: PHP 的引用就是同一個變量的別名,想要正確的使用它們可能很難。想要詳細了解引用計數,這里有份基礎資料,請參閱 手冊中的引用計數基本知識 。

PHP 5 發布時最大的變動是『對象處理方式』。一般我們理解為:

在 PHP 4 中,對象被當成變量來對待,所以當對象作為函數傳參時,他們是被復制的。但在 PHP 5 中,他們永遠是『引用傳參』。

以上的理解并不完全正確。其主要目的是遵循『面對對象模式』:對象傳參給函數或者方法后,這個函數發送一個指令給對象(例如調用了一個方法)以此來改變對象的狀態(例如對象的屬性)。因此傳參進去的對象必須為同一個。 PHP 4 的面對對象用戶使用『引用傳參』來解決這個問題,不過很難做到完美。PHP 5 引進了獨立于變量容器的『對象存儲器』。當一個對象賦值給變量時,變量不再存儲整個對象(屬性表和其他的『類』信息),而是存儲這個對象所在 存儲器的引用 —— 當我們復制一個對象變量時,我們復制的是這個『存儲器的引用』。這很容易被誤解為『引用』,但是『存儲器的引用』與『引用』是完全不同的概念。下面的示例代碼有助于我們更好地區分:

  1. <?php 
  2. // 創建一個對象和此對象的引用變量 
  3. $a = new stdclass; 
  4. $b = $a
  5. $c = &$a
  6.  
  7. // 對『對象』進行操作 
  8. $a->foo = 42;  
  9. var_dump($a->foo); // int(42) 
  10. var_dump($b->foo); // int(42) 
  11. var_dump($c->foo); // int(42) 
  12. //phpfensi.com 
  13. // 現在直接改變變量的類型 
  14. $a = 42; 
  15. var_dump($a); // int(42) 
  16. var_dump($b); // object(stdClass)#1719 (1) { 
  17.     //   ["foo"]=> 
  18.     //   int(42) 
  19.     // } 
  20. var_dump($c); // int(42) 
  21. ?> 

以上代碼中,修改對象的屬性會影響到 復制 的變量 $b 和引用的變量 $c。但是在最后區塊的代碼中,當我們修改 $a 的類型時,引用的 $c 發生了變化,而復制得到的變量 $b 不會發生改變,這是個大多數有面對對象經驗的工程師所期待的。

So, 面對對象是唯一使用『引用』的理由,但是現在 PHP 4 已死,你也可以放棄此類用法了。

另一個人們使用『引用』的理由是 —— 這將讓代碼更快。但是這是錯誤的,引用并不會使代碼執行速度變快,更糟糕的是,很多時候『引用』會讓你的代碼執行效率更低。

我必須再鄭重強調一次:是的,很多時候『引用』會讓你的代碼執行效率更低。

別的語言的工程師,他們閱讀別的語言編碼規范,會看到建議在處理大的數據結構或者字串時,使用指針來減小對內存的消耗以提高運行效率。這些工程師誤將此概念理解到『引用』上,然而『指針』與『引用』是完全不同的技術模型。PHP 解析器與其他語言不同,在 PHP 中,我們使用『寫時復制(copy-on-write)』模型。

在『寫時復制』模型里,賦值和函數傳參不會觸發 復制 動作,你可以理解為多個不同的變量指向同一個『變量容器』,只有當『寫』動作發生時,才會觸發復制動作。這意味著,即使變量看起來像是『復制』的,本質上卻不是。所以當傳參一個巨大的變量給某個函數時,并不會對性能造成多大影響。不過此時如果你使用引用傳參的話,引用傳參會關閉『寫時復制』機制,這會導致接下來那些沒有使用引用的變量傳參會被立刻復制一份。這也不是世界末日,你也可以在所有地方都引用就行了嘛。事實并非如此:PHP 的內部機制依賴于『寫時復制』模型,存在很多你無法修改的內部函數傳參。

我曾在某處看到過類似下面這樣的代碼:

  1. <?php 
  2. function foo(&$data) { 
  3.  for ($i = 0; $i < strlen($data); $i++) { 
  4.   do_something($data{$i}); 
  5.  } 
  6.  
  7. $string = "... looooong string with lots of data ....."
  8. foo(string); 
  9. ?> 

顯然,上面這段代碼的第一個問題是:在循環中調用 strlen() 而不是使用已經計算好的長度。也就是說調用一次 strlen($data) 就可以了的,但是他卻調用了很多次。 不同于 C 這類語言, 一般來說,PHP 的字符串都自帶了長度,因此也不用進行長度的計算。所以就 strlen() 而言,這還不算太糟糕。 但現在另一個問題是,案例中的這個開發者為了節省時間,傳遞了一個引用作為參數以顯示自己的聰明。 然而,strlen() 期望得到的是一個副本。『寫時復制』不能用于引用,因此 $data 將會在 strlen() 調用時被復制,strlen() 將會做一個絕對簡單的操作 —— 事實上 strlen() 本來就是 PHP 里最簡單的函數之一 —— 緊接著該副本就會被直接銷毀。

如果沒有使用引用,也就沒必要進行復制操作,代碼執行也會更快。而且就算 strlen() 支持引用,你也不會因此獲得更多好處。

總的來說:

除了 PHP4 的遺留問題,不要在面向對象(OO)中使用引用。

不要使用引用來提升性能。

使用引用來完成事情的第三個問題是:通過參數的引用來返回數據所導致的糟糕的 API 設計。這個問題還是因為那個開發者沒有意識到『PHP 就是 PHP 而不是其他語言』所導致的。

在 PHP 中,同一個函數可以返回不同數據類型。—— 因此,你可以在函數執行成功時返回一個字符串,而在失敗時返回一個布爾值 false,PHP 也允許返回復雜的結構類型,比如數組和對象。所以在需要返回很多東西的時候,可以將他們打包在一起。另外,異常也是函數返回的一種方式。

使用引用是一件不好的事情,除了引用本身不好,并且還會使性能下降這個事實外,使用引用這種方式會使得代碼難以維護。像下面這段代碼的函數調用:

do_something($var);

你希望 $var 發生改變嗎?—— 當然不會。然而,如果 do_something() 傳遞的參數是引用,它就可能會改變。

這類 API 的另一個問題是:函數不能鏈式調用,因而你總會遇到必須使用臨時變量的場景。鏈式調用可能會使可讀性降低,但是在許多場景下,鏈式調用使得代碼更加簡潔。

關于引用的糟糕的設計決定,我個人最喜歡的一個例子是 PHP 自帶的 sort() 函數。sort() 使用一個數組作為引用參數,然后通過引用返回一個排好序的數組。 像常規那樣通過值返回一個排好序的數組可能還更好些。當然,這么做是由于歷史的原因:sort() 比『寫時復制』更早出現。『寫時復制』產生于 PHP4,而 sort() 則更早,它早在 PHP 還是作為一種在 Web 上做起事來很方便的東西,而不是真正的成為自己的語言的時候就存在了。

總之: 在 PHP 中,引用是不好的。 不要使用引用。 它們只會惹事生非,另外,不要對使用引用來提升引擎抱有希望。

Tags: PHP引用

分享到:

福利彩票25选5开奖结果