C++為什麽不加入垃圾回收機制

Java的愛好者們經常批評C++中沒有提供與Java類似的垃圾回收(Gabage Collector)機制(這很正常，正如C++的愛好者有時也攻擊Java沒有這個沒有那個，或者這個不行那個不夠好)，導致C++中對動態存儲的官吏稱為程序員的噩夢，不是嗎?妳經常聽到的是內存遺失(memory leak)和非法指針存取，這壹定令妳很頭疼，而且妳又不能拋棄指針帶來的靈活性。

在本文中，我並不想揭露Java提供的垃圾回收機制的天生缺陷，而是指出了C++中引入垃圾回收的可行性。請讀者註意，這裏介紹的方法更多的是基於當前標準和庫設計的角度，而不是要求修改語言定義或者擴展編譯器。

什麽是垃圾回收?

作為支持指針的編程語言，C++將動態管理存儲器資源的便利性交給了程序員。在使用指針形式的對象時(請註意，由於引用在初始化後不能更改引用目標的語言機制的限制，多態性應用大多數情況下依賴於指針進行)，程序員必須自己完成存儲器的分配、使用和釋放，語言本身在此過程中不能提供任何幫助，也許除了按照妳的要求正確的和操作系統親密合作，完成實際的存儲器管理。標準文本中，多次提到了“未定義(undefined)”，而這大多數情況下和指針相關。

某些語言提供了垃圾回收機制，也就是說程序員僅負責分配存儲器和使用，而由語言本身負責釋放不再使用的存儲器，這樣程序員就從討厭的存儲器管理的工作中脫身了。然而C++並沒有提供類似的機制，C++的設計者Bjarne Stroustrup在我所知的唯壹壹本介紹語言設計的思想和哲學的著作《The Design and Evolution of C++》(中譯本：C++語言的設計和演化)中花了壹個小節討論這個特性。簡而言之，Bjarne本人認為，

“我有意這樣設計C++，使它不依賴於自動垃圾回收(通常就直接說垃圾回收)。這是基於自己對垃圾回收系統的經驗，我很害怕那種嚴重的空間和時間開銷，也害怕由於實現和移植垃圾回收系統而帶來的復雜性。還有，垃圾回收將使C++不適合做許多底層的工作，而這卻正是它的壹個設計目標。但我喜歡垃圾回收的思想，它是壹種機制，能夠簡化設計、排除掉許多產生錯誤的根源。

需要垃圾回收的基本理由是很容易理解的：用戶的使用方便以及比用戶提供的存儲管理模式更可靠。而反對垃圾回收的理由也有很多，但都不是最根本的，而是關於實現和效率方面的。

已經有充分多的論據可以反駁：每個應用在有了垃圾回收之後會做的更好些。類似的，也有充分的論據可以反對：沒有應用可能因為有了垃圾回收而做得更好。

並不是每個程序都需要永遠無休止的運行下去;並不是所有的代碼都是基礎性的庫代碼;對於許多應用而言，出現壹點存儲流失是可以接受的;許多應用可以管理自己的存儲，而不需要垃圾回收或者其他與之相關的技術，如引用計數等。

我的結論是，從原則上和可行性上說，垃圾回收都是需要的。但是對今天的用戶以及普遍的使用和硬件而言，我們還無法承受將C++的語義和它的基本庫定義在垃圾回收系統之上的負擔。”

以我之見，統壹的自動垃圾回收系統無法適用於各種不同的應用環境，而又不至於導致實現上的負擔。稍後我將設計壹個針對特定類型的可選的垃圾回收器，可以很明顯地看到，或多或少總是存在壹些效率上的開銷，如果強迫C++用戶必須接受這壹點，也許是不可取的。

關於為什麽C++沒有垃圾回收以及可能的在C++中為此做出的努力，上面提到的著作是我所看過的對這個問題敘述的最全面的，盡管只有短短的壹個小節的內容，但是已經涵蓋了很多內容，這正是Bjarne著作的壹貫特點，言簡意賅而內韻十足。

下面壹步壹步地向大家介紹我自己土制佳釀的垃圾回收系統，可以按照需要自由選用，而不影響其他代碼。

構造函數和析構函數

C++中提供的構造函數和析構函數很好的解決了自動釋放資源的需求。Bjarne有壹句名言，“資源需求就是初始化(Resource Inquirment Is Initialization)”。

因此，我們可以將需要分配的資源在構造函數中申請完成，而在析構函數中釋放已經分配的資源，只要對象的生存期結束，對象請求分配的資源即被自動釋放。

那麽就僅剩下壹個問題了，如果對象本身是在自由存儲區(Free Store，也就是所謂的“堆”)中動態創建的，並由指針管理(相信妳已經知道為什麽了)，則還是必須通過編碼顯式的調用析構函數，當然是借助指針的delete表達式。

智能指針

幸運的是，出於某些原因，C++的標準庫中至少引入了壹種類型的智能指針，雖然在使用上有局限性，但是它剛好可以解決我們的這個難題，這就是標準庫中唯壹的壹個智能指針::std::auto_ptr。

它將指針包裝成了類，並且重載了反引用(dereference)運算符operator *和成員選擇運算符operator ->，以模仿指針的行為。關於auto_ptr的具體細節，參閱《The C++ Standard Library》(中譯本：C++標準庫)。

例如以下代碼，

#include < cstring >

#include < memory >

#include < iostream >

class string

{

public:

string(const char* cstr) { _data=new char [ strlen(cstr)+1 ]; strcpy(_data, cstr); }

~string() { delete [] _data; }

const char* c_str() const { return _data; }

private:

char* _data;

};

void foo()

{

::std::auto_ptr < string > str ( new string( " hello " ) );

::std::cout << str->c_str() << ::std::endl;

}

由於str是函數的局部對象，因此在函數退出點生存期結束，此時auto_ptr的析構函數調用，自動銷毀內部指針維護的string對象(先前在構造函數中通過new表達式分配而來的)，並進而執行string的析構函數，釋放為實際的字符串動態申請的內存。在string中也可能管理其他類型的資源，如用於多線程環境下的同步資源。下圖說明了上面的過程。

現在我們擁有了最簡單的垃圾回收機制(我隱瞞了壹點，在string中，妳仍然需要自己編碼控制對象的動態創建和銷毀，但是這種情況下的準則極其簡單，就是在構造函數中分配資源，在析構函數中釋放資源，就好像飛機駕駛員必須在起飛後和降落前檢查起落架壹樣。)，即使在foo函數中發生了異常，str的生存期也會結束，C++保證自然退出時發生的壹切在異常發生時壹樣會有效。

auto_ptr只是智能指針的壹種，它的復制行為提供了所有權轉移的語義，即智能指針在復制時將對內部維護的實際指針的所有權進行了轉移，例如

auto_ptr < string > str1( new string( < str1 > ) );

cout << str1->c_str();

auto_ptr < string > str2(str1); // str1內部指針不再指向原來的對象

cout << str2->c_str();

cout << str1->c_str(); // 未定義，str1內部指針不再有效

某些時候，需要***享同壹個對象，此時auto_ptr就不敷使用，由於某些歷史的原因，C++的標準庫中並沒有提供其他形式的智能指針，走投無路了嗎?

另壹種智能指針

但是我們可以自己制作另壹種形式的智能指針，也就是具有值復制語義的，並且***享值的智能指針。

需要同壹個類的多個對象同時擁有壹個對象的拷貝時，我們可以使用引用計數(Reference Counting/Using Counting)來實現，曾經這是壹個C++中為了提高效率與COW(copy on write，改寫時復制)技術壹起被廣泛使用的技術，後來證明在多線程應用中，COW為了保證行為的正確反而導致了效率降低(Herb Shutter的在C++ Report雜誌中的Guru專欄以及整理後出版的《More Exceptional C++》中專門討論了這個問題)。

然而對於我們目前的問題，引用計數本身並不會有太大的問題，因為沒有牽涉到復制問題，為了保證多線程環境下的正確，並不需要過多的效率犧牲，但是為了簡化問題，這裏忽略了對於多線程安全的考慮。

首先我們仿造auto_ptr設計了壹個類模板(出自Herb Shutter的《More Execptional C++》)，

template < typename T >

class shared_ptr

{

private:

class implement // 實現類，引用計數

{

public:

implement(T* pp):p(pp),refs(1){}

~implement(){delete p;}

T* p; // 實際指針

size_trefs; // 引用計數

};

implement* _impl;

public:

explicitshared_ptr(T* p)

: _impl(new implement(p)){}

~shared_ptr()

{

decrease(); // 計數遞減

}

shared_ptr(const shared_ptr& rhs)

: _impl(rhs._impl)

{

increase(); // 計數遞增

}

shared_ptr& operator=(const shared_ptr& rhs)

{

if (_impl != rhs._impl) // 避免自賦值

{

decrease(); // 計數遞減，不再***享原對象

_impl=rhs._impl; // ***享新的對象

increase(); // 計數遞增，維護正確的引用計數值

}

return *this;

}

T* operator->() const

{

return _impl->p;

}

T& operator*() const

{

return *(_impl->p);

}

private:

void decrease()

{

if (--(_impl->refs)==0)

{ // 不再被***享，銷毀對象

delete_impl;

}

void increase()

{

++(_impl->refs);

}

};

這個類模板是如此的簡單，所以都不需要對代碼進行太多地說明。這裏僅僅給出壹個簡單的使用實例，足以說明shared_ptr作為簡單的垃圾回收器的替代品。

void foo1(shared_ptr < int >& val)

{

shared_ptr < int > temp(val);

*temp=300;

}

void foo2(shared_ptr < int >& val)

{

val=shared_ptr < int > ( new int(200) );

}

int main()

{

shared_ptr < int > val(new int(100));

cout<<"val="<<*val;

foo1(val);

cout<<"val="<<*val;

foo2(val);

cout<<"val="<<*val;

}

在main()函數中，先調用foo1(val)，函數中使用了壹個局部對象temp，它和val***享同壹份數據，並修改了實際值，函數返回後，val擁有的值同樣也發生了變化，而實際上val本身並沒有修改過。

然後調用了foo2(val)，函數中使用了壹個無名的臨時對象創建了壹個新值，使用賦值表達式修改了val，同時val和臨時對象擁有同壹個值，函數返回時，val仍然擁有這正確的值。

最後，在整個過程中，除了在使用shared_ptr 的構造函數時使用了new表達式創建新之外，並沒有任何刪除指針的動作，但是所有的內存管理均正確無誤，這就是得益於shared_ptr的精巧的設計。

擁有了auto_ptr和shared_ptr兩大利器以後，應該足以應付大多數情況下的垃圾回收了，如果妳需要更復雜語義(主要是指復制時的語義)的智能指針，可以參考boost的源代碼，其中設計了多種類型的智能指針。

標準容器

對於需要在程序中擁有相同類型的多個對象，善用標準庫提供的各種容器類，可以最大限度的杜絕顯式的內存管理，然而標準容器並不適用於儲存指針，這樣對於多態性的支持仍然面臨困境。

使用智能指針作為容器的元素類型，然而標準容器和算法大多數需要值復制語義的元素，前面介紹的轉移所有權的auto_ptr和自制的***享對象的shared_ptr都不能提供正確的值復制語義，Herb Sutter在《More Execptional C++》中設計了壹個具有完全復制語義的智能指針ValuePtr，解決了指針用於標準容器的問題。

然而，多態性仍然沒有解決，我將在另壹篇文章專門介紹使用容器管理多態對象的問題。

語言支持

為什麽不在C++語言中增加對垃圾回收的支持?

根據前面的討論，我們可以看見，不同的應用環境，也許需要不同的垃圾回收器，不管三七二十壹使用垃圾回收，需要將這些不同類型的垃圾回收器整合在壹起，即使可以成功(對此我感到懷疑)，也會導致效率成本的增加。

這違反了C++的設計哲學，“不為不必要的功能支付代價”，強迫用戶接受垃圾回收的代價並不可取。

相反，按需選擇妳自己需要的垃圾回收器，需要掌握的規則與顯式的管理內存相比，簡單的多，也不容易出錯。

最關鍵的壹點， C++並不是“傻瓜型”的編程語言，他青睞喜歡和善於思考的編程者，設計壹個合適自己需要的垃圾回收器，正是對喜愛C++的程序員的壹種挑戰。

上一篇:麻煩大學學計算機專業的學生，畢業的或者還沒有畢業的，麻煩解答壹下，

下一篇:幼兒園大班教師隨筆日記

微信空間經典說說:小醜面具比誰都開心，卻掩飾不了那雙哭紅的眼

工信部系統集成項目管理工程師考試資格