當前位置:編程學習大全網 - 編程語言 - 如何減少C++編寫程序的CPU使用率

如何減少C++編寫程序的CPU使用率

優化是壹個非常大的主題,本文並不是去深入探討性能分析理論,算法的效率,況且我也沒有這個能力。我只是想把壹些可以簡單的應用到妳的C++代碼中的優化技術總結在這裏,這樣,當妳遇到幾種不同的編程策略的時候,就可以對每種策略的性能進行壹個大概的估計。這也是本文的目的之所在。

壹. 優化之前

在進行優化之前,我們首先應該做的是發現我們代碼的瓶頸(bottleneck)在哪裏。然而當妳做這件事情的時候切忌從壹個debug- version進行推斷,因為debug-version中包含了許多額外的代碼。壹個debug-version可執行體要比release- version大出40%。那些額外的代碼都是用來支持調試的,比如說符號的查找。大多數實現都為debug-version和release- version提供了不同的operator new以及庫函數。而且,壹個release-version的執行體可能已經通過多種途徑進行了優化,包括不必要的臨時對象的消除,循環展開,把對象移入寄存器,內聯等等。

另外,我們要把調試和優化區分開來,它們是在完成不同的任務。 debug-version 是用來追捕bugs以及檢查程序是否有邏輯上的問題。release-version則是用來做壹些性能上的調整以及進行優化。

下面就讓我們來看看有哪些代碼優化技術吧:

二. 聲明的放置

程序中變量和對象的聲明放在什麽位置將會對性能產生顯著影響。同樣,對postfix和prefix運算符的選擇也會影響性能。這壹部分我們集中討論四個問題:初始化v.s 賦值,在程序確實要使用的地方放置聲明,構造函數的初始化列表,prefix v.s postfix運算符。

(1)請使用初始化而不是賦值

在C語言中只允許在壹個函數體的開頭進行變量的聲明,然而在C++中聲明可以出現在程序的任何位置。這樣做的目的是希望把對象的聲明拖延到確實要使用它的時候再進行。這樣做可以有兩個好處:1. 確保了對象在它被使用前不會被程序的其他部分惡意修改。如果對象在開頭就被聲明然而卻在20行以後才被使用的話,就不能做這樣的保證。2. 使我們有機會通過用初始化取代賦值來達到性能的提升,從前聲明只能放在開頭,然而往往開始的時候我們還沒有獲得我們想要的值,因此初始化所帶來的好處就無法被應用。但是現在我們可以在我們獲得了想要的值的時候直接進行初始化,從而省去了壹步。註意,或許對於基本類型來說,初始化和賦值之間可能不會有什麽差異,但是對於用戶定義的類型來說,二者就會帶來顯著的不同,因為賦值會多進行壹次函數調用----operator =。因此當我們在賦值和初始化之間進行選擇的話,初始化應該是我們的首選。

(2)把聲明放在合適的位置上

在壹些場合,通過移動聲明到合適的位置所帶來的性能提升應該引起我們足夠的重視。例如:

bool is_C_Needed();

void use()

{

C c1;

if (is_C_Needed() == false)

{

return; //c1 was not needed

}

//use c1 here

return;

}

上面這段代碼中對象c1即使在有可能不使用它的情況下也會被創建,這樣我們就會為它付出不必要的花費,有可能妳會說壹個對象c1能浪費多少時間,但是如果是這種情況呢:C c1[1000];我想就不是說浪費就浪費了。但是我們可以通過移動聲明c1的位置來改變這種情況:

void use()

{

if (is_C_Needed() == false)

{

return; //c1 was not needed

}

C c1; //moved from the block's beginning

//use c1 here

return;

}

怎麽樣,程序的性能是不是已經得到很大的改善了呢?因此請仔細分析妳的代碼,把聲明放在合適的位置上,它所帶來的好處是妳難以想象的。

(3) 初始化列表

我們都知道,初始化列表壹般是用來初始化const或者reference數據成員。但是由於他自身的性質,我們可以通過使用初始化列表來實現性能的提升。我們先來看壹段程序:

class Person

{

private:

C c_1;

C c_2;

public:

Person(const C& c1, const C& c2 ): c_1(c1), c_2(c2) {}

};

當然構造函數我們也可以這樣寫:

Person::Person(const C& c1, const C& c2)

{

c_1 = c1;

c_2 = c2;

}

那麽究竟二者會帶來什麽樣的性能差異呢,要想搞清楚這個問題,我們首先要搞清楚二者是如何執行的,先來看初始化列表:數據成員的聲明操作都是在構造函數執行之前就完成了,在構造函數中往往完成的只是賦值操作,然而初始化列表直接是在數據成員聲明的時候就進行了初始化,因此它只執行了壹次copy constructor。再來看在構造函數中賦值的情況:首先,在構造函數執行前會通過default constructor創建數據成員,然後在構造函數中通過operator =進行賦值。因此它就比初始化列表多進行了壹次函數調用。性能差異就出來了。但是請註意,如果妳的數據成員都是基本類型的話,那麽為了程序的可讀性就不要使用初始化列表了,因為編譯器對兩者產生的匯編代碼是相同的。

(4)postfix VS prefix 運算符

prefix運算符++和—比它的postfix版本效率更高,因為當postfix運算符被使用的時候,會需要壹個臨時對象來保存改變以前的值。對於基本類型,編譯器會消除這壹份額外的拷貝,但是對於用戶定義類型,這似乎是不可能的。因此請妳盡可能使用prefix運算符

三. 內聯函數

內聯函數既能夠去除函數調用所帶來的效率負擔又能夠保留壹般函數的優點。然而,內聯函數並不是萬能藥,在壹些情況下,它甚至能夠降低程序的性能。因此在使用的時候應該慎重。

1.我們先來看看內聯函數給我們帶來的好處:從壹個用戶的角度來看,內聯函數看起來和普通函數壹樣,它可以有參數和返回值,也可以有自己的作用域,然而它卻不會引入壹般函數調用所帶來的負擔。另外,它可以比宏更安全更容易調試。

當然有壹點應該意識到,inline specifier僅僅是對編譯器的建議,編譯器有權利忽略這個建議。那麽編譯器是如何決定函數內聯與否呢?壹般情況下關鍵性因素包括函數體的大小,是否有局部對象被聲明,函數的復雜性等等。

2.那麽如果壹個函數被聲明為inline但是卻沒有被內聯將會發生什麽呢?理論上,當編譯器拒絕內聯壹個函數的時候,那個函數會像普通函數壹樣被對待,但是還會出現壹些其他的問題。例如下面這段代碼:

// filename Time.h

#include

#include

using namespace std;

class Time

{

public:

inline void Show() { for (int i = 0; i<10; i++) cout< };

因為成員函數Time::Show()包括壹個局部變量和壹個for循環,所以編譯器壹般拒絕inline,並且把它當作壹個普通的成員函數。但是這個包含類聲明的頭文件會被單獨的#include進各個獨立的編譯單元中:

// filename f1.cpp

#include "Time.hj"

void f1()

{

Time t1;

t1.Show();

}

// filename f2.cpp

#include "Time.h"

void f2()

{

Time t2;

t2.Show();

}

結果編譯器為這個程序生成了兩個相同成員函數的拷貝:

void f1();

void f2();

int main()

{

f1();

f2();

return 0;

}

當程序被鏈接的時候,linker將會面對兩個相同的Time::Show()拷貝,於是函數重定義的連接錯誤發生。但是老壹些的C++實現對付這種情況的辦法是通過把壹個un-inlined函數當作static來處理。因此每壹份函數拷貝僅僅在自己的編譯單元中可見,這樣鏈接錯誤就解決了,但是在程序中卻會留下多份函數拷貝。在這種情況下,程序的性能不但沒有提升,反而增加了編譯和鏈接時間以及最終可執行體的大小。

但是幸運的是,新的C++標準中關於un-inlined函數的說法已經改變。壹個符合標準C++實現應該只生成壹份函數拷貝。然而,要想所有的編譯器都支持這壹點可能還需要很長時間。

另外關於內聯函數還有兩個更令人頭疼的問題。第壹個問題是該如何進行維護。壹個函數開始的時候可能以內聯的形式出現,但是隨著系統的擴展,函數體可能要求添加額外的功能,結果內聯函數就變得不太可能,因此需要把inline specifier去除以及把函數體放到壹個單獨的源文件中。另壹個問題是當內聯函數被應用在代碼庫的時候產生。當內聯函數改變的時候,用戶必須重新編譯他們的代碼以反映這種改變。然而對於壹個非內聯函數,用戶僅僅需要重新鏈接就可以了。

這裏想要說的是,內聯函數並不是壹個增強性能的靈丹妙藥。只有當函數非常短小的時候它才能得到我們想要的效果,但是如果函數並不是很短而且在很多地方都被調用的話,那麽將會使得可執行體的體積增大。最令人煩惱的還是當編譯器拒絕內聯的時候。在老的實現中,結果很不盡人意,雖然在新的實現中有很大的改善,但是仍然還是不那麽完善的。壹些編譯器能夠足夠的聰明來指出哪些函數可以內聯哪些不能,但是,大多數編譯器就不那麽聰明了,因此這就需要我們的經驗來判斷。如果內聯函數不能增強行能,就避免使用它.

  • 上一篇:DS18B20的C51編程
  • 下一篇:32bit電腦是什麽意思
  • copyright 2024編程學習大全網