C語言（代碼）和編譯文件（拆包看到）的區別是什麽？有什麽相同之處？作用分別是什麽？

采納了加我不懂問我壹 C編譯過程概述目前Linux下最常用的C語言編譯器是GCC(GNU Compiler Collection),它是GNU項目中符合ANSI C標準的編譯系統,能夠編譯用C、C++和Object C等語言編寫的程序.GCC不僅功能非常強大,結構也異常靈活.最值得稱道的壹點就是它可以通過不同的前端模塊來支持各種語言,如Java、Fortran、Pascal、Modula-3和Ada等. Linux系統下的gcc（GNU C Compiler）是GNU推出的功能強大、性能優越的多平臺編譯器，是GNU的代表作品之壹。gcc是可以在多種硬體平臺上編譯出可執行程序的超級編譯器，其執行效率與壹般的編譯器相比平均效率要高20%~30%。使用GCC編譯程序時,編譯過程可以被細分為四個階段:

◆ 預處理(Pre-Processing)

◆ 編譯(Compiling)

◆ 匯編(Assembling)

◆ 鏈接(Linking) 二編譯過程中各種文件介紹 1.以擴展名區分文件類型.c為後綴的文件，C語言源代碼文件；

.a為後綴的文件，是由目標文件構成的檔案庫文件；

.C，.cc或.cxx 為後綴的文件，是C++源代碼文件；

.h為後綴的文件，是程序所包含的頭文件；

.i 為後綴的文件，是已經預處理過的C源代碼文件；

.ii為後綴的文件，是已經預處理過的C++源代碼文件；

.m為後綴的文件，是Objective-C源代碼文件；

.o為後綴的文件，是編譯後的目標文件；

.s為後綴的文件，是匯編語言源代碼文件；

.S為後綴的文件，是經過預編譯的匯編語言源代碼文件。 2.LINUX目標文件描述 LINUX 平臺下三種主要的可執行文件格式：a.out（assembler and link editor output 匯編器和鏈接編輯器的輸出）、COFF（Common Object File Format 通用對象文件格式）、ELF（Executable and Linking Format 可執行和鏈接格式）。其中ELF是x86 Linux系統下的壹種常用目標文件(object file)格式，有三種主要類型: (1)適於連接的可重定位文件(relocatable file)，可與其它目標文件壹起創建可執行文件和***享目標文件。編譯產生的.o文件就屬於這類。

(2)適於執行的可執行文件(executable file)，用於提供程序的進程映像，加載到內存執行。這就是編譯、鏈接之後形成的最終文件。

(3)***享目標文件(shared object file)，連接器可將它與其它可重定位文件和***享目標文件連接成其它的目標文件，動態連接器又可將它與可執行文件和其它***享目標文件結合起來創建壹個進程映像。這就是庫文件，只指動態庫文件。詳細了解請看本人收藏的《LINUX可執行文件分析》三編譯過程詳解 C語言的編譯鏈接過程要把我們編寫的壹個c程序（源代碼）轉換成可以在硬件上運行的程序（可執行代碼），需要進行編譯和鏈接。編譯就是把文本形式源代碼翻譯為機器語言形式的目標文件的過程。鏈接是把目標文件、操作系統的啟動代碼和用到的庫文件進行組織形成最終生成可執行代碼的過程。過程圖解如下：

從圖上可以看到，整個代碼的編譯過程分為編譯和鏈接兩個過程，編譯對應圖中的大括號括起的部分，其余則為鏈接過程。 1. 編譯過程編譯過程又可以分成兩個階段：編譯和匯編。 1）編譯編譯是讀取源程序（字符流），對之進行詞法和語法的分析，將高級語言指令轉換為功能等效的匯編代碼，源文件的編譯過程包含兩個主要階段：第壹個階段是預處理階段，在正式的編譯階段之前進行。預處理階段將根據已放置在文件中的預處理指令來修改源文件的內容。如#include指令就是壹個預處理指令，它把頭文件的內容添加到.cpp文件中。這個在編譯之前修改源文件的方式提供了很大的靈活性，以適應不同的計算機和操作系統環境的限制。壹個環境需要的代碼跟另壹個環境所需的代碼可能有所不同，因為可用的硬件或操作系統是不同的。在許多情況下，可以把用於不同環境的代碼放在同壹個文件中，再在預處理階段修改代碼，使之適應當前的環境。主要是以下幾方面的處理： (1)宏定義指令，如 #define a b

對於這種偽指令，預編譯所要做的是將程序中的所有a用b替換，但作為字符串常量的 a則不被替換。還有 #undef，則將取消對某個宏的定義，使以後該串的出現不再被替換。 (2)條件編譯指令，如#ifdef，#ifndef，#else，#elif，#endif等。

這些偽指令的引入使得程序員可以通過定義不同的宏來決定編譯程序對哪些代碼進行處理。預編譯程序將根據有關的文件，將那些不必要的代碼過濾掉。

（3)頭文件包含指令，如#include "FileName"或者#include <FileName>等。在頭文件中壹般用偽指令#define定義了大量的宏（最常見的是字符常量），同時包含有各種外部符號的聲明。采用頭文件的目的主要是為了使某些定義可以供多個不同的C源程序使用。因為在需要用到這些定義的C源程序中，只需加上壹條#include語句即可，而不必再在此文件中將這些定義重復壹遍。預編譯程序將把頭文件中的定義統統都加入到它所產生的輸出文件中，以供編譯程序對之進行處理。包含到c源程序中的頭文件可以是系統提供的，這些頭文件壹般被放在 /usr/include目錄下。在程序中#include它們要使用尖括號（< >）。另外開發人員也可以定義自己的頭文件，這些文件壹般與c源程序放在同壹目錄下，此時在#include中要用雙引號（""）。

(4)特殊符號，預編譯程序可以識別壹些特殊的符號。

例如在源程序中出現的LINE標識將被解釋為當前行號（十進制數），FILE則被解釋為當前被編譯的C源程序的名稱。預編譯程序對於在源程序中出現的這些串將用合適的值進行替換。

預編譯程序所完成的基本上是對源程序的“替代”工作。經過此種替代，生成壹個沒有宏定義、沒有條件編譯指令、沒有特殊符號的輸出文件。這個文件的含義同沒有經過預處理的源文件是相同的，但內容有所不同。下壹步，此輸出文件將作為編譯程序的輸出而被翻譯成為機器指令。

第二個階段編譯、優化階段，經過預編譯得到的輸出文件中，只有常量；如數字、字符串、變量的定義，以及C語言的關鍵字，如main,if,else,for,while,{,}, +,-,*,\等等。

編譯程序所要作得工作就是通過詞法分析和語法分析，在確認所有的指令都符合語法規則之後，將其翻譯成等價的中間代碼表示或匯編代碼。

優化處理是編譯系統中壹項比較艱深的技術。它涉及到的問題不僅同編譯技術本身有關，而且同機器的硬件環境也有很大的關系。優化壹部分是對中間代碼的優化。這種優化不依賴於具體的計算機。另壹種優化則主要針對目標代碼的生成而進行的。

對於前壹種優化，主要的工作是刪除公***表達式、循環優化（代碼外提、強度削弱、變換循環控制條件、已知量的合並等）、復寫傳播，以及無用賦值的刪除，等等。後壹種類型的優化同機器的硬件結構密切相關，最主要的是考慮是如何充分利用機器的各個硬件寄存器存放的有關變量的值，以減少對於內存的訪問次數。另外，如何根據機器硬件執行指令的特點（如流水線、RISC、CISC、VLIW等）而對指令進行壹些調整使目標代碼比較短，執行的效率比較高，也是壹個重要的研究課題。

2）匯編

匯編實際上指把匯編語言代碼翻譯成目標機器指令的過程。對於被翻譯系統處理的每壹個C語言源程序，都將最終經過這壹處理而得到相應的目標文件。目標文件中所存放的也就是與源程序等效的目標的機器語言代碼。目標文件由段組成。通常壹個目標文件中至少有兩個段：代碼段：該段中所包含的主要是程序的指令。該段壹般是可讀和可執行的，但壹般卻不可寫。數據段：主要存放程序中要用到的各種全局變量或靜態的數據。壹般數據段都是可讀，可寫，可執行的。 2. 鏈接過程由匯編程序生成的目標文件並不能立即就被執行，其中可能還有許多沒有解決的問題。

例如，某個源文件中的函數可能引用了另壹個源文件中定義的某個符號（如變量或者函數調用等）；在程序中可能調用了某個庫文件中的函數，等等。所有的這些問題，都需要經鏈接程序的處理方能得以解決。

鏈接程序的主要工作就是將有關的目標文件彼此相連接，也即將在壹個文件中引用的符號同該符號在另外壹個文件中的定義連接起來，使得所有的這些目標文件成為壹個能夠誒操作系統裝入執行的統壹整體。

根據開發人員指定的同庫函數的鏈接方式的不同，鏈接處理可分為兩種： (1)靜態鏈接在這種鏈接方式下，函數的代碼將從其所在地靜態鏈接庫中被拷貝到最終的可執行程序中。這樣該程序在被執行時這些代碼將被裝入到該進程的虛擬地址空間中。靜態鏈接庫實際上是壹個目標文件的集合，其中的每個文件含有庫中的壹個或者壹組相關函數的代碼。 (2)動態鏈接

在此種方式下，函數的代碼被放到稱作是動態鏈接庫或***享對象的某個目標文件中。鏈接程序此時所作的只是在最終的可執行程序中記錄下***享對象的名字以及其它少量的登記信息。在此可執行文件被執行時，動態鏈接庫的全部內容將被映射到運行時相應進程的虛地址空間。動態鏈接程序將根據可執行程序中記錄的信息找到相應的函數代碼。

對於可執行文件中的函數調用，可分別采用動態鏈接或靜態鏈接的方法。使用動態鏈接能夠使最終的可執行文件比較短小，並且當***享對象被多個進程使用時能節約壹些內存，因為在內存中只需要保存壹份此***享對象的代碼。但並不是使用動態鏈接就壹定比使用靜態鏈接要優越。在某些情況下動態鏈接可能帶來壹些性能上損害。四編譯過程實例描述 linux中使用的gcc編譯器把上述的幾個過程集成，壹個命令就能完成編譯的整個過程。為了詳細說明每個步驟，下面我們將分部執行。下圖是gcc代理的編譯過程

例程: 在linux下創建文件hello.c，內容如下，

#include <stdio.h>

int main(void)

{

printf ("Hello,everybody!\n");

return 0;

} ◆ 預處理(Pre-Processing)

使用-E參數可以讓GCC在預處理結束後停止編譯過程，對應的命令是cpp,

# gcc -E hello.c -o hello.i 用編輯器打開hello.i,可以看到stdio.h文件被展開到了hello.i中。 ◆ 編譯(Compiling)

使用-S參數將hello.i編譯為匯編程序,使用的命令是cc -S,

#gcc –S hello.i –o hello.s 用編輯器打開hello.s，顯然已經變成了匯編代碼。 ◆ 匯編(Assembling)

使用-c參數將hello.s編譯為目標文件,對應的命令是as,