執行檔

執行檔

可執行文件在計算機科學上,指一種內容可被電腦解釋為程序的電腦文件。通常可執行文件內,含有以二進位編碼的微處理器指令,也因此可執行文件有時稱為二進位檔。

簡介


這些二進位微處理器指令的編碼,於各種微處理器有所不同,故此可執行文件多數要分開不同的微處理版本。一個電腦文件是否為可執行文件,主要由操作系統的傳統決定。例如根據特定的命名方法(如擴展名為exe)或文件的元數據信息(例如UNIX系統設置“可運行”許可權)。

現代的可執行文件


在現代的各種電腦架構,可執行文件除了有程序的信息之外,還有其他信息,例如讓程序運行的操作系統設置值數據、除臭蟲數據等等。

二進位檔


作此含義特指無法廣泛應用於其他計算機針對特定操作系統配置的軟體發行模式。

系統調用


除了微處理器指令,可執行文件也具有系統調用數據,讓程序可使用操作系統提供的服務。因為系統調用數據,在各操作系統都有所不同,因此可執行文件除多數要分開不同的微處理版本,也有分開不同操作系統版本。

常見可執行文件的擴展名


.exe(Dos、Windows系列)
.com(Dos、Windows系列)
.App(以文件夾存在,Mac OS X

腳本


不是所有的可執行文件,都只存有電腦能閱讀的數據。以腳本語言撰寫的腳本文件,都可以是可執行文件,而且內含的數據可被人類閱讀,多數以ASCII文本存檔。原因是:腳本語言無需經過編譯器預先編譯,就可經過解釋器(如Perl、Python、Shell)運行。

開發過程


在DOS下,生成一個可執行文件的步驟比較簡單,用編譯器將源程序編譯為obj文件,再用鏈接器將obj文件鏈接成exe文件,不同語言的開發過程都差不多。
DOS可執行文件中的內容是由源程序中所寫的代碼和數據定義轉換而來的。惟一的例外是帶覆蓋部分(Overlay)的exe文件,它在基本的exe文件后附加了一些自定義的數據,其中可執行部分的長度由文件頭偏移0002h和0004h中的長度給出,該長度之後到文件實際長度這部分就是Overlay部分。這樣,即使一個帶覆蓋的exe文件大小遠遠超過640 KB,在DOS下也能運行,因為操作系統只裝入真正的可執行部分,然後由程序自己去讀取覆蓋部分的數據。一些打包軟體生成的奇大無比的自解壓包就採用這種結構,可執行部分是解包代碼,覆蓋部分是被壓縮的數據。DOS對可執行文件覆蓋部分的數據格式並沒有規定,它是程序員按自己的方式組織的。如果程序員願意,也可以把這些數據單獨放在另外一個文件中。
Win32可執行文件叫做PE文件。PE文件的基本結構和DOS可執行文件有很大的不同。它把程序中的不同部分分成各種節區(Section),其中可以有一個節區是放置各種資源的,如菜單、對話框、點陣圖、游標、圖標和聲音等。雖然可以把資源部分理解成類似DOS可執行文件中的“覆蓋”部分,但由於資源是Win32可執行文件的標準組成部分,而且是非常重要的組成部分,它的格式是固定的。所以與DOS軟體的開發過程相比,Win32軟體的開發中多了一個創建資源文件的步驟。
以使用MASM32軟體包為例,在用Win32彙編開發軟體的流程中,程序員要做的工作分創建代碼和創建資源兩部分。
代碼部分的開發工作與DOS下寫代碼的步驟是一樣的。程序員用文本編輯器書寫彙編源代碼(*.asm文件)。與C源代碼類似,asm文件中也可以用include語句包含數據定義和函數聲明的頭文件,Win32彙編的頭文件一般用inc作擴展名。大部分的include文件是編譯器軟體包附帶提供的,如MASM32軟體包附帶的Windows.inc文件定義了Win32 API中很多參數和數據結構,其他的inc文件則是不同DLL中的Win32 API函數聲明。最後,asm文件經彙編編譯器編譯成以obj為擴展名的目標文件。
資源文件中可以包括對話框、快捷鍵、菜單、字元串、版本信息和一些圖形資源等內容。資源文件的源文件是一種類似“腳本”的文本文件,它的擴展名一般為rc,其中用不同的語法定義了不同類型的資源,資源腳本文件最後由資源編譯器編譯成資源文件*.res。資源腳本文件同樣用到很多預定義值,所以軟體包中一般也包括資源頭文件供源文件來導入。MASM32軟體包中的資源頭文件是Resource.h。
在資源文件中,不同類型資源的記錄方式是不同的。對話框資源只記錄定義值,如對話框的大小、位置等,並非真正存儲對話框最後顯示在屏幕上的像素。這些大小、位置等信息最後由Windows解釋后才在屏幕上被繪畫成像素;菜單、字元串、快捷鍵等由文本構成;圖形資源則真正由像素組成,它們在資源腳本中被定義為一個文件名,由資源編譯器從磁碟文件導入。Windows在資源中支持的圖形文件有bmp點陣圖文件、cur游標文件和ico圖標文件,這些圖形文件可以用其他圖形處理軟體生成。另外,wav聲音文件也可以用在資源中。創建資源的方法在第5章中有詳細的描述。
編譯好目標文件*.obj和資源文件*.res后,最後一步是用鏈接器將它們鏈接成可執行文件。鏈接的時候要用到函數庫。在DOS環境下編程的時候,使用的函數庫是靜態庫。靜態庫是一些已經編譯好的代碼模塊。當用戶在源程序中用到某個函數的時候,鏈接器從庫文件中將這個函數的二進位代碼取出,與obj文件合在一起生成最終的exe文件。但在Win32環境下,大部分的公用函數封裝在DLL文件中,以動態鏈接的方式供用戶程序調用。這時候庫文件中只需要包含函數在DLL中的位置信息,不再需要有二進位代碼部分。所以鏈接的時候也只是把庫文件中的位置信息取出放入最後的可執行文件中。Win32中這種只包含位置信息的庫文件稱為導入庫。