magic number
magic number
Magic number,即幻數,它可以用來標記文件或者協議的格式,很多文件都有幻數標誌來表明該文件的格式。
例如Windows操作系統可執行程序的開頭標記一般為MZ,這是一種源於磁碟操作系統時代的格式。
rar壓縮檔文件的開頭有[Rar]三個字元,zip文檔開頭為[ PK] (包、外語全稱: PacK)
可以用記事本(或者Ultra Edit)直接打開以上文件類型的文件,查看開頭的幻數。
應用
一般而言,硬碟數據恢復軟體(如 EasyRecovery),就是靠分析磁碟上的原始數據,然後根據文件幻數來試圖匹配文件格式,從而嘗試識別出磁碟中那些已經從文件系統登記表中刪除的文件(真實的文件內容可能沒有被覆蓋)。但是這種方法不是100%精確,因為磁碟中數據的隨機性也很大,很多沒有意義的字元串,可能被誤認為是有效的幻數,從而造成恢復出無效/錯誤的文件。
(可以在EasyRecovery中自己定義文件的幻數然後讓它幫你回復,不過常用的文件格式它都有記錄)
通常在應用開發中,文件讀寫也可能使用文件的幻數。例如讀取文件時,用它來判斷文件的格式是否匹配.如果不匹配則報告錯誤不處理文件,或者嘗試讀取文件的幻數標記來識別。
常見的例子。例如,把一個bmp圖像文件的擴展名改名為png,可能有些圖像瀏覽/編輯軟體提示:類型錯誤,載入失敗,但是有的軟體卻可以識別並讀出,並提示格式跟擴展名不匹配。
在源代碼編寫中,有這麼一種情況:編碼者在寫源代碼的時候,使用了一個數字,比如0x2123,0.021f等,他當時是明白這個數字的意思的,但是別的程序員看他的代碼,可能很難理解,甚至,過了一段時間,代碼的作者自己再看代碼的時候也忘記了這個數字代表的含義。於是感嘆,
雖然不知道這個數字是幹什麼用的,究竟代表什麼,但是編譯后的程序可以正常運行,真是“魔術般的數字”
幻數即源於此。
幻數的這個含義跟上一個不同,這個通常含貶義。因為在編程中使用幻數是不好的習慣,開發中應當盡量避免。
幻數的兩大弊端:
一、代碼可讀性差,例如
如果沒有說明,很難猜到那個2.13f的含義,假如它代表加速度,那麼修改如下:
這樣對於代碼閱讀者來說更好理解。
二、修改不方便,例如
暫且不說0xFFFFFFFF代表的含義,如果程序中很多地方使用了統一的一個常量,如果要修改值的時候很麻煩,也容易出錯。可能有遺漏等等諸多問題。
同樣可以改為如下:
這樣程序代碼不僅便於閱讀,而且要替換他的值,只需要替換一次就好了。
解決魔術數字的方法主要是將這些數字定義為常量,或者枚舉類型,或者使用編譯器的宏定義(如C/C++的#define)
魔術數字在程序開發中還有一個用途(這個時候它是中性詞),就是作為 調試符號,便於觀察和調試程序中出現的錯誤。
舉一個常見例子,windows下的程序員在調試程序時候,如果報錯,可能對如下數字(地址)比較熟悉:0xcdcd,0xcccc等。
0xcdcd 是微軟的C++ Debug 運行庫 為沒有初始化的堆內存所做的標記,例如malloc分配出的內存,其內容可能全部都是0xcdcd。由於0xcdcd的編碼,解釋為中文的話為“屯”,所以windows下的程序員,windows用戶應該對“屯屯屯屯屯屯”這樣的字元串並不陌生。
0xcccc同樣是微軟的運行庫為未初始化的棧空間所做的調試標記。
類似的還有 0xFDFDFD, 0xFEEEFEEE, 0xDEADDEAD, 0xABABABAB
這些都是微軟用到的幻數,在win32下程序調試的可以參考,但是不能在程序開發的代碼中使用,原因很簡單,這個跟平台,運行庫和編譯模式有很大關係,只是為了調試所設置的標記,僅此而已。
其它平台也有很多幻數,例如著名的0xDEADBEEF (dead beef)
如果自己需要編寫內存管理模塊,使用自己的幻數也可以很方便的做為調試所用。