共找到2條詞條名為ANSI的結果 展開

ANSI

一種字元代碼

ANSI是一種字元代碼,為使計算機支持更多語言,通常使用 0x00~0x7f 範圍的1 個位元組來表示 1 個英文字元。超出此範圍的使用0x80~0xFFFF來編碼,即擴展的ASCII編碼。

基本簡介


為使計算機支持更多語言,通常使用 0x80~0xFFFF 範圍的 2 個位元組來表示 1 個字元。比如:漢字 '中' 在中文操作系統中,使用 [0xD6,0xD0] 這兩個位元組存儲。
不同的國家和地區制定了不同的標準,由此產生了 GB2312、GBK、GB18030、Big5、Shift_JIS 等各自的編碼標準。這些使用多個位元組來代表一個字元的各種漢字延伸編碼方式,稱為 ANSI 編碼。在簡體中文Windows操作系統中,ANSI 編碼代表 GBK 編碼;在繁體中文Windows操作系統中,ANSI編碼代表Big5;在日文Windows操作系統中,ANSI 編碼代表 Shift_JIS 編碼。
簡單的說,在簡體中文系統下,ANS編碼代表GB2312編碼;在日文操作系統下,ANSI編碼代表JS編碼。
不同 ANSI 編碼之間互不兼容,當信息在國際間交流時,無法將屬於兩種語言的文字,存儲在同一段 ANSI 編碼的文本中。ANSI編碼表示英文字元時用一個位元組,表示中文用兩個或四個位元組。
ANSI編碼作為中國以及部分亞太地區的多字元編碼格式,Windows系統和OS X都是提供原生支持的。但是即便如此,許多國外開發者仍然在開發筆記或者文字錄入類應用的時候將ANSI編碼完全忽略,只加入全球通用的UTF-8編碼。

主要分類


在實際應用中接觸比較多的文本編碼有3種:ASCII、ANSI和UNICODE,其中ASCII碼是后兩種也是大多數常用編碼的基礎。

ASCII碼

文本編碼方式的基礎是ASCII碼,它是一個7位的編碼標準,包括26個小寫字母、26個大寫字母、10個數字、32個符號、33個控制代碼和一個空格,共128個代碼。由於計算機通常採用“位元組”為單位存儲和交換數據信息,因此很多計算機廠家對ASCII碼進行了擴充,在原來的基礎上又增加了128個附加字元,如ANSI、UNICODE等字符集

UNICODE

對於英文來講,ASCII碼就足以編碼所有字元,但對於中文,則必須使用兩個位元組來代表一個漢字,這種表示漢字的方式習慣上稱為雙位元組。雖然雙位元組可以解決中英文字元混合使用的情況,但對於不同字元系統而言,就要經過字元碼轉換,非常麻煩,如中英、中日、日韓混合的情況。為解決這一問題,很多公司聯合起來制定了一套可以適用於全世界所有國家的字元碼,不管是東方文字還是西方文字,一律用兩個位元組來表示,這就是UNICODE。