合字

合字

合字、連字、連結字或合體字(Ligature),在西方字體排印學中一般表示將多於一個字母的合成一個字形。

如印刷品中常常將拉丁字母兩個字母fi的i上一點常與f的一橫合併,而德語字母“β”原為ss等等。合字經過演變、長時間流行后,可能被視為直接的符號、文字而非合字。如W源自VV或UU,Æ源自AE,而表示“與”的意思的“&”,原是e和t的合字。

另外,漢字中如孔孟好學、招財進寶、日進斗金、囍一般稱為合文。

歷史起源


“招財進寶”的合書
“招財進寶”的合書
印刷合字單純源於手寫本中連寫的字元。以發現的最早的楔形文字手寫本中就已經含有很多 連寫字元。中世紀的拉丁文手寫本中,謄寫僧人為加快速度將字元連寫,誕生了很多手寫縮合字,如在哥特體中,帶右圈的字母 ( b, o, 和 p) 和帶左圈的字母 ( c, e, o, d, g 和 q) 的圈部都被重疊書寫。很多手寫本字元如 h, m和 n的豎划都被重疊,而且誕生了很多手寫縮合字。14世紀的手寫本中含有很多這種手寫縮合字。
當活字印刷誕生后,很多合字直接被製造成了鉛字。但是在1950年代無襯線字體廣泛使用,以及1970年代照相排版技術之後,合字就逐漸很少被使用。最早能進行合字電腦排版(之後激光印表機)之一的是 高德納的TeX 程序 (詳見下文)。這一潮流也影響到了1985年之後的桌面排版 技術。早期電腦軟體 ( TeX除外)無法進行合字替換,大部分新製作的電腦字體里也沒有合字。早期的個人電腦多使用英文,而英文中並不是必須使用合字,所以也沒有實際需要。
隨著現代電腦處理的多語言化和現代電子排版技術(如 OpenType),合字開始逐漸恢復被使用。

拉丁文字


書法合字

標識得最後一個字是 'tʒ'合字。
標識得最後一個字是 'tʒ'合字。
許多合字都把字母 f和其後的字元組合起來,最常用的就是 fi (或 fi,顯示為兩個獨立字元)。很多字體的這兩個字母並排在一起后,字母 i上的點會抵擋到字母 f的弧形勾,無法正確排印,所以乾脆就製造一個合字鉛字,把 i 的點融入 f 的勾來直接使用。其他 f 合字包括 fj, fl (fl), ff (ff), ffi (ffi), 和 ffl (ffl)。其他合字包括 fa, fe, fo, fr, fs, ft, fb, fh, fu, fy,以及 f 后加句號、逗號或連字元,還有不太常用的雙寫 ff和 fft
使用這些合字是因為通常的 小寫字母f中弧形勾影響字元間距調整。
有時,跨詞合字 (如shelfful的'ff')是不希望出現的,電腦程序 (如TeX)提供手動方式將它們分開。一些字體帶有 fff合字 (如Requiem體甚至包括一個 fffl 合字)用於德語的複合詞,如Sauerstoffflasche ("氧氣罐") 和Schifffahrt ("遊艇") (僅在遵循1996年拼寫改革法的前提下才寫作fff)。正式的德文正字法,如 Duden所述,不贊成跨詞合字,由於fff組合在德文中只會在組合詞出現如 (Schiff-fahrt,Sauerstoff-flasche),所以這樣跨詞合字在德文中使用會被認為是不正確的
土耳其語中有帶點和不帶點的字母I,如單詞fırın ("烤箱") 和fikir ("主意".。 fi合字容易混淆,所以在土耳其文排印中一般不使用該合字。像 fl合字一般也不用,土耳其語本來就沒有這樣的拼寫。
合字 "ſʒ ("sz")和 tʒ ("tz") 來自德語哥特體,現在街頭、城市廣場的標識中帶Platz或者以-platz結尾時仍常被使用。
有時 st (st) ſt (ſt), ch, ct以及 Qu的合字也被使用(如字體Linux Libertine)。

起源字母

合字
合字
字母 W是7世紀左右才被加入拉丁字母表的,其發音不盡相同。古英語使用盧恩字母Wynn (Ƿ) ,但受到諾曼人影響后廢棄不用。14世紀,這個起源於雙寫的 V或 U的"新"字母W誕生並在字母表中佔有一席。由於它相對於其他字母比較年輕,只有很少歐洲語言(英語、荷蘭語、德語、波蘭語、威爾士語、馬爾他語和瓦龍語)使用它來拼寫本土辭彙。
字元 Æ(小寫 æ,中世紀時稱為 aesc)作為一個字元在丹麥語、挪威語、冰島語以及古英語中使用,並不是一個印刷用的合字。它是一個實在的字母——代表一個母音,且在字母表中有位置。現代英文正字法中 Æ不作為一個單獨字母,而只是一種拼寫異形,如百科全書的英文單詞 "encyclopædia" 也可拼寫成 "encyclopaedia" 或"encyclopedia"。
Æ源自中世紀拉丁文,當時只是一些辭彙的隨意合字如 "Æneas"。它還可以在英文和法文中出現,但是現在已經傾向把 A和 E分開印刷。同樣, Œ 和 œ在法文中雖然通常印刷成合字,但在技術限制情況下仍可以拆開書寫。
在德文正字法中,帶兩點的字母母音ä, ö和ü來自歷史上的ae,oe,ue 合字(嚴格的說是上標的e,即aͤ, oͤ, uͤ)。現在當文字處理無法顯示這三個字元的情況下仍可改寫為二合字母ae, oe, ue。字母排序中它們不等價於ae,oe,ue,而是被簡單看成a,o,u。而北歐語言則不同:帶兩點的字母被視為獨立字母,並排在字母表最後。
一些母音中的圈形附加符號,如 å起源於一個 o合字。現在把舊式 aa 改寫為 å 已經稱為不成文習慣,但在此之前也可寫成 a 上再加一個小 a (aͣ),如 Johannes Bureus, Runa ABC boken。
uo 合字 ů 的使用實例也在早期現代高地德語里找到,但其後來混同到 u中(如中期高地德語的fuosz、早期現代高地德語fuͦß、現代德語Fuß)。它仍存在於捷克語中,被稱為kroužek。
西班牙語和葡萄牙語中的上波浪線,分別用於字母ñ和表示母音鼻音化,起源於一個 nn合字(Espanna = España, anno = año)。同樣法語中的抑揚符也源自不發音s。法語、葡萄牙語、西班牙語等中的字母 ç其實是一個字母 "c" 蓋在一個"z"上面的形式。
字母hwair(ƕ)僅用於轉寫哥德語,代表hw合字。最早在1900年左右心理學者使用這個字用於代替二合字母hv 用於表示有問題的現象,如Jacques Paul Migne在其1860年代的著作 (Patrologia Latina,第18卷).
拜占庭帝國有一個獨特的合字o-u ligature (Ȣ) ,它源於希臘字母的 ο-υ 兩個字母的合字,並被加入到了字母表中。
Gha (ƣ)是一個罕見的字母,起源於 Q 和 G,但在ISO的文件中誤注成 O-I 合字(參見Unicode註解)
國際音標使用合字來表示塞擦音,其中6個有Unicode編碼: ʣ, ʤ, ʥ, ʦ, ʧ and ʨ。一個擦音仍使用合字:ɮ,而國際音標擴展里加入了后三個:ʩ , ʪ and ʫ.

起源符號

最常用的合字元號當屬 &。它起源於 E 和 t的合字,即拉丁文的單詞“和”( "et")。它在法文中保持原音原意而在英文中也使用。由於其使用廣泛,一般已經不認為它是一個合字而是一個普通符號。
和其他合字一樣,它被仍當作一個字母來使用(如早期現代英語),英語中它念作"and"而不是"et",而&c念作 "et cetera"(等等)。大多數字體中的字形和兩字直接組合不一樣,但仍有一些字體 (如Trebuchet MS) 就把他們設計 & 為合字。
同樣,美元符號 $可能也起源於合字 ( "pesos",但有也有其他不同說法),但現在實際上已經被當成一個普通符號。西班牙比塞塔(peseta)也有時被寫作合字 ₧ (源自 Pts).

二合字母

二合字母,如西班牙語和威爾士語中的ll,一般不被看成是合字,因為印刷上兩個字母通常是分開的。正如上討論的合字一樣,一些二合字母在一些語言中有不同處理方式。西班牙1994年拼寫改革時,二合字母ch 和ll 已經被考慮為分開的兩個字母。
法文的情況也一樣,œu被看成為合字œ與字母u的組合。
儘管如此,荷蘭語中 "ij"的定位比較模糊。根據不同的使用標準,它可看成是一個二合字母,或合字,或者一個獨立字母。它有獨立的大小寫形式,而在一些專業字體中,通常是有一個獨立字形也有合字 (如 Zapfino)。無襯線字體 大寫字母的IJ流行於荷蘭,通常形狀像是一個斷左臂的U。更令人混淆的是,手寫時可以把小寫字母y寫作沒有點的ij,和大寫字母IJ (同樣沒有點)看起來只是大小差異而已。而Y在本土荷蘭語辭彙中不被使用。

合字語言

丹麥語和挪威語
法語 德語冰島語瑞典語

非拉丁字元


合字不僅出現在拉丁文本中:
婆羅米系文字的母音附標文字頻繁使用合字標註輔音。合字的數量依據語言而不同,如同樣的天城文,用於 梵文的合字就要比印地文多。總數為37的輔音中,在天城文兩個字母組成的合字總數為1369,很少字體能全部顯示這些合字。微軟[Windows]]系統附帶的''Mangal.ttf''字體帶有印地語支持,但不能正確處理在द, ट, ठ, ड, 和 ढ右邊的輔音合字,而只是加 virama后按照一般形式顯示在輔音之後。希臘字母中使用一些合字,特別是在 omicron (Ο) 和 upsilon (Υ)連寫 which later gave rise to one of the letters of the Cyrillic alphabet —參見Ou字母。西里爾合字: Љ, Њ, Ы, Ѿ. Iotified 西里爾字母是早期西里爾illic decimal I和其他母音的合字: Ꙗ (Я的祖先), Ѥ, Ѩ, Ѭ, Ю (源自另外一個合字,Оу,早期的У形式)。馬其頓和塞爾維亞字母表中的兩個字母 lje 和 nje (љ, њ)在19世紀曾分別是El En (л, н) 與 軟音符 (ь)的合字。還有一個ya (Я)和 e 的合字:Ԙԙ,其他合字包括 Ꚅꚅ 和 Ꚉꚉ. 格拉哥里字母的一些手寫形式:用於中世紀到19世紀書寫 Slavic 語言,多為方形且常用合字。在希伯來語中字母aleph 和 lamed 在一些前現代文本中(主要是宗教或“猶太-阿拉伯”文本)可組合為合字。該組合很常用,因為[ʔ][a]l- (在希伯來文中寫作 aleph加lamed)是阿拉伯語中的定冠詞。阿拉伯文:各個字母在詞頭,詞中,詞尾均有不同形式。如阿拉伯文的mīm,單獨書寫為 م‎,三個連寫 (mmm,顯示為詞頭,詞中,詞尾形)就變為 ممم ‎。注意 lām + ʼalif 的情況是特殊的: ﻻ‎, 而 lām + ʼalif 詞中,詞尾形是ﻼ‎。在Unicode有一個特殊的安拉 合字位於U+FDF2: ﷲ‎. 烏爾都語 使用阿拉伯字母的手寫體 (Nasta`līq Script) ,在電子排印中有大量合字。烏爾都語最常用的排版工具 InPage使用 Nasta`līq Script字體多達 20,000個合字。

電腦排版


TeX是電腦排版系統中能使用合字的典型程序。它能提供五個常用合字: ff、 fi、 fl、 ffi 和 ffl。當TeX遇到這些組合時會自動替換成合字。當然操作者可以手動切換。
OpenType字體格式可以針對一個字元提供多個字形,因此用來作為合字替換,但需要軟體支持。XeTeX是一個TeX 排版引擎用來調用這些功能。這種替換原先主要用於阿拉伯文排版,但現在已經廣泛用於西文。
下表列出了常用文字對的合字以及Unicode代碼。正確顯示需要使用能正確處理合字的操作系統和瀏覽器 並調用正確的Unicode 電腦字體。
Unicode中對合字的處理不是一種字元定義,而是一種表現形式。比如,如果一個現代字體需要顯示'h'后加 'r',且該字體確實有'hr'合字,這個合字才會被顯示出來。因此,使用特殊Unicode合字字元是"不鼓勵"且"在任何環境下不會被再度編碼"。注意,合字 æ 和 œ 不能隨意替代 'ae' 和 'oe',比如 'does'不能寫作 'dœs'。
Unicode
這是一個不完整列表。U+A732到U+A73D 區域及其臨近區域的一些字元沒有列出。
非合字合字Unicode
Et&U+0026
ſs, ſzßU+00DF
AE, aeÆ, æU+00C6, U+00E6
OE, oeŒ, œU+0152, U+0153
IJ, ijIJ, ijU+0132, U+0133
ueU+1D6B
ffU+FB00
fiU+FB01
flU+FB02
ffiU+FB03
fflU+FB04
ſtU+FB05
stU+FB06
另外,Dz、克羅埃西亞語和波斯尼亞語字母 DŽ, LJ, 和 NJ都有單獨的碼位。它們不是合字而是二合字母。僅在語音轉寫 中使用的合字
Non-ligatureLigatureUnicode
dbȸU+0238
qp (cp)ȹU+0239
dzʣU+02A3
dʑ (or dz curl)ʥU+02A5
dʒ (or dezh)ʤU+02A4
ʩU+02A9
lsʪU+02AA
lzʫU+02AB
lʒ (or lezh)ɮU+026E
tɕ (or tc curl)ʨU+02A8
tsʦU+02A6
tʃ (or tesh)ʧU+02A7
U+0238 和 U+0239 是二合字母,但實際上是合字。