伏尼契手稿

一本內容不明的神秘書籍

伏尼契手稿(Voynich manuscript),是一本內容不明的神秘書籍,共240頁,附有插圖,而作者不詳。書中所用字母及語言至今無人能識別,與現代的語言完全搭不上,似乎是中古世紀鍊金術士之參考書籍。書名伏尼契來自名為威爾弗雷德·伏尼契的波蘭裔美國人書商,他於1912年在義大利買下此書。2005年,這部書入藏耶魯大學的貝內克珍本與手稿圖書館,編號MS 408。

簡介


1912 年,美國珍本書商威爾弗雷德·伏尼契(Wilfrid Voynich)在羅馬附近一所耶穌會大學圖書館的地下,找到他一生中最大的發現:一份厚達230多頁,以奇特字體寫成的手稿,手稿中還有許多植物、天體和出浴美女等奇異的圖片。伏尼契立刻認定這是極為重要的新發現。這份手稿雖然看來像是中世紀鍊金術士或草藥醫生的參考書,但似乎完全以密碼寫成。從插圖中的髮型等特徵看來,這本書的製作時間應該介於1470~1500年間,手稿上的信中的17世紀字母說明,這份手稿在1586年由神聖羅馬帝國的魯道夫二世收購。 1600年代,至少有十位學者曾試圖解讀這份手稿,後來它消失了將近250年,直到被書商伏尼契發現才重見天日。
伏尼契敦請當時頂尖的密碼學家破解這份奇特的手稿,但它似乎和任何已知的密碼語言都對不起來。90年來,許多世界頂尖的解碼專家努力鑽研,但是沒有人能破解這種稱為“伏尼契文”的文字,這份手稿的真面目和來源仍是個謎。一連串的失敗令伏尼契手稿儼然成為密碼術歷史中的聖杯,讓人懷疑手稿是否有內容可供破解。伏尼契文說不定完全沒有意義,手稿也可能只是個精心設計的騙局。
這份手稿目前收藏在美國耶魯大學貝內克珍本書與手稿圖書館中。

關於原文


由右邊不對稱的段落推斷,文字是由左至右書寫。段落沒有明顯的標點符號。從流暢的字型及排列整齊,似乎謄寫員清楚明白自己在寫什麼,而不是落筆前故意逐字編造。
手稿含有17萬個字跡,字跡之間有窄分隔,大部分由一至兩筆寫成。一套有20至30種不同字跡的字母系統幾乎說明了整個手稿。關於某些字跡是否為個別字母存在一些爭論。部分奇怪的字母僅出現一或兩次。較闊的分隔可分辨出約3.5萬個不同長度的“辭彙”,大致符合語音學的規律,例如部分字母在每一個辭彙經常出現(正如英語的母音字母)等。
統計分析發現,文稿的文字規律與自然語言類似。例如,辭彙的出現頻率符合齊夫定律,而辭彙的熵(每詞約10位元)亦與英語或拉丁語相類似。
然而,手稿的語言與歐洲語言不太相似。例如,幾乎沒有辭彙是多過10個字母,亦幾乎沒有1或2個字母的辭彙。辭彙內的字母分佈獨特,有些字母僅出現在字首,有些在字尾,有些在辭彙中間,這特點與阿拉伯字母相似,但不見於拉丁字母、希臘字母或西里爾字母。辭彙的重複程度也高於一般歐洲語言。同一辭彙可能一氣出現三次(相當於在英語出現and and and)。統計學上,手稿的辭彙數目相對較少。

破解歷史


它曾經難倒過許多20世紀頂尖的密碼學家。美國的密碼破譯之父——赫伯特·奧斯本·亞德利曾在一戰期間破解過德國人和日本人的密碼,卻對這份手稿束手無策。破解密碼的關鍵在於找到其中的“破綻”,它是泄露天機的規則。難以置信,在伏尼契密碼面前,各種語言的統計規律統統失效。
威尼斯的弗朗切斯科家族從威尼斯建城伊始就從事商業政治與學術。弗朗切斯科·達·莫斯托是一名威尼斯著名的建築學家和歷史學家,他對手稿中的圖畫提出了自己的看法:“這是一個容器,這有點特別,這種材料不像是金屬,很脆弱但你可以隨意擺弄它,沒錯,這有點像玻璃。” “容器的底座像是那個時期的威尼斯玻璃。製作玻璃有很多秘方,在當時,沒有人可以把這些秘方泄漏出去:玻璃的製作過程所用的材料組成部門都有很嚴格的規定,泄漏出去會遭到嚴厲的懲罰。” “有些人去了法國,威尼斯共和國就寫信給他們說:‘如果你泄漏了秘密,你的家人就會有大麻煩,或者我們會殺了你。’ ”
弗朗切斯科認為伏尼契手稿的作者是中世紀的商業間諜,竊取並販賣威尼斯人的商業秘密,為隱瞞意圖用似乎無法破解的密碼書寫了這份手稿。

追蹤

羅莎·曼塔斯蒂是威尼斯早期玻璃專家,在穆拉諾玻璃博物館的保管室里存有一些文藝復興時期的玻璃,手稿中的圖畫似乎與它們遙相呼應。
伏尼契手稿
伏尼契手稿

破譯

密碼學家約翰·查德威克認為,密碼學的核心在於演繹和控制試驗,“形成假說,進行檢驗,頻繁地拋棄假說”。如何向他人證明某種破譯方案是正確的,也並非易事,它需要密碼破譯者提供4個步驟:其一:指出密碼系統及其密鑰;續而:針對密文進行加密過程的逆過程,得出待檢驗的明文;其三:確保明文是有意義的信息,而非胡言亂語;最後:密鑰可以簡潔地表達。
伏尼契手稿
伏尼契手稿
對於試圖破譯《伏尼契手稿》的人而言,上述4個步驟是無法逾越的屏障。英國基爾大學高級講師、知識建模小組組長,開放大學高級客座研究員戈登·魯格宣布,《伏尼契手稿》是一場精妙絕倫的騙局,首要嫌犯是伊麗莎白女王的一名律師,他可能是利用一種“卡登格”,把字母等符號寫在方格里,然後用一張有著規則的孔的卡片蓋住,把從孔中露出的符號拼湊起來造出假冒的“單詞”。
密碼專家菲利普·辛納格拉認為手稿的密碼系統與復興時期米蘭的某個系統相似,強大的斯福爾扎家族曾經使用過這個密碼系統。”這是米蘭斯福爾家族的密碼索引,上面是密碼字母。我們發現4所代表的是C,40代表是S,伏尼契手稿里也有這個密碼,符號相同,4和40。”(註:讀作四零)

線索

“世界上圓形的城鎮共有9個,我能想起的一個是巴格達,一個是耶路撒冷,米蘭也是圓的。如果這是一座城市中間就是有塔的城堡還有相當獨特的V型的城垛。“米蘭的城垛也是V形的。
15世紀的米蘭非常強大,常常與鄰近的威尼斯大動干戈。它由強大的斯福爾扎王朝統治。在米蘭的中心正是斯福爾扎的城堡。如今斯福爾扎里的菲拉雷特塔已經成為米蘭的地標,它與手稿中圖畫十分相似。在十九世紀重建以前,城堡最古老的部分是一座獨立的V形城堡,它立在護城河的中央,守候著城堡。
菲拉雷特塔以建築師安東尼奧·阿維利諾的名字命名,他的名字綽號為”菲拉雷特“意為”崇尚美德的人“。
公元1400左右,阿維利諾生於佛羅倫薩,后經培訓成為一名建築師,他在羅馬居住過一段時期,因為被控參與盜竊施洗者聖約翰的頭顱的行動而入獄,出獄后他逃到威尼斯然後前往米蘭。
他最大的成就不是建築而是一本書,名為“建築論文”,他在書中描述了自己想像中的理想城市,在1465年完成,他在書中使用大量的密碼和暗語,這也成為他是伏尼契手稿作者的重要依據。
弗朗切斯科這樣大笑著評論說:“他把靈魂賣給了魔鬼!”
(註:關於建築師安東尼奧·阿維利諾。他在米蘭工作了十五年,設計了 菲拉雷特塔,和他最大的成就之一——曾學習過密碼。)

破解

1921年,出現了第一個宣稱破解伏尼契手稿的人。美國賓州大學哲學教授紐柏德指出,伏尼契文字的字母中包含放大后才看得見的小筆畫,這些筆畫是古希臘速記文字。依據由密碼讀出的內容,紐柏德斷定伏尼契手稿是13世紀的哲學科學家培根(Roger Bacon)所撰寫,旨在描述他的發現,例如顯微鏡的發明等。但不到10年,批評者就推翻了紐柏德的說法,證明所謂字母中的細小筆畫其實是墨水的自然裂痕。
紐柏德的努力只是一連串失敗的開始。1940年代,業餘的解碼家菲利和史壯運用密碼代換法,將伏尼契文字母轉譯成羅馬字母,但如此轉譯出來的文字沒什麼意義。二次世界大戰末期,曾破解日本海軍密碼的美國軍方密碼人員,利用閑暇研究古代密文。他們破解了所有密文,唯一無法破解的就是伏尼契手稿。
1978年,業餘文獻研究者史托濟科指出,這種文字是以去掉母音的烏克蘭文寫成,不過他轉譯出來的內容(包括「小上帝的眼睛要爭奪的是空虛」)並不符合手稿上的插圖,跟烏克蘭歷史也沒什麼關係。1987年,醫師利瓦伊托夫指出,這份文件由在中世紀法國相當盛行的凈化派(Cathar)信徒所製作,伏尼契文則是多種語言的混合體。不過利瓦伊托夫譯寫出來的內容也和凈化派完整保存的教義不相符合。
此外,這些解答方案在碰到相同的伏尼契字時,往往在手稿中某些部分用的是一種翻譯,在其它部分用的又是另一種翻譯。舉例來說,紐柏德的解答中包含以迴文方式解譯文字,這種方式是出了名的不精確。例如ADER這字就可以看成READ、DARE或DEAR。大多數學者認為,這些伏尼契手稿破解方法多少都有令人無法信服的地方。另外,這些方法都無法將明文(看得懂的文字)轉譯成與伏尼契文特性相同的密文。如果手稿不是密碼,那麼會是一種不為人知的文字嗎?雖然我們無法解譯內容,但看得出它具有驚人的規則性。舉例來說,最常見的一些字每行會出現兩三次。在寫出文字時,我使用歐洲伏尼契字母(EVA)將伏尼契文轉寫成羅馬字母(請參見右頁〈伏尼契文ABC〉)。手稿第78頁有一段是這樣的:qokedy qokedy dal qokedy qokedy。這種重複程度在任何已知語言中都不曾出現。相反地,伏尼契文中只有極少數片語,在片語中,兩三個不同的字會規律地一起出現。這些特徵顯示伏尼契文不大可能是人類語言,因為和其它語言差別實在太大了。
第三種可能是,這份手稿是用來詐財的騙局,或是某個瘋狂鍊金術士的信手塗鴉。手稿在語言學上的複雜程度,似乎可以反駁這種說法。手稿中的文字,除了會重複出現,其本身的組成結構也有相當的規律性。例如經常出現的音節qo一定位於前綴。chek這個音節有時會出現在前綴,但如果和qo出現在同一個字中,chek一定會在qo之後。常見的音節dy通常出現在字尾,偶爾會出現在前綴,但從來沒有出現在字的中間。
光靠隨機混合音節的假造方式,不可能產生規律性這麼高的文字。伏尼契文也比腦部損傷或有心理疾病的患者所使用的病態語言複雜得多。即使發瘋的鍊金術士真的為某種胡謅的語言制訂了文法,又花了好幾年時間依據這種文法寫作,寫出的東西也不會具備伏尼契手稿的各種統計特徵。舉例來說,伏尼契文的文字長度呈現二項分佈,也就是最常見的字由5~6個字母組成,字母較多或較少的字,出現的頻率和對稱鐘形曲線的最高峰相比,大幅降低。這種分佈在人類語言中極為罕見。在絕大多數人類語言中,字長的分佈較廣而且不對稱,比較長的字出現頻率會比較高。伏尼契文字長度的二項分佈,不太可能是騙子刻意編造出來的,因為這種統計概念要到手稿寫就后數百年才會出現。

專家推理


總而言之,伏尼契手稿若不是極為罕見的密碼或奇怪的未知文字,就是個精心設計的騙局,以往一直沒有明確的方法可以打開僵局。剛好幾年前,我同事海德和我正在尋找這樣的謎團。我們發展出一種深入的評估方法,用來分析與探討在研究難題時使用的專門知識和推理過程。
認為伏尼契文的特徵與人類語言不一致的說法,有大量的語言學相關專門知識做為後盾。這個結論看來相當可靠,因此我進一步研究騙局說。大多數研究過伏尼契手稿的人認為伏尼契文十分複雜,不可能是騙局。但這種說法只是單純的想法,沒有實際證據。沒有專家研究過如何摹寫大段中世紀密文,因為要找到真實文字的實例都不容易,想要找出假造的文字就更難了。
幾位研究人員,包括巴西坎皮納斯大學的史托非等,曾經懷疑伏尼契手稿是以隨機文字產生表製作出來的。這種表中列出了字母或音節,使用者選擇一連串格子(可能是擲骰子決定),將格子中的字母或音節組合成一個字。這種方法可能產生伏尼契文字中的某些規則性。在史托非的方法中,表中第一欄是qo等只會出現在前綴的前綴音節,第二欄是chek等中綴(出現在字中間)音節,第三欄為y等後綴音節。依序從每欄選出一個音節,就可造出具伏尼契文特徵的字。某些格子可能是空的,這樣就可以造出沒有前綴、中綴或後綴的字。
不過伏尼契文的其它特徵就沒這麼容易仿造了。舉例來說,有些字母很常見,但極少連在一起。轉寫為a、e、l的字母很常見,al的組合也常見,但el的組合就很少。透過表格隨機混合字母無法做出這種效果,因此史托非等人排除了這種方法。真正的關鍵是「隨機」。對現代的研究人員而言,隨機是非常寶貴的概念。但手稿寫成之後過了很久,這種概念才發展出來。中世紀的騙子很可能用不同的方法來組合音節,而這種方法在嚴格的統計定義上不是隨機的。伏尼契文某些特徵可能是以一種早已棄而不用的工具所造成的。此書的標題無人理解,便乾脆以伏尼契,一位波蘭籍科學家兼藏書家的名字命名,他同時是小說《牛虻》的作者的丈夫。1912年,伏尼契在羅馬附近一所耶穌會大學圖書館找到了這份手稿,它在消失將近250年後重見天日。此書大約出現於15世紀末期,曾被神聖羅馬帝國皇帝魯道夫二世以相當於今天8萬美元的價錢收購。
反對這個說法的人士則主張,伏尼契文如此複雜,不可能毫無意義。一個中世紀的騙子怎麼可能偽造出230頁的文字,而且結構和文字的分佈又有許多精微的規律呢?但有人發現,只要利用一種16世紀常見的簡單編碼工具,就可仿造出許多伏尼契文的特徵。用這種方式製作出來的文字看起來相當接近伏尼契文,但是完全沒有意義,也沒有任何隱含的訊息。這個發現並不能證明伏尼契手稿是個騙局,但確實支持了一個存在已久的說法:英國冒險家凱利假造這份文件,用來詐騙魯道夫二世。據說這個皇帝總共花了600達卡特金幣(相當於今天的八萬美元)買下這份手稿。
不過可能更重要的是,分析伏尼契手稿之謎所用的方法,也可應用在其它領域的難題上。要解決這個古老謎團,必須旁及好幾個領域的專門知識,包括密碼學、語言學和中世紀歷史等。我研究的主題是「專家推理」,也就是解決複雜問題的過程,因此我將研究伏尼契手稿視為一次非正式測試,試驗一下這種方法是否能找出新途徑以解決懸宕許久的科學問題。其中最重要的步驟是列出相關領域中專門知識的長處與短處。

其他觀點


於是,在各種猜測中,不可避免地出現了這種聲音:“手稿根本就是偽造的,那只是一堆毫無意義的符號。
”如何鑒別一組符號是否包含信息,是知識研究中最令人頭疼的問題之一,儘管如此,還是能找到鑒別的辦法。
密碼學家通常依賴對語言的統計分析。在真正的密碼中,字母被符號替代,某些字母組成的“對”應該比其他的“對”更常見,比如在英語中,“th”和“is”是很常見的組合,而“q”後面幾乎總是跟著“u”。反過來,有些字母對則相對罕見,如“c”和“d”很常見,但是“cd”組合就很難看到。科學研究認為,這些原理提供了一種鑒別密碼真偽的方法。
通過對伏尼契手稿的詳細審查,密碼學家發現它具備與真實語言非常相似的統計模式。字母或其他符號在文本中的重複程度可用一個統計量“熵”來表示。手稿中的每個字母對應的熵與波利尼西亞語大致吻合。人類的大腦不可能創造出真正的隨機性,而伏尼契密碼比任何已知的歐洲語言更少隨機性,比大多數自然語言更有規則。
威廉姆·龐德斯通曾經有兩部著作獲得普利策獎提名,他在“令人眼花繚亂”的力作《推理的迷宮》一書中認為,這是支持伏尼契手稿是真正的密碼的有力證據,他很難相信,“一部贗品能做得如此精密,竟然騙過了語言統計學”。
在種種加密方案中,有一種因羅馬皇帝使用而得名的“愷撒密碼”,即一個字母始終用某個字母替換。破譯者可以通過識別出最常見的幾個字母而輕易破解。愷撒密碼共有26種,如果在一份密文中對每一個字母應用不同的愷撒密碼,就可以設計出不可破解的密碼,即“一次性便箋密碼”。
龐德斯通假設《伏尼契手稿》原文是一種基於羅馬字母的歐洲語言,其中每個符號對應一個字母,加密方法就是一次性便箋密碼。在無法得到“密鑰”的情況下,他試著用“暴力法”來檢驗手稿可能採用的所有加密方案。結果行不通。因為,對於每一個字母都需要檢驗26種可能性,如果樣本包括100個符號,則需要考慮26的100次方種可能性,這個任務無法完成。
更複雜的情況在於,也許伏尼契手稿還採用了除愷撒密碼之外的加密方式,因為有很多辦法可以把字母轉化成符號。

最新發現


英國貝德福德大學應用語言學教授Stephen Bax近期聲稱,他成功破譯了部分《伏尼契手稿(Voynich manuscript)》,成為歷史上第一位破譯該手稿的語言學家。在此之前,唯一能破解這600年以來最難的一本書的人只有印第安納·瓊斯(電影《奪寶奇兵》中主人公)。
這本聞名世界的手稿中有很多奇株異草、星體和神秘人像的插圖,並著有大量未知文字。它被視為世界上最神秘的書籍。
《印第安納·瓊斯》三部曲中,印第安納破解了《伏尼契手稿》,並利用書中信息找到了“賢者之石”。但在現實世界中,這本15世紀的神秘書籍難倒了一眾學者,密碼員和破譯專家絞盡腦汁都無法解開手稿中任何一個詞,甚至是一個字元。
Bax教授參考了中世紀各類手稿,並運用閃米特語系中的阿拉伯語來破譯《伏尼契手稿》的神秘含義。他結合嚴謹的語言分析,逐個字元推敲,現在已經破譯了17個象徵符號,揭示出了10個單詞的意思。Bax教授聲稱,他破譯出了包括杜松(juniper)、芫荽、鹿食草 (hellebore)、黑枯茗(Nigella Sativa)、棉花(cotton)和藏紅花(saffron)等植物名詞,以及希臘神話中半人馬的名字喀戎(Chiron)。
Bax教授說:“我不認為這本書來自外星球或是什麼魔法師的傑作諸如此類的。我想它本質上就是一本關於大自然的書,不然怎麼會畫滿了植物和各類星體。我破譯的第一個單詞是‘金牛座(Taurus)’,單詞旁邊有一幅七星圖。這七星圖畫的是金牛座里的一個叫昂宿星的星團。人們很早就猜到‘金牛座’這個詞,我再結合有關手稿方面的知識,幾乎可以確定它就是‘金牛座’;以此類推又發現了17處可解的地方,得出了10個單詞。我用以阿拉伯文和其他語言文字記載的中世紀藥草手稿來破解那些圖形,它們中很多都指向植物類,而且會是你意想不到的種類。我覺得,這手稿源自亞洲,因為如果是歐洲的,那我們肯定能窺解一二。手稿上的語言至今仍未被鑒定出來,它是獨一無二的,寫法很淘氣,像來自中土世界。”
他補充道:“我做這一切完全是出於對語言和語言學的喜愛,它對我而言是一個終極挑戰。我把目前的研究結果報告出來是為了鼓勵其他語言學家能和我一起用這個方法破譯整本手稿。此去任重道遠,但繼續走下去我們一定會弄明白手稿作者到底想告訴我們些什麼東西。而我的研究結果也已明確肯定,《伏尼契手稿》並不像某些人所說的只是一場惡作劇。”
用破譯“金牛座”的方法,Bax教授還解得了一個新詞“kantairon”,這是中世紀知名藥草矢車菊(Centaury)的另一個叫法。
雖然Bax教授破解的只是手稿中很小的一部分,但在破譯界和語言學界都引起了極大迴響,他的研究發現對將來全面破解整本《伏尼契手稿》的工作至關重要。
據悉,《伏尼契手稿》最初由一名叫Wilfred Voynich的書商於1912年在一個義大利修道院中發現。早前研究伏尼契手稿的學者推測其發源地是歐洲,但美國特拉華州立大學植物學教授Arthur
Tucker在2月發表言論,否認了這一推測。他強調,書中303種植物中至少有37種生長於中美洲,也就是現在的墨西哥一帶。手稿寫於15至16世紀,那麼很有可能使用的是納瓦特族(墨西哥南部和中美洲印第安各族)的納瓦特語。
來自University of Alberta的Greg Kondrak和他的研究生Bradley Hauer宣稱,運用人工智慧,他們已經找到了破譯“伏尼契手稿”的線索。隨著科技的發展,人工智慧已被運用到破解伏尼契手稿中,並成功破解部分加密信息。相信人工智慧會帶來更多的發現。

相關爭議


有人認為伏尼契手稿只是文字顯得很複雜的騙局。但另一方面質疑如果是騙局,隨之而來的問題:作者為什麼會採用這樣一個複雜而艱苦的騙局,如果沒有一個預期的觀眾(即創作者的同時代人)?但有人認為,當初這手稿疑似被神聖羅馬帝國皇帝魯道夫二世買下,顯然作者是以精美的圖,運用卡登格填上文字來騙錢。