語種

語種

在研究了世界上一些主要語言以後,語言學家也象生物學家那樣,把世界上的語言按相似程度分為語系語族語支和語種。

語系 代表語言 佔世界語言百分比

印-歐 英語法語俄語烿こ語波斯語 48%

漢-藏 漢語藏語泰語緬甸語 24%

尼日-剛果 斯瓦希里語 6%

亞-非 阿拉伯語希伯來語 5%

馬來亞-波利尼西亞印度尼西亞語泿斚罧驫語 5%

德拉維達 泰米爾語 3%

阿爾泰 土耳其語駿古語哈薩克語 2%

除了上面這些“可以歸類的”語言以外,還有幾種所謂的“獨立語言”:日語(2%),朝鮮語(1%)和越南語(1%)。

世界上有多少種語言。一說七千多種,一說五千多種,漢語是聯合國指定的六種工作語言之一,另外五種語言是英語、俄語、阿拉伯語、法語和西班牙語。

分類


Abkhaz阿布哈茲語
阿布哈茲語
阿布哈茲語
Achinese亞齊語
Acoli 阿喬利語
Adangme 阿當梅語
Afar
Afrihili(Aritifical language) 阿弗里希利語
Afrikaans 南非所用之荷蘭語(阿非利卡語)
Afro Asiatic(Other) 其它亞非語系
Akan 阿坎語
Akkadian阿卡德語
Albanian阿爾巴尼亞語
Aleut阿留申群島之土語
Algonquian(Other) 其它阿爾貢語系
Altaic(Other) 其它阿爾泰語系
Amharic 阿比尼亞宮廷貴族的語言(阿姆哈拉語,一種南族語)
Apache languages阿帕切語
Arabic阿拉伯語
Aramaic阿拉米語
Arapaho 阿拉帕霍語
Arawak 阿拉瓦克語
亞美尼亞語字母表
亞美尼亞語字母表
Armenian亞美尼亞語
Artificial(Other) 其它人工語言
Assamese阿薩姆語
Athapascan(Other) 其它阿撒巴斯卡語系
Australian languages
亞塞拜然語
Balinese巴里語
Baltic(Other)波羅的海地區之語言
Baluchi俾路支語
Bambara 班巴拉語
Bamileke languages 巴米累克語
Banda班達語
Bantu(Other)
Basa巴薩語
Bashkir巴什基爾語
Basque巴斯克語
Batak
Beja 別札語
Belarusian白俄羅斯語
Bemba 別姆巴語
Bengali 孟加拉語
Berber(Other) 北非&回教土族之語言
Bhojpuri博傑普爾語
Bihari
Bikol
Bini
Bislama
Braj布拉傑語
Breton布爾吞語
Buginese 布吉語
Bulgarian保加利亞語
Buriat
Burmese緬甸語
Caddo 卡多語
Carib 巴勒比語
Catalan 加泰隆語
Caucasian(Other) 其它高加索語系
Cebuano宿務語
Celtic(Other) 其它凱爾特語系
Central American Indian(Other) 其它中美印第安語系
Chagatai 查加語
Chamic languages
Chamorro查莫羅語
Chechen車臣語
車臣語
車臣語
Cherokee 徹羅基語
Cheyenne 夏延語(切延內語)
Chibcha 契布卡語
Chinese漢語
Chinook Jargon 契努克語
Chipewyan
Choctaw 喬克托語
Czech 捷克語
Dakota 達科他語
Danish丹麥語
丹麥語字母表
丹麥語字母表
Dayak
Delaware 特拉瓦印第安人語
Dinka丁卡語
Divehi
衣索比亞語
Ewe 幽語
Ewondo
Fang 芳格語
Fanti芳蒂語
Faroese法羅語
Fijian斐濟語
Finnish芬蘭語
Finno-Ugrian(Other) 芬匈語(其它)
German,MiddleHigh(ca.3050-3500) 中古高地德語
German,OldHigh(ca.750-3050) 古代高地德語
Germanic(Other) 其它德語語系
Gilbertese吉爾伯特斯語
Gondi 崗德語
Gorontalo
Gothic哥達語
Grebo 格列博語
Greek,Ancient(to 3453)古希臘語
Greek,Modern(3453-) 近代希臘語
Guarani瓜拉尼語
Gwich’in
Haida 海達語
Hausa豪薩語
Hawaiian夏威夷語
Hebrew希伯來語
希伯來語
希伯來語
Herero 赫雷羅語
Hiligaynon 希利蓋農語
Himachali 赫馬查利語
Hindi 北印度語(印地語)
印地語
印地語
Hiri Motu
Hittite
Hmong
Hnpa (胡帕語) 印度語(其它)
Indo-European(Other) 其它印歐語系
Indonesian印尼語
Interligua(International Auxiliary Language Association)國際輔助語
Interlingue
Inuktitut
Inupiaq
Iranian(Other) 其它伊朗語系
Irish愛爾蘭語
Irish(Old) to 3300
Japanese日語
日語
日語
Javanese 爪哇語
Judeo-Arabic 猶太&阿拉伯語系
Judeo-Persian 猶太&波斯語系
Kabyle卡比爾語
Kachin 卡琴語
Kalatdlisut
Kamba 卡姆巴語
Kannada 坎納達語
Kinyarwanda盧安達語
Kongo剛果語
Konkani 剛卡尼語
Korean 朝語
Kpelle 克佩列語
Kru 克魯語
Kuanyama
Kumyk
Kurdish庫爾德語
Kurukh 庫魯克語
Kusaie
Kutenai 庫特內語
Kyrgyz 柯爾克孜語
Ladino拉迪諾語
Lahndi 拉亨達語
Lamba 蘭巴語
Lao 寮國語
Latin 拉丁語
Latvian 拉脫維亞語
Letzeburgesch
Lezgian
Makasar望加錫語
Malagasy馬拉加斯語
Malay 馬來語
Malayalam 德威拉土語之一(馬拉維拉姆語)
Maltese馬爾他語
Mandar
Mandingo 曼丁哥語
Manipuri曼尼普里
Manobolanguages馬諾博污
Manx 人島語
Maori 毛利語
Mapuche
Marathi 馬拉蒂語
Mari
Marshall馬歇爾語
Marwari 馬爾尼里語
Masai 薩伊語
Mayan Languages瑪雅語系
Nahuatl
Nauru
Northern Sotho 北索托語
Norwegian 挪威語
Nubian languages努比亞語
Nyamwezi 尼亞姆韋齊語
Nyanja 尼昂加語
Nyankole
Nyoro 尼約羅語族
Nzima
Occitan(post-3500)
Ojibwa 北美印第安人&大種族之語(奧季布瓦語)
Old Norse
Old Persian(ca.600-400B.C.)
Oriya 奧里亞語
Papuan-Australian(Other) 其它巴布亞澳洲語系
Persian波斯語
Philippine(Other) 其它菲律賓語系
Phoenician
Polish 波蘭語
Ponape 波納佩語
Quechua蓋丘亞語
Raeto-Romance 羅曼斯方言
Rajasthani 拉賈斯坦語
Rapanui
Rarotongan 拉羅湯加語
Santali
Sardinian
Sasak
Scots蘇格蘭語
Selkup塞爾庫普語
Semitic(Other) 其它閃族語系
Serbo-Croatian(Cyrillic)塞爾維亞克羅埃西亞語(基里爾字母之一)
Serbo-Croatian(Roman) 塞爾維亞克羅埃西亞語(羅馬字母)
Serer 謝列爾語 srr
Shan 撣語
Shona 紹納語
Sorbian languages 索布諸語言(西斯拉夫諸語言和方言)
Sotho 索托語
South American Indian(Other)其它南美印第安語系
Spanish 西班牙語
Tatar塔塔爾語
Telugu 泰盧固語
Temne提姆語
Terena 泰雷諾語
Tetum
Thai 泰語
Tibetan 藏語
Tigre提格雷語
Turkish 土耳其語
Turkish,Ottoman 奧托曼土耳其語
Turkmen土庫曼語
Ukrainian烏克蘭語
Umbundu 萊都(姆崩杜語)
Undetermined 未定語種
Urdu 印度斯坦回教徒所通用之一種語言(烏爾都語)
Uzbek烏茲別克語
Vai 瓦伊語
Venda 文達語
Vietnamese 越南語
Volapuk
Votic 沃提克語
Wakashan languages
Walamo 瓦拉莫語
Warav
Washo 瓦紹語
Welsh威爾斯語
Wolof 沃洛夫語
Xhosa 科薩語
Yakut
Yao 瑤族語
Yap 雅浦語
Yiddish 依地語
Yoruba 約魯巴語
Yupik languages
Zande
Zapotec 薩波蒂克語
Zenaga 澤納加語
Zhuang
Zulu 祖魯語
Zuni 祖尼語

語言分類


有些語言則只為幾千乃至幾百人使用,如美洲的土著印第安語,中國的鄂倫春語、赫哲語

分類標準

一是按結構分類,即以語言結構的特點來進行分類。
⒈:辭彙附著型語言。這種語言的詞用在句子里時,詞形不表示語法關係的形式,必須用其他辭彙附著句子里,才能表達語法關係。如漢語中的時間,必須加表時間的辭彙才能表達。
⒉ 字母附著型語言。這種語言的主要特點是靠詞尾,前後綴(用一定的字母組合)等來產生語法形式,表示各種語言關係。例如英語,俄語中詞的性,數,格,位的變化都是靠詞尾和前後綴來表現的。印歐語系的語種,大多屬於這一類型。
3. 混合型:以上兩者兼有之。如日語中的主語,狀語,賓語分別用字母“が,に,を”表示,而進行和已然時態則用辭彙”ぁります, ぁりますした”表示。
二是譜系分類。譜系分類是根據語言的歷史淵源,地理位置,親屬關係,把世界上的語言分為若干語系,語系以內再分為若干語族,語族以下再分為若干語支。

分類方法

1.中國北京大學分類法
中國北京大學中文系教授徐通鏘,胡吉成將世界語言分類為13個語系,45個語族。這13個語系是:漢藏語系、印歐語系、高加索語系,烏拉爾語系阿爾泰語系、達羅毗荼語系、南亞語系南島語系、閃--含語系、尼日—科爾多凡語系,尼羅---撒哈拉語系,科依桑語系,北美印第安語系。
2.英國Simon大學遺傳學分類法
(1)歐亞語系,包括漢藏語系、印歐語系。
(2).太平洋和非洲語系,包括。除歐亞語系,南北美洲以外其他各國的語言。
(3).北美語系:北美洲土著印第安語言。
(4).南美語系:南美洲土著印第安語言。
3. 澳大利亞國家標準語言分類法
北歐語系,5個語族,16種語支
南歐語系,5個語族,16種語支
東歐語系,7個語族,25種語支
西南亞和北非語系,3個語族,21種語支
南亞語系,5個語族,16種語支
東南亞語系, 3個語族,23種語
東亞語系,4個語族,15種語支
澳洲土語語系,8個語族,56種語支
其他語系,7個語族,41種語支
4. 美國麻薩諸賽洲理工學院(麻理工學院)分類(完全按地區)
非洲語系:北非語族,南非語族,東非語族,西非語族
亞洲語系:北亞語族,南亞語族,東亞語族,西亞語族,中亞語族,東南亞語族
澳太語系:澳大利亞及太平洋諸島國。
北美語系:北美洲各國語言,包括土著印第安語言。
南美語系:南美洲各國語言,包括土著印第安語言。
歐洲語系:日耳曼語族,包括英語、德語、荷蘭語、斯堪的納維亞半島各主要語言。拉丁語族,包括法語、義大利語、西班牙語、葡萄牙語和羅馬尼亞語等。斯拉夫語族有俄語、保加利亞語、波蘭語等。波羅的海語族包括拉脫維亞語和立陶宛語等。
上述分類方法都有一個共同的缺點,就是都沒有將人造國際語列入分類中。在當今世界,人造國際語已經如此普及的今天,這實在是一憾事。
綜觀上述,比較合理的分類方法應該是:
一. 印歐語系
印歐語系 是最大的語系,下分日耳曼、拉丁、斯拉夫、波羅的海,印度、伊朗、等語族。世界上除了亞洲(不含南亞各國)外,各大洲大部分國家都採用印歐語系的語言作為母語或官方語言。使用人數大約40億,佔世界人口的70%。
印歐語系可分為:
拉丁語族:包括法語、義大利語、西班牙語、葡萄牙語和羅馬尼亞語等。
日耳曼語族:包括英語、德語、荷蘭語、斯堪的納維亞半島各主要語言。
斯拉夫語族:有俄語、保加利亞語、波蘭語,塞爾維亞語等。
波羅的海語族包括拉脫維亞語和立陶宛語等。
印度語族包括梵語、印地語、巴利語,達羅毗荼語支(印度南部的語言都屬於這一語支)等。
伊朗語族包括波斯語、阿富汗語等。
高加索語族 這一語族的語言分佈在高加索一帶,主要的語言有喬治亞語、車臣語等。
烏拉爾語族 下分芬蘭語支和烏戈爾語支。前者包括芬蘭語、愛沙尼亞語等,後者包括匈牙利語、曼西語等。
二:. 漢藏語系
漢藏語系是僅次於印歐語系的第二大語種。使用人數大約15億。下分漢語和藏緬、壯侗、苗瑤等語族,包括漢語、藏語、緬甸語、克倫語、壯語、苗語、瑤語等。還包括阿爾泰各語族,如西阿爾泰語族、東阿爾泰語族。前者包括突闕諸語言以及前蘇聯境內的楚瓦什語,後者包括蒙古語以及前蘇聯境內的埃文基語
三:非太語系:
包括除歐亞語系、南北美洲以外其他各國的語言。非洲及太平洋諸國採用這種語言。
尼羅—撒哈拉語族:主要是非洲北部及西部各國語言,
尼日—剛果語族:主要是非洲中部各國語言,如尼日語,剛果語,斯瓦西里語等。
科依桑語族:主要是非洲南部及東部各國語言,主要有霍屯督語(納米比亞),布須曼語(南非等),散達維語(坦尚尼亞等)。
閃-含語族(閃米特-含米特語族)。主要應用於中東地區。下分閃語族和含語族。前者包括希伯來語、阿拉伯語等,後者包括古埃及語、豪薩語等。
南島語族:主要有東南亞及太平洋各島國語言,如印度尼西亞語,馬來語,爪哇語,斐濟語,毛利語等。
南北美洲土著印第安語言。如瑪雅語,愛斯基摩—阿留申語等。
澳大利亞洲土語語言。

語言


印歐語系是世界上最大的語系,覆蓋了幾乎所有的歐洲鮄洲,和亞洲澳洲的很大一部分菿包括兩種偉大的古典語言:古希臘語和拉丁語;包括象英語德語,菏蘭語(在比利時也叫佛蘭芒語,Flemish)和瑞典語一類的日耳曼語族;包括象法語,義大利語和西班牙語一類的羅曼語族;包括象俄語,波蘭語,捷克語和塞爾維亞-克羅埃西亞語一類的斯拉夫語族;包括象威爾士語和蓋爾語(Gaelic,在蘇格蘭和愛爾蘭)這樣的塞爾特(Celtic)語族;包括巴爾的(Baltic)諸語言;包括伊朗的國語波斯語;包括諸如印地語忿加拉語一類的印地語言;等等
原始的印歐人生活在什麼年代?是從何處“發跡”的?
在找不到原始印歐人留下的任何“書面材料”,因為人類使用語言的歷史遠比使用文字的歷史久遠所以,最好的辦法就是分析他們的語言我們可以假定如果一個詞在大多數印歐語言中都很相似,那就是一個他們已有的概念;反之就可以認為那是一個後來才知道的概念:這就是語言學重現“化石語言”所用的方法
通過重建古代印歐人的語言,我們大約可以了解到:原始的印歐人生活在寒冷的北方森林中一個不靠近水的地方,他們飼養的家畜有馬,牛,羊和狗,他們知道的野生動物有狼和熊,他們知道的金屬可能只有銅許多人認為馬和戰車使他們在征戰中能取得很大優勢從而擴展到後來的遼闊地域(玩過civilization的朋友們知道horse和chariot在古代戰爭中的作用:-)
一般認為原始印歐文明起自於公元前三千年,也就是五千年以前的東歐某地,大約在公元前二千五百年它分裂了,人們離開故鄉分好幾路向四面八方遷移盿中一路到了希臘,另一路到了義大利(這兩路分別是古希臘和古羅馬文化的起源)另一路穿過中歐一直到達不列顛諸島(他們是蘇格蘭人,愛爾蘭人和威爾士人的祖先)還有一路北上到了俄國,同時又有一路跨過伊朗,阿富汗最終到了印度他們每到一處,就征服或同化當地的土著,把自己的語言傳播到那裡鏗該說他們是一個出色的民族
許多語言可能是從一個祖先那兒演變出來的,這想法最早是在1786年提出來的,儘管早在十六世紀有人就注意到了梵語和義大利語之間的相似性到了1818年,有五十多種語言歸到了印歐語系中,然後在1854年,人們把獨特的阿爾巴尼亞語也歸了進來,1875年又加上了亞美尼亞語苿今在歐洲,只有芬蘭語匈牙利語土耳其語巴斯克語(在西班牙和法國交界處)
和前蘇聯境內的幾種語言不屬於印歐語系
在亞洲,印歐語言出現在伊朗阿富汗巴基斯坦烿度和孟加拉等國家值得注意的是,雖然在印度,印地語(Hindi)是最大的語言,但是操非印地語的當地原住民勢力也很強大烿度有一百五十多種語言,但講任何一種語言的人都不超過百分之三十所以它在1947年獨立時不得不同時採用印地語和英語作為官方語言——一半以上的印度人根本就不懂印地語嘛在大約公元前一千年印歐人入侵以前,當地原住民所操的德拉維達語系(如泰米爾語)
和蒙達語系,如今在印度中埿部人口中仍占很大的比例在巴基斯坦和孟加拉國大部分人講印歐語言他們都能在一定程度上聽懂印地語,但互相之間卻很難聽懂一個學法律的孟加拉朋友告訴我,他認為二十年前巴忿分裂成兩國,除了地理上的隔閡外,語言上的隔閡也是一個重要因素
印歐語言之間究竟有多象?印歐語言與非印歐語言的差別有多大?看看幾個“基本辭彙”之間的比較:
英語month mother new nose three威爾士語mis mam newydd nos tri德語Monat Mutter neu Nase drei瑞典語ma^nad moder ny na"sa tre法語mois me`re nouveau nez trois西班牙語mes madre nuevo nariz tres義大利語mese madre nuovo notte tre俄語mesyats mat' novy nos tri希臘語men meter neos rhis treis_ _波斯語mah madar nau bini se_ _梵語mas matar nava nas trayas芬蘭語kuukausi a"iti uusi nena" kolme匈牙利語ho'nap anya u'j orr ha'rom土耳其語ay anne yeni burun u"c,

發展


作為當今世界事實上的國際社交語言,它取得的成功是史無前例的從使用它的人口來說,以英語為母語的人數僅次於漢語而居世界第二位,大約有四億多人然而以英語作為第二語言或者在一定程度上使用英語的人數,要遠比這多得多,可以說分佈在世界的各個角落各個民族,在這一點上漢語是望塵莫及的。

英倫三島

的第一批印歐居民是塞爾特人原先島上可能還有更早的居民,但是人煙稀少,所以沒有留下多少遺跡前文提到,塞爾特人是古印歐人的一支,大約在四千五百年前離開他們在東歐的故鄉向西遷移,在公元前一千年時(相當於我國商朝末年翿梉初年),他們成了德國南部阿爾卑斯山北麓的一個強大民族在公元前五百年左右(相當於我國春秋時期),他們開始向西遷移,後來到了英倫諸島這就是印歐人的第一次“入侵”

印歐人

的第二次入侵是在公元五世紀中葉,德國和丹麥交界處有兩個部落,一個是石勒蘇益格(Schleswig)的盎格魯(Angles),另一個是霍爾施坦因(Holstein)的薩克森(Saxon)石勒蘇益格/霍爾施坦因現在是德國最北面的兩個州,是第一次世界大戰時德國從丹麥那裡“取得”的這兩個部落從那裡跨過北海,佔據了英格蘭,原來的塞爾特人很快地後退到威爾士愛爾蘭和蘇格蘭高地English一詞就出自Angles,原意為“角落”,意即他們來自歐洲大陸的一角在古英語中Angle寫作Engle,他們的語言叫做Englisc(在古英語中“sc”讀如“sh”,如“sceap”——“sheep”)竿便說一句,“塞爾特”(Celt)中的c可以讀如s或k,所以也叫“凱爾特”,美國人中有許多來自蘇格蘭和愛爾蘭,所謂的“美國腔”可能是凱爾特口音波士頓不是有個著名的球隊叫“凱爾特人隊”嘛

諾曼人

古英語一直發展到公元1066年法國的諾曼人入侵在此以前,由於受北歐人和羅馬人的影響,許多斯堪地那維亞辭彙和拉丁辭彙溶了進來前者如egg,cake,skin,leg,window,husband,sky,fellow,skill,anger,flat,ugly,odd,get,give,take,raise,call,die,they,their,them;後者如street,kitchen,kettle,cup,cheese,wine廿爾特語的遺跡大多留在地名中,如Thames,Kent,Dover
諾曼人的入侵為英語帶來了大量的法語辭彙,這使得現代英語中存現大量的同義/近義詞:shut/close,answer/reply,smell/odor,yearly/annual,ask/demand,room/chamber,wish/desire,might/power(英語詞/法語詞)有一個有趣的現象是產肉的動物多是英語詞,如ox,cow,calf,sheep,swine,deer,而它們的肉則是法語詞,如beef,veal,mutton,pork,bacon,venison大概持法語的多為貴族統治者,只注意他們餐桌上的肉,並不在意牲畜們叫什麼
另外在已有的英語/斯堪地那維亞語同義詞基礎上,如英語的wrath和斯堪地那維亞語的anger之外,法語又加了個ire連我們漢語也貢獻了幾個詞:kowtow(叩頭),typhoon(颱風),sampan(舢板),kaolin(高嶺土),tea(閩方言),shanghai(不是地名:-))
這些外來語使英語成為一個表達力豐富的語言儘管溶入了如此眾多的“外來語”,古英語仍然構成了它的核心——不到五千的古英語單詞一直保持到了今天在此期間英語逐漸向高層發展,1399年繼承王位的亨利四世是第一個以英語為母語的英國國王在十四世紀快要結束的時候,喬叟(Chaucer)完成了『坎特伯雷的傳說』(Canterbury Tales),以倫敦方言為代表的現代英語終於開始出現:一個來自當年“角落”的語言

漢藏語系


概述

漢藏語系裡有一個“大傢伙”,不用猜就知道菿恛漢藏語系總人口的85%以上不過,對於非印歐語言的語言學研究都不如印歐語系那樣深入,它的起源發展演變等都有許多問題有待解決
漢藏語系分四個語族:漢語自成一家;藏-緬語族,包括藏語和緬甸語這兩大語種,以及彝裿僳納西拉祜濿蝦撘京等上百個小語種;泰-老語族,包括泰語和寮國語這兩個國語,以及壯布依響等幾個小語種(壯語不應算小語種!有一千多萬人講壯語,比一些小的語系還大,他們不是還有自己的自治區嘛);還有一個苗-瑤語族,由苗語和瑤語組成另外,不少人認為越南語與漢語有遠親關係,事實上越南語有一半的詞來源於漢語,但是它們的關係仍有待進一步研究

分佈

講漢藏語言的人除了在中國以外,還分佈在緬甸烿度尼泊爾泰國寮國等國,以及在東南亞和世界各地的華人中總之,持漢藏語言的各民族中,漢族生活在最北面
漢語是論人口世界上最大的語言,有十多億人以漢語為母語:這包括在台灣的二千萬泿斚罧驫葎鑶繎萬泰國的五百萬駿港的五百萬新加坡的二百萬烿度尼西亞的一百萬諿葓v繎萬等漢語是聯合國1945年成立時的五種工作語言之一(1974年又加上了阿拉伯語)

主要方言

漢語有七種主要的方言:北方方言約佔總人口的四分之三,所覆蓋的地域包括中國的東北仿北翿北燿東河南囿北和安徽忿蘇的長江以北部分四川釿坎豓貴州的漢族人聚居區,在另外還有一些北方方言的“孤島”如桂柳話,在福建翿罞貉海南;吳方言,通行於江蘇的長江以南部分姿彭豬上海市,人口有七千萬,是第二大方言;粵方言,主要流行於廣東翿罞貉睔外華人中間,約有六千萬人;閩方言,通行於福建台灣和東南亞諸國,約有六千萬人,其中情形十分複雜,到了互不通行的程度,可能是漢人在秦漢時代南侵時與當地的語言交互的結果;湘方言通行於湖南;贛方言通行於江西,這兩種方言的特徵不太突出,受周圍方言的影響較大;還有客家話,主要分佈於廣東翿罞撉迿建和台灣這些“方言”之間差別常常是很大——比如北京人聽廣州人講話,決不比英國人聽法國人講話輕鬆,台灣人去聽陝西話,也會聽得一頭霧水是什麼理由語言學仍把這些方言統統歸為一種語言?除了長期以來的統一民族統一文化和統一國家這些因素以外,還有一個重要的原因是文字——漢字

歷史發展

從商朝的甲古文開始,漢字有三千多年的連續歷史,三千多年來漢字的字形埿義的變化都是連續的與大多數其它語言不同的是,漢字的發展經歷了一條象形—表意—形聲的途徑這條道路產生了兩個主要效應:第一,隨著文明的不斷發展,語言所要表達的概念不斷增加,使得漢字擁有了一個數量龐大的字符集(雖然現代漢語已經不用增加字元來表達新的概念,而是創造新詞,這在一定程度上減少了使用的字數)漢字的龐大的字符集使它顯得非常複雜:難學難記難用;第二,歷史上的漢字作為表意文字(ideograph),文字與語音沒有直接關係,無論用哪種語言或方言去讀,意義沒有變化這是幾千年來各種口語分化交熔變遷,而漢字一直作為一種統一的文字被所有人認同的原因這一優勢甚至體現在當它被別的語言借用的時候:哪怕不懂日語的人也能讀懂一半意思吧漢字使操不同口語的人互相交流成為可能,而隔膜是統一的主要障礙
後來,隨著漢字的演變,漢字已不再是純粹的表意文字,許慎『說文解字』中的9353字裡面,“形聲字”佔了80%以上,“會意字”不到20%,而甲骨文中形聲字僅佔20%多秿別是近代以來多音詞的比例急劇上升,漢字已向表音文字方向發展(關於“形聲字”“會意字”,後面還要提到)
現代漢語的文字仍有幾萬字之多,但是使用頻率極不平衡滿北京語言學院1985年的統計結果,最常出現的前十個字及其出現頻率為:
的 4.16% (你每說二十五個字就要說一個!)
一 1.84%了 1.71%是 1.52%不 1.37%我 1.28%在 1.08%有 0.98%人 0.97%這 0.93%
累計 15.85%
前100字的累計字頻已達47.34%,500字到了79.76%,2000字覆蓋了98.07%,如果你認識4000字(就象我一樣),你讀一萬個字只有四個不認得(當然讀我寫的東西再多你也不會有不認得的字,因為我認的字和你一樣多)
語言學院還統計了詞:共計出31159個不同的詞,其中單音節詞(一個字的)佔12.2%,雙音節詞73.6%,三音節詞7.6%,四音節詞6.4%五以上的佔0.2%,平均詞長2.09前100詞的累計頻率為41.7%,2000詞為82.2%,9000詞為95.85%不同漢字的構詞能力(與別的字組成新詞的能力)也不一樣,最多的是“子”字,構詞668個

中國語言

在中國境內的語言是多種多樣的,
北方的語言多屬阿爾泰語系,有屬阿爾泰語系突厥語族的維吾爾語哈薩克語烏孜別克語柯爾克孜語哿員爾語(韃靼語)鋿拉語(青海境內的撒拉族);阿爾泰語系通古斯語族的滿語錫伯語鄂溫克語和鄂倫春語;阿爾泰語系蒙古語族的蒙古語達斡爾語東鄉語和土語(青海土族的語言);還有印歐語系的俄語和伊朗語族的塔吉克語等等地方的語言多屬漢藏語系,除了上文提到的漢-藏語系諸語言外,尚有屬南亞語系孟-高棉語族的佤語和德昂語布朗語,以及屬南亞語系印度尼西亞語族的高山語(台灣高山族)
中國境內文字的種類同樣多種多樣擿蚖壇用(或部分使用)漢字的語言以外,還有許多使用羅馬拼音文字,如壯文這其中又有不少是原本沒有文字的,“新中國成立后,當地人民政府依照本民族人民的意願,為他們創造了以拼音字母為基礎的文字”還有使用梵語字母的如藏文,使用阿拉伯語字母的如維吾爾文,使用“十三世紀維吾爾文”的蒙文滿文錫伯文(維吾爾族后改用阿拉伯文),有些民族使用自己的表意文字,如彝文還有用象形文字的納西文(已經不用了)至今沒有自己文字的民族都借用了就近的大語種文字
還有就是諺語,但都是用漢字,例如 閩南語,粵語等,還有就是閩南語,粵語等,每個地方都有不同的細微的發音。

朝鮮文

朝鮮族用的朝鮮文是唯一東方自己發明的“純粹”拼音字母說它是“純粹”,因為它有表達母音和輔音的完整音素集合音素(phone)是人能分辨的最小語音單位與此相對的是日語的假名,雖然也是拼音文字,但是每個假名表達的是整個音節(syllable)而不是音素朝鮮語在語法結構上最象日語,但是它們的辭彙並不相似,所以它們的關係仍有待於進一步研究另一方面,朝鮮語又從漢語借走好多辭彙,但在語法結構上又非常不一樣有人認為朝鮮最早的居民是一萬年以前從北方移入的通古斯人一部朝鮮文字母發明於十五世紀中葉(相當我國明朝前期),共有二十五個字母——字母在哪兒?
你要是仔細看就可以看出,雖然它們看上去象一個個的“方塊字”,但每個“方塊字”其實是由一些更小的“小零件”組成,這每個“小零件”就是一個字母,它們的種類是有限的,對嗎?他們的字母不象其它拼音文字那樣排成一條線,而是上下左右錯落有致地拼在一個方塊內,非常別緻懿“眼淚”這個詞,它們讀作nunmul(nun意為“眼睛”,mul意為“水”),寫成從左到右兩個“方塊字”:

南亞語系

在亞洲的東南部,不是還有菲律賓泿斚罧驫摎烿度尼西亞等國嗎,他們的語言是什麼樣子的?
他們的語言屬於馬來亞-波利尼西亞語系,又有人把這語系與孟-高棉語系(主要是柬埔寨的高棉語)和印度南部的蒙達語系合稱“南亞語系”這一系語言橫跨了半個地球:東起夏威夷諸島,西達非洲東南的大島“馬達加斯加”(Madagascar),包括了幾乎所有的印度洋和太平洋島嶼(包括密克羅尼西亞鮄拉尼西亞和波利尼西亞諸島,但不包括巴布亞紐幾內亞和澳洲)。
它包括四種國語:馬來西亞語烿度尼西亞語他加祿語(菲律賓語)和馬拉加斯語(馬達加斯加),總人數有二億多珿躡他們的祖先,有人類學家認為是生活在中國大陸東南沿海地區,在公元前二千紀至一千紀之間漢族人開始南侵的同時,他們的航海技術也發展到了一定的水平,開始向海外移居(不知是不是受到了漢族的壓力),台灣高山人可能就是他們的後裔在其後的二千年間,他們遍布了如此眾多的海島,佔據了如此遼闊的海域,這應當算一大奇迹——儘管他們自己可能倒沒意識到有人說,是航海貿易與殖民造就了今日的資本主義,那他們的航海要比西方的“厲害”得多,也早得多,為什麼一點兒也沒有“發達”的意思?
澳大利亞和巴布亞紐幾內亞的語言和上面講到的馬來亞-波利尼西亞語言又有很大不同
所謂澳大利亞語言,當然是指生活在那兒的土著居民,白種人們自然是講英語
今天在澳大利亞的土著人只剩下數萬人,可是他們仍在講數百種語言!對這些語言的研究進行得很不充分,連它們是否屬於一個單一的語系也沒搞清楚由於澳大利亞自人類出現時就已經成為一塊獨立的陸地,所以,所謂的“當地土著”,肯定也是什麼時候從其它地方遷來的澳大利亞本地的哺乳動物都是非常原始的有袋類,離進化到人類還差十萬八千里現代許多人類學家認為當地人是新石器時代某個時候從馬來亞——印度尼西亞渡海而來,可這還沒有找到足夠的語言學方面的證據支持(其它方面可能有證據,我不清楚)今天,許多當地的語言都面臨絕滅,可憐它們作為歷史的遺跡只在英語中留下了象kangaroo,koala等少數幾個辭彙
在巴布亞紐幾內亞的情況與此相似:三百多萬人說著五淿繑種語言,從這不難想到,有些語言肯定只有很少的人使用,有的可能只有一個村子,甚至一個家庭鄰村的人可能互相都聽不懂,許多人尚生活在石器時代所有這些給獨立后的政府提出了很大的難題:不可能找到一種(甚至幾種)當地語言作為官方語言來發號施令所幸的是,在幾百年的殖民統治以後,當地土著居民發明了一種叫“洋涇浜英語”的交流工具,它取得了官方語言的地位

皮欽英語

“洋涇浜”是俗稱,正式的稱呼是皮欽英語(Pidgin English)
“洋涇浜”一詞來自上海原來的一條河,就是現在的延安路叿時在上海英租界也有自己的“洋涇浜英語”,“假洋鬼子”們常說“let me seesee”(讓我看看)或“no can do”(不能做)這樣不倫不類的話所謂皮欽語言就是指一種外來語言被當地人大大地簡化了語法和辭彙以後用作交流工具,這種現象在不少殖民地都有巴布亞紐幾內亞的皮欽英語約有1500個詞和非常簡單的語法,這使它很容易學會而且許多辭彙還是由一些更基本的辭彙組成的複合詞,如“house cook”意為“廚房”,“house sick”意為“醫院”,“house paper”意為“辦公室”等等另外“belong”變成了一個常用詞,僅表示“of”的意思,如“glass belong look-look”意為“鏡子”,“smoke belong ground”意為“灰塵”,“lightbelong cloud”意為“閃電”,“man belonglong-way place”意為“外國人”……但是,你可不要以為憑自己的英語可以去那兒獨闖天下——他們不會聽懂你的英語,你也讀不懂他們的“英語”,因為畢竟語法和辭彙都有許多變化

亞非語系


亞洲的語言還有一個極重要的成員尚未提到,這就是所謂的“亞-非語系”,傳統上叫做“閃米特-含米特語系”,簡稱“閃-含語系”這名字取自聖經中諾亞的兩個兒子,一個叫Shem,一個叫Ham髿-非語言分佈於北非東北非近東中東和中亞的廣闊地域,包括有二億多人口和幾十個國家
然而,亞-非語言之所以重要,原因還不僅限於此那裡不僅是世界上最古老文明的發源地,起源於那裡的拼音文字,更是當今世界上大多數主要文字的鼻祖
亞-非語言中的阿拉伯語人口也佔了將近四分之三盿荑蕘重要的語種還有:以色列的國語希伯來語索馬利亞語翿庉/奈及利亞的主要語言豪薩語,以及非洲北部的一些其它語言
阿拉伯語是將近二十個國家的國語,另外全世界的穆斯林都多少懂幾句阿拉伯語,這使它在1974年成了聯合國的第六種工作語言菿葛坶母系統更是被許多其它語系的語言所採用菿葛蝶坥保留了幾個古代拼音文字的特點:從右到左的書寫,以及只有輔音字母沒有母音字母還有一個現象是一個字母在詞中的位置不同,寫法也不一樣苿鱙恧在用X窗口的電腦,可以試試看把編輯器的字體設置成阿拉伯文的字母,再看看把同一個字母放在詞中間與放在詞尾,形狀是否一樣惿不需要懂得阿拉伯語就能看得出來
阿拉伯文共有二十八個字母,都表示輔音由於它們都寫成草體連書,所以看上去一串串的,好像看不出一個個獨立的字母那母音呢?你可能還注意到在這些彎彎曲曲的連續曲線的上下還有不少小點點和短線條什麼的,那就是母音!
不幸的是,他們阿拉伯人在書寫一般文字時,是省略掉這些母音的,只有在小學課本和給外國人看的讀物上才註上母音舉個例子,要寫“solid”這個詞,他們大概會寫作“dls”(別忘了是從右往左寫),那你就很難猜這是個什麼詞了……
阿拉伯文的古老特點是與近中東文字的起源演變相聯繫的古埃及和“兩河流域”是世界上最先出現文字的地方,也是拼音字母的發源地
大約在五千五百年以前,埃及就出現了文字和書寫的紙草約公元前3100年上下埃及統一,統一后的埃及開始有文字記錄可考(這比我國開始有文字記載早了一千七百年)最早的文字是圖形文字,後來有些文字逐漸變成音節符號和指意符號,其後又有了一音一符的字母,共二十四個所有字母都只標輔音不標母音各種符號組成片語,共有六百多個片語經歷這些發展的古埃及文字,是用字母音符和片語組成的一種複合文字到第八王朝(大約在公元前2200)時期出現了一種草書體,到中王朝(公元前2000-1700年)時草書體已廣泛流行,只有正式文體和銘刻才用象形體
所謂紙草是下埃及產的一種植物,將其莖幹剖為長條后,彼此排齊連成片,然後壓平曬乾成紙這種紙草後來成為古代地中海地區一種通用的紙,希臘人埿汿人以及往後的阿拉伯人都曾用它書寫(不過,這還不能算是“正式的紙”,因為“正式的紙”必須等到三千年後由中國發明:-))
早在五千五百年前差不多與埃及人同時,生活在幼發拉底河與底格里斯河(希臘人稱為Mesopotamia——美索不達米亞,意即“兩河之間的地方”)的蘇美爾人(Sumerian)也有了自己的文字他們最早的文字也是圖形符號,一符一義以後發展為表音符號和指意符號,一起組成片語自從有了表音和指義符號,字元孳乳增繁的傾向減少,到了約四千三百年前,字元減少到了六百以下,其中約有一百個是表示音節的符號,但是沒有單獨表示輔音的符號這種文字用削尖的蘆桿骨棒等刻寫在泥版上,曬乾或烘乾后成為可以長期保存的文書,有一些保存到了至今,並被釋讀成功蘆桿刻成的筆畫,起划粗而深,收划細而淺,形如楔形,因而得名“楔形文字
楔形文字後來成為近東各國外交的通用文字,一直到先進的腓尼基拼音文字的“傳人”阿拉美文(Aramaic)流行以後才逐漸棄而不用阿拉美文在近東各國的通行到了公元七世紀阿拉伯的伊斯蘭文化興盛時,又讓位於阿拉伯文,直到今日
腓尼基拼音文字是怎樣發明的?
腓尼基人在公元前1500年時居住在以色列黎巴嫩一帶叿時埃及和兩河流域的文字早就有一部分發展為音節符號,埃及文字還由此出現標示輔音的二十四個字母但是兩種文字中都有好幾百個字元,埃及文字還保持象形體,結構複雜,使用不便地處使用這兩種文字的人之間的腓尼基人受到它們的共同影響,取埃及文的輔音符號而擯棄其象形體,發明出了二十二個輔音字母從此文字不再為祭司所壟斷,從而避免了瑪雅文化那樣的命運
與此同時的希臘人,正彷徨於早期從埃及學來的象形-表音混合文字中,到了公元前一千年時,腓尼基文字傳入希臘,他們馬上放棄了原有的文字,並且又在此基礎上進一步發明了母音字母,世界上第一套完整的拼音文字終於誕生了
腓尼基人的字母系統,是對人類文明的重大貢獻
拼音文字的優點在於它的普及性一般來講,學會二三十個字母,就能見字讀音蟿坥詛複雜,掌握的人就越少,這對於社會文明的進步非常不利就文字的複雜程度而言,以象形文字為最,其次為表意文字,形聲字又次之,拼音文字最簡單到了信息時代,拼音文字因其一維的表達方式又有了一個新的優勢。
但同時,拼音文字也有一個大問題,就是許多拼音文字,由於千百年來口語的不斷變化,它的書面文字與讀音往往相去甚遠拿法語來說,它的書面語言表達的還是四鏗繎瑤以前的發音,不發音的母音比比皆是,象hommes讀為um,aiment讀為em這就是為什麼上文說“一般來講”
印地安人來自亞洲大約在二萬五千年前有一些亞洲人就開始跨過冰封的白令海峽,逐漸向美洲內地遷移這似乎不是有目的的移居,所以這過程緩慢得在一代人中間都看不出來但是到了十六世紀西班牙人到達美洲時,他們已經布滿了整個美洲大陸,從阿拉斯加到智利南端的合恩角滿っ計那時的人口在一千四百萬到四千萬之間,操一千七百多種語言,所處的社會形態從狩獵和採集的石器時代到具有高度文明的阿茲台克(Aztec)鯿雅(Maya)和印加(Inca)國家都有
由於人們認定印地安人來自亞洲,所以自然地把他們的語言和各種亞洲語言作比較比較的結果,不僅沒有找到確定的聯繫,而且他們內部也不是完全彼此相象的這說明,第一,二萬多年的漫長時光對於語言的變化來說是太長了,我們已知的這些語言之間的聯繫都僅限於數千年的分離;第二,印地安人不是在同一時刻一起來到美洲的,互相之間可能分屬不同的民族
在印地安人中,瑪雅人的文字系統是最發達的,瑪雅人在公元最初的幾個世紀中就發明了文字,符號與解釋符號的圖形並列,包括很多圖形,也有音標和音節符號這些圖形文字看上去極其複雜,好像是一幅幅精緻繁複的裝飾圖案
西班牙人征服瑪雅后,大部分文字記錄都被銷毀,只有極少數保存到了今天
這給釋讀造成很大困難不過釋讀研究已取得進展,只可惜文字資料太少,我們對於當時社會情形不能了解很多了
在瑪雅,只有祭司才識字(所以當他們被消滅乾淨以後就沒人能懂瑪雅文了!)
,因此祭司們擁有極大的權力,這導致了瑪雅人登峰造極的拜神狂熱:修建巨大的神殿和祭壇,頻繁而繁縟的祭奠儀式,徵用大量的人力物力,甚至把最健壯的人用作犧牲結果,社會生產力遭到很大破壞,加上當時加勒比地區風暴頻繁,到西班牙人來到時,各城市已經荒涼破敗了……

非洲語言


“非洲”,指的是撒哈拉以南的“黑非洲”,北非和東北非我們已經在討論亞-非語系時提到過了,他們的語言即便不是阿拉伯語的話,也是它的近親
非洲有好幾百種語言,除了亞-非語系以外,還有尼日-剛果語系(Niger-Congo)查德-尼羅語系(Chari-Nile)科依散(Khoisan)和另外兩個小語系盿中最大的一個語系要數尼日-剛果語系,有二億多人口,接近非洲人口的一半,覆蓋了撒哈拉以南的廣大地區尼日-剛果語系的一個最重要分支是班圖語(支),人口佔了全語系人口的一半以上從西非的喀麥隆到東非的肯亞,可劃一條“班圖線”,班圖語就分佈在在這條線以南,同時這條線以南的非洲只有一小部分彼此孤立的地區講其它語言
語言學研究的結果表明,持班圖語言的民族最開始是發源於二千多年前的喀麥隆,也就是班圖語言區的最西北角可能是因為他們從近東地區學會了種植某種農作物后,由於這種作物的適應性,他們隨之逐漸朝東埿遷移,最終布滿了由此往南的整個非洲大陸
班圖語言中最重要的語種是斯瓦西里語(Swahili),它現在已成為東非最通行的語言,坦尚尼亞和肯亞更以它作為官方語言
在南非(共和國),白人講的語言叫“阿非利肯斯語”(Afrikaans)
,這是十七世紀的荷蘭殖民者帶來的,由於好幾個世紀的分離,它已經和荷蘭語有了不小的差別,所以把它們看作兩種不同的語言;黑人講的語言主要是祖魯語(Zulu)和科薩語(Xhosa),科薩語受附近的一個小語系影響,有一種非常難發的“倒吸氣”音:一邊吸氣一邊把舌頭上下顫動——你要能象這樣發出聲音我就服你“xh”表示的就是這種音
在現代非洲,和世界上的其它地方一樣,較少數人講的小語言逐漸讓位於少數幾種大語言因為對每個人來說,放棄自己的不通用的母語而講鄰近的多數人講的主要語種,自然對生活會更有用些

國際語系


各國語言的差異成為人們互相交往的一個不可克服的障礙。古往今來,人們就渴望有一種共同語言。特別是在信息化的今天,更需要有一種國際通用的語言,實現人們的互相交流。第一個在國際上獲得較大影響的人造語,是由德國教長施萊耶(Schleyer)於1879創造的沃拉普克語(Volapuk)。 1887年波蘭人柴門霍夫創造世界語(Esperanto)。世界大同語(Mondlango)。除了沃拉普克語,大同語和世界語之外,其它影響較大的人造語還有:伊多語(Ido),西方語(Occidental),諾維亞語(Novial),英特林瓜語(Interlingua),格羅沙語(Glosa),歐盟語(Atlango)等。

消亡


語言是文化的有機組成部分,又是文化的載體,世界文明的多樣性在很大程度上表現為世界語言的多樣性。德國知名學者威廉·馮·洪堡曾經說過:“每種語言都反映了一個民族的精神和智慧。”但是多種語言共存的局面正逐漸被打破,據語言學家推算,公元前地球上曾有12000種語言存在,公元元年時降為10000種,到15世紀時減少到9000種,而如今只有6820種左右。有專家測算,今天人類語言種類的消亡速度是哺乳動物瀕臨滅絕速度的兩倍,是鳥類瀕臨滅絕速度的四倍。據專家估計,世界尚存的語言,在21世紀將超過一半消亡;200年後,90%以上的語言將不復存在。
在聯合國教科文組織繪製的《全球瀕危語言分布圖》上,印度共有196種語言瀕臨滅絕,是瀕危語言最多的國家;排在第二位和第三位的國家分別是美國和印度尼西亞,瀕危語言數量分別為192種和147種。這是人類歷史上第一次用“語言地圖”的形式,向人們直觀地展示了全球部分族群的瀕危母語現狀。圖上列出了2474種語言的名稱、瀕危程度和使用地區,其中有230種語言自1950年起已經消失。在母語遺失方面,澳大利亞是全球最為嚴重的國家。在澳大利亞人的語言遺產中,有95%已消失殆盡——在殖民運動之前,澳大利亞大概有250種語言,加上方言,共有700多種,如今卻只剩下不到50種。
中國雖然不在全球語言瀕危的熱點地帶,但是至少也有數十種語言處於瀕危狀態。聯合國教科文組織將東北地區、陝晉黃河中游地區和西南邊境地區列為中國瀕危語言最集中的地區。據中國民族語言學會名譽會長孫宏開介紹,有幾種少數民族語言已經處於完全失去交際功能的狀態,如滿語畲語、赫哲語、塔塔爾語等;有20%的語言已經瀕危,如怒語、仡佬語、普米語、基諾語等;40%的語言已經顯露瀕危跡象或正在走向瀕危。比如,雲南的子君語也只有十幾個老年人會說;這些老年人辭世之時,也將是子君語退出歷史舞台之日;子君語已被聯合國教科文組織列入中國的“極度瀕危”語言之一。
語言瀕危是一種全球現象,但是卻值得所有人關注。保護民族語言和搶救瀕危語言就是為了保護多樣性的民族文化,同時也是為了保障各民族成員的平等權利。這正如中國知名學者周海中曾經指出的那樣:一些民族語言正面臨著全球化、工業化、網際網路等的衝擊,正處於逐漸消失的危險,有關部門、機構以及語言學界都應該採取積極而有效的措施來保護弱勢的民族語言和搶救瀕臨滅絕的民族語言;這樣既有利於人類文明的傳承和發展,也有利於民族團結、社會安定。