自然語言

自然地隨文化演化的語言

自然語言,讀音zì rán yǔ yán,通常是指一種自然地隨文化演化的語言。例如,英語、漢語、日語為自然語言的例子,這一種用法可見於自然語言處理一詞中。自然語言是人類交流和思維的主要工具,是人類智慧的結晶,也是各國人表達的方法其中之一。

發展


隨著計算機和網際網路的廣泛應用,計算機可處理的自然語言文本數量空前增長,面向海量信息的文本挖掘、信息提取、跨語言信息處理、人機交互等應用需求急速增長,自然語言處理研究必將對我們的生活產生深遠的影響。
自然語言處理是人工智慧中最為困難的問題之一,而對自然語言處理的研究也是充滿魅力和挑戰的。隨著計算機和網際網路的廣泛應用,也隨之衍生出了一系列的產品。相對而言,截止到2012年,國外在該領域的研究投入和成果都相對領先於國內,尤其漢語天然就相對於其他語種更為複雜,更為難以分析。

特點


自然語言處理髮展的4個特點:
1. 基於句法—語義規則的理性主義方法受到質疑,隨著語料庫建設和語料庫語言學的崛起,大規模真實文本的處理成為自然語言處理的主要戰略目標;
2. 自然語言處理中越來越多地使用機器自動學習的方法來獲取語言知識;
3. 自然語言處理中越來越重視辭彙的作用,出現了強烈的“辭彙主義”的傾向。
VB
在Visual Basic中,自然語言是指人類語言,是描述演演算法的一種方法。

缺陷


與自然語言相對的是邏輯語言。自然語言是人腦與人腦的交際工具 ,邏輯語言是人腦與電腦的交際工具。認知科學認為,思維和認知是知識的邏輯運算,任何計算化的自然語言分析都主要依賴邏輯語言對這種分析的表述。研究心智表現及其運算的認知科學理論追求的是心智研究的物質體現,這最終將導致語言學研究進入自然科學研究。自然語言的高度形式化描寫對計算機程序的機械模仿至關重要,但理解力模仿不同於機械模仿,它們之間的區別非常類似自然語言中形式操作與意義操作之間的不同。機械模仿涉及的是形式性質,而理解力模仿涉及的卻是准語義性質。現階段計算機以機械模仿為主並通過邏輯語言與人類的自然語言對話。
現代邏輯作為分析自然語言的工具,認為自然語言的缺陷有:(1)表達式的層次結構不夠清晰;(2)個體化認知模式體現不夠明確;(3)量詞管轄的範圍不太確切;(4)句子成分的語序不固定;(5)語形和語義不對應。
從自然語言的視角衡量邏輯語言,其不足有:(1)初始詞項的種類不夠多樣;(2)量詞的種類比較貧乏;(3)存在量詞的轄域在公式系列中不能動態地延伸;(4)由於語境的缺失而使語言傳達信息的效率不高。