正規方程

正規方程

正規方程(regular expression)是說明單詞的模式(pattern)的一種重要的表示法(記號),是定義正規集的工具。是表示正規集的數學工具。

簡介


正規方程最早是由數學家Stephen Kleene於1956年提出,他是在對自然語言的遞增研究成果的基礎上提出來的。具有完整語法的正則表達式使用在字元的格式匹配方面上,後來被應用到熔融信息技術領域。自從那時起,正則表達式經過幾個時期的發展,現在的標準已經被ISO(國際標準組織)批准和被Open Group組織認定。
正規方程並非一門專用語言,但它可用於在一個文件或字元里查找和替代文本的一種標準。它具有兩種標準:基本的正則表達式(BRE),擴展的正則表達式(ERE)。ERE包括BRE功能和另外其它的概念。

定義


(正規式和它所表示的正規集):
設字母表為Σ,輔助字母表。
① ε和Φ都是Σ上的正規式,它們所表示的正規集分別為和{ };
② 任何,a是Σ上的一個正規式,它所表示的正規集為;
③ 假定e1和e2都是Σ上的正規式,它們所表示的正規集分別為L(e1)和L(e2),那麼,也都是正規式,它們所表示的正規集分別為和。
④ 僅由有限次使用上述三步驟而定義的表達式才是Σ上的正規式,僅由這些正規式所表示的字集才是Σ上的正規集。