數據排序

數據排序

數據排序是按一定順序將數據排列,以便研究者通過瀏覽數據發現一些明顯的特徵或趨勢,找到解決問題的線索。除此之外,排序還有助於對數據檢查糾錯,以及為重新歸類或分組等提供方便。在某些場合,排序本身就是分析的目的之一,例如了解究竟誰是中國汽車生產的三巨頭,對於汽車生產廠商而言不論它是作為夥伴還是競爭者,都是很有用的信息。美國的《財富》雜誌每年都要在全世界範圍內排出500強企業,通過這一信息,不僅可以了解自己企業所處的地位,清楚自己的差距,還可以從一個側面了解到競爭對手的狀況,有效制定企業的發展規劃和戰略目標。

基本介紹


好的排序方法可以有效提高排序速度,提高排序效果。
在計算機領域主要使用數據排序方法根據佔用內存的方式不同分為2大類:內部排序方法與外部排序方法。
若整個排序過程不需要訪問外存便能完成,則稱此類排序問題為內部排序。
內排序的方法有許多種,按所用策略不同,可歸納為五類:插入排序、選擇排序交換排序歸併排序基數排序
其中,插入排序主要包括直接插入排序和希爾排序兩種;選擇排序主要包括直接選擇排序和堆排序;交換排序主要包括氣(冒)泡排序和快速排序。
外部排序基本上由兩個相互獨立的階段組成。首先,按可用內存大小,將外存上含n個記錄的文件分成若干長度為k的子文件或段(segment),依次讀入內存並利用有效的內部排序方法對它們進行排序,並將排序后得到的有序子文件重新寫入外存。通常稱這些有序子文件為歸併段或順串;然後,對這些歸併段進行逐趟歸併,使歸併段(有序子文件)逐漸由小到大,直至得到整個有序文件為止。