共找到2條詞條名為統計的結果 展開

統計

漢語詞語

統徠計是漢語中的“統計”原有合計或匯總計算的意思。統計一詞起源於國情調查,最早意為國情學。一般來說,統計包括三個含義:統計工作、統計資料和統計科學。統計工作、統計資料、統計科學三者之間的關係是:統計工作的成果是統計資料,統計資料和統計科學的基礎是統計工作,統計科學既是統計工作經驗的理論概括,又是指導統計工作的原理、原則和方法。

原始的統計工作即人們收集數據的原始形態已經有幾千年的歷史,而它作為一門科學,是從17世紀開始。英語中統計學家和統計員是同一個單詞,但統計學並不是直接產生於統計工作的經驗總結。每一門科學都有其建立、發展和客觀條件,統計科學則是統計工作經驗、社會經濟理論、計量經濟方法融合、提煉、發展而來的一種邊緣性學科。

基本概念


統計語源最早出現於中世界拉丁語的Status,意思指各種現象的狀態和狀況。由這一語根組成義大利語Stato,表示“國家”的概念,也含有國家結構和國情知識的意思。根據這一語根,最早作為學名使用的“統計”,是 在十八世紀德國政治學教授亨瓦爾(G.Achenwall)在1749年所著《近代歐洲各國國家學綱要》一書緒言中,把國家學名定為“Statistika”(統計)這個詞。原意是指“國家顯著事項的比較和記述”或“國勢學”,認為統計是關於國家應注意事項的學問。此後,各國相繼沿用“統計”這個詞,並把這個詞譯成各國的文字,法國譯為Statistique,義大利譯為Statistica,英國譯為Statistics,日本最初譯為“政表”、“政算”、“國勢”、“形勢”等,直到1880年在太政官中設立了統計院,才確定以“統計”二字正名。1903年(清光緒廿九年)由鈕永建、林卓南等翻譯了四本橫山雅南所著的《統計講義錄》一書,把“統計”這個詞從日本傳到我國。1907年(清光緒卅三年)彭祖植編寫的《統計學》在日本出版,同時在國內發行,這是我國最早的一本“統計學”書籍。“統計”一詞就成了記述國家和社會狀況的數量關係的總稱。
人類對事物數量的認識形成的定義。漢語中的“統計”有合計、總計的意思。指對某一現象有關的數據的搜集、整理、計算、分析、解釋、表述等的活動。
1. 指對某一現象有關的數據的搜集、整理、計算和分析等。例:人口統計
2. 指總括地計算。例:把全國報來的數據統計一下
典故:明胡應麟《少室山房筆叢·經籍會通一》:“古今書籍,統計一代,前後之藏,往往無過十萬;統計一朝,公私之蓄,往往不能十萬。”清宣鼎《夜雨秋燈錄·銀雁》:“佛奴掘深窖藏之,統計約有二十餘萬。”

外文詞源


統計學英文(statistics)術語最終來源於現代拉丁語statisticum collegium (國會)和義大利語中statista (國民或政治家)。德語中Statistik, 最早是由Gottfried Achenwall (1749年)使用, 代表對國家的資料進行分析的學問,也就是“研究國家的科學”。在十九世紀統計學在於廣泛的收集數據以及資料中探究其意義。Sir John Sinclair在1791年首次出版21卷《蘇格蘭統計帳戶》時將統計學引進到英語。

三種涵義


統計[漢語詞語]
統計[漢語詞語]
在實際應用中,人們對統計一詞的理解一般有三種涵義:統計工作、統 計資料和統計科學:
(1)統計工作。指利用科學的方法搜集、整理和分析和提供關於社會經濟現象數量資料的工作的總稱,是統計的基礎。也稱統計實踐,或統計活動,是在一定統計理論指導下,採用科學的方法,搜集、整理、分析統計資料的一系列活動過程。它是隨著人類社會的發展、治國和管理的需要而產生和發展起來的,至今已有四五千年的歷史。現實生活中,統計工作作為一種認識社會經濟現象總體和自然現象總體的實踐過程,一般包括統計設計、統計調查、統計整理和統計分析四個環節。
(2)統計資料。指通過統計工作取得的、用來反映社會經濟現象的數據資料的總稱。統計工作所取得的各項數字資料及有關文字資料,一般反映在統計表、統計圖、統計手冊、統計年鑒、統計資料彙編和統計分析報告中。也稱統計信息,是反映一定社會經濟現象總體或自然現象總體的特徵或規律的數字資料、文字資料、圖表資料及其他相關資料的總稱。包括剛剛調查取得的原始資料和經過一定程度整理、加工的次級資料,其形式有:統計表、統計圖、統計年鑒、統計公報、統計報告和其他有關統計信息的載體。
(3)統計科學。也稱統計學,是統計工作經驗的總結和理論概括,是系統化的知識體系。指研究如何搜集、整理和分析統計資料的理論與方法。統計學是應用數學的一個分支,主要通過利用概率論建立數學模型,收集所觀察系統的數據,進行量化的分析、總結,並進而進行推斷和預測,為相關決策提供依據和參考。它被廣泛的應用在各門學科之上,從物理和社會科學到人文科學,甚至被用來工商業及政府的情報決策之上。
統計學主要又分為描述統計學和推斷統計學。給定一組數據,統計學可以摘要並且描述這份數據,這個用法稱作為描述統計學。另外,觀察者以數據的形態建立出一個用以解釋其隨機性和不確定性的數學模型,以之來推論研究中的步驟及母體,這種用法被稱做推論統計學。這兩種用法都可以被稱作為應用統計學。另外也有一個叫做數理統計學的學科專門用來討論這門科目背後的理論基礎。
總體來說,“統計”一詞的三方面涵義是緊密聯繫的,統計資料是統計工作的成果,統計工作與統計科學之間是實踐與理論的關係。
計算方法
均值、中位數、眾數、正態分佈、抽樣、標準差、概率論、檢驗、方差分析、卡方檢驗。

理論淵源

1.正態曲線
1733年,德-莫佛(De Moivre)在給友人分發的一篇文章中給出了正態曲線1783年,拉普拉斯建議正態曲線方程適合於表示誤差分佈的概率。
1809年,高斯發表了他的關於天體運行論的偉大著作,在這一著作的第二卷第三節中,他導出正態曲線適宜於表示誤差規律,同時承認拉普拉斯較早的推導。
正態分佈在十九世紀前葉因高斯的工作而加以推廣,所以通常稱作高斯分佈。卡爾-皮爾遜指出德-莫佛是正態曲線的創始人,第一個稱它為正態分佈,但人們仍習慣稱之高斯分佈。
徠2.最小二乘法
1805年,Legendre提出最小二乘法,Gauss聲稱自己在1794年用過,並在1809年基於誤差的高斯分佈假設,給出了嚴格推導。
3.總體和樣本
在早期文獻中可找到由某個總體中抽樣的明確例子,然而從總體中只能取得樣本的認識常常是缺乏的。 ----K.皮爾遜時代
到十九世紀末,對樣本和總體的區別已普遍知道,然而這種區分並不一定總被堅持。----1910年Yule在自己的教科書中指出。
在 1900年代的早期,區分變的更清楚,並在1922年被Fisher特彆強調。----Fisher在1922年發表的論文《On the mathematical foundation of theoretical statistics》,說明了總體和樣本的聯繫和區別,以及其他概念,奠定了“理論統計學”的基礎。
4.期望、標準差和方差
期望是一個比概率更原始的概念,在十七世紀帕斯卡和費馬時代,期望概念已被公認了。K.皮爾遜最早定義了標準差的概念。1918年,Fisher引入方差的概念。
力學中的矩和統計學中的中數兩者之間的相似性已被概率領域的早期工作者注意到,而K.皮爾遜在1893年第一次在統計意義下使用“矩”。
5.卡方統計量
卡方統計量,是卡-皮爾遜提出用於檢驗已知數據是否來自某一特定的隨機模型,或已知數據是否與已給定的假設一致。卡方檢驗被譽為自1900年以來在科學技術所有分支中20個尖端發明之一,甚至敵人Fisher都對此有極高評價。
6.矩估計與最大似然
卡-皮爾遜提出了使用矩來估計參數的方法。
Fisher則在1912年到1922年間提出了最大似然估計方法,基於直覺,提出了估計的一致性、有效性和充分性的概念。
7.概率的公理化
1933年,前蘇聯數學家柯爾莫格洛夫(Kolmogorov)發表了《概率論的基本概念》,奠定了概率論的嚴格數學基礎。
貝葉斯對統計學幾乎沒有什麼貢獻,然而貝葉斯的一篇文章成為貝葉斯學派統計學的思想模式的焦點,這一篇文章發表於1763年,由貝葉斯的朋友、著名人壽保險原理的開拓者Richard Price在貝葉斯死後提出來的----貝葉斯定理。
概率思想的兩種方法,(1)作為一個物理系統內在的一種物理特性,(2)對某一陳述相信程度的度量。 在1950年代後期止,多數統計學家採取第一種觀點,即概率的相對頻數解釋,這一時期貝葉斯定理僅應用在概率能在頻數框架內解釋的場合。
9.其他
在十九世紀中葉,三個不同領域產生的重要發展都是基於隨機性是自然界固有的這個前提上的。
阿道夫·凱特萊特(A. Quetlet,1869)利用概率性的概念來描述社會學和生物學現象孟德(G.Mendel,1870)通過簡單的隨機性結構公式化了他的遺傳法則。
玻爾茲曼(Boltzmann,1866)對理論物理中最重要的基本命題之一的熱力學第二定律給出了一個統計學的解釋。
1859 年,達爾文發表了《物種起源》,達爾文的表兄弟高爾登爵士開始利用概率工具分析生物現象,對生物計量學的基礎做出了重要貢獻(可以稱他為生物信息學之父),高爾登爵士是第一個使用相關和回歸這兩個重要概念的人,他還是中位數和百分位數這種概念的創始人。
受高爾登工作影響,在倫敦的大學學院工作的卡爾-皮爾遜開始把數學和概率論應用於達爾文進化論,從而開創了現代統計時代,贏得了統計之父的稱號,1901年Biometrika第一期出版(卡-皮爾遜是創始人之一)。