R語言
一種信息技術
R語言,一種自由軟體編程語言與操作環境,主要用於統計分析、繪圖、數據挖掘。R本來是由來自紐西蘭奧克蘭大學的Ross Ihaka和Robert Gentleman開發(也因此稱為R),現在由“R開發核心團隊”負責開發。R是基於S語言的一個GNU計劃項目,所以也可以當作S語言的一種實現,通常用S語言編寫的代碼都可以不作修改的在R環境下運行。R的語法是來自Scheme。 R的源代碼可自由下載使用,亦有已編譯的可執行文件版本可以下載,可在多種平台下運行,包括UNIX(也包括FreeBSD和Linux)、Windows和MacOS。R主要是以命令行操作,同時有人開發了幾種圖形用戶界面。
朗訊科技公司貝爾實驗室總裁威廉·歐榭
但是請不要忘了:R是免費的(R is free)。
R語言源代碼託管在github,具體地址可以看參考資料。
。
R語言的下載可以通過cran的鏡像來查找,具體地址可以看參考資料。
R語言有域名為.cn的下載地址,有六個,其中兩個由Datagurn,由中國科學技術大學提供的。
R語言Windows版,其中由兩個下載地點是Datagurn和USTC提供的。具體地址可以看參考資料。
R是一套完整的數據處理、計算和製圖軟體系統。其功能包括:數據存儲和處理系統;數組運算工具(其向量、矩陣運算方面功能尤其強大);完整連貫的統計分析工具;優秀的統計製圖功能;簡便而強大的編程語言:可操縱數據的輸入和輸出,可實現分支、循環,用戶可自定義功能。
與其說R是一種統計軟體,還不如說R是一種數學計算的環境,因為R並不是僅僅提供若干統計程序、使用者只需指定資料庫和若干參數便可進行一個統計分析。R的思想是:它可以提供一些集成的統計工具,但更大量的是它提供各種數學計算、統計計算的函數,從而使使用者能靈活機動的進行數據分析,甚至創造出符合需要的新的統計計算方法。
該語言的語法表面上類似 C,但在語義上是函數設計語言(functional programming language)的變種並且和Lisp以及APL有很強的兼容性。特別的是,它允許在“語言上計算”(computing on the language)。這使得它可以把表達式作為函數的輸入參數,而這種做法對統計模擬和繪圖非常有用。
R是一個免費的自由軟體,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免費下載和使用的。在那兒可以下載到R的安裝程序、各種外掛程序和文檔。在R的安裝程序中只包含了8個基礎模塊,其他外在模塊可以通過CRAN獲得。
R的源代碼可自由下載使用,亦有已編譯的執行檔版本可以下載,可在多種平台下運行,包括UNIX(也包括FreeBSD和Linux)、Windows和MacOS。 R主要是以命令行操作,同時有人開發了幾種圖形用戶界面。
R內建多種統計學及數字分析功能。因為S的血緣,R比其他統計學或數學專用的編程語言有更強的物件導向(面向對象程序設計)功能。
R的另一強項是繪圖功能,製圖具有印刷的素質,也可加入數學符號。
雖然R主要用於統計分析或者開發統計相關的軟體,但也有人用作矩陣計算。其分析速度可媲美GNU Octave甚至商業軟體MATLAB。
R的功能能夠通過由用戶撰寫的套件增強。增加的功能有特殊的統計技術、繪圖功能,以及編程界面和數據輸出/輸入功能。這些軟體包是由R語言、LaTeX、Java及最常用C語言和Fortran撰寫。下載的執行檔版本會連同一批核心功能的軟體包,而根據CRAN紀錄有過千種不同的軟體包。其中有幾款較為常用,例如用於經濟計量、財經分析、人文科學研究以及人工智慧。
R語言的使用,很大程度上是藉助各種各樣的R包的輔助,從某種程度上講,R包就是針對於R的插件,不同的插件滿足不同的需求,截至2013年3月6日,CRAN已經收錄了各類包4338個。例如用於經濟計量、財經分析、人文科學研究以及人工智慧
。
1、通過選擇菜單:
程序包->安裝程序包->在彈出的對話框中,選擇你要安裝的包,然後確定。
2、使用命令
install.packages("package_name","dir")
package_name:是指定要安裝的包名,請注意大小寫。
dir:包安裝的路徑。默認情況下是安裝在..\library 文件夾中的。可以通過本參數來進行修改,來選擇安裝的文件夾。
3、本地來安裝
如果你已經下載的相應的包的壓縮文件,則可以在本地來進行安裝。請注意在windows、unix、macOS操作系統下安裝文件的後綴名是不一樣的:
1)linux環境編譯運行:tar.gz文件
2)windows 環境編譯運行:.zip文件
3)MacOSg環境編譯運行:.tgz文件
註:包安裝好后,並不可以直接使用,如果在使用包中相關的函數,必須每次使用前包載入到內存中。通過library(package_name)來完成。
包安裝后,如果要使用包的功能。必須先把包載入到內存中(默認情況下,R啟動后默認載入基本包),載入包命令:
Library(“包名”)
Require(“包名”)
1、查看包幫忙
library(help="package_name")
主要內容包括:例如:包名、作者、版本、更新時間、功能描述、開源協議、存儲位置、主要的函數
help(package = "package_name")
主要內容包括:包的內置所有函數,是更為詳細的幫助文檔
2、查看當前環境哪些包載入
find.package() 或者 .path.package()
3、移除包出內存
detach()
4、把其它包的數據載入到內存中
data(dsname, package="package_name")
5、查看這個包里的包有數據
data( package="package_name")
6、列出所有安裝的包
library()
CRAN為Comprehensive R Archive Network(R綜合典藏網)的簡稱。它除了收藏了R的執行檔下載版、源代碼和說明文件,也收錄了各種用戶撰寫的軟體包。現時,全球有超過一百個CRAN鏡像站。
以下簡述R FOR WINDOWS的安裝和使用:
貝爾實驗室美國總部
源代碼。點擊進入:Windows (95 and later),再點擊:base,下載SetupR.exe,約18兆,此便是R FOR WINDOWS的安裝程序。雙擊SetupR.exe,按照提示一步步安裝即可。
安裝完成後,程序會創建R程序組並在桌面上創建R主程序的快捷方式(也可以在安裝過程中選擇不要創建)。通過快捷方式運行R,便可調出R的主窗口。
類似於許多以編程方式為主要工作方式的軟體,R的界面簡單而樸素,只有不多的幾個菜單和快捷按鈕。快捷按鈕下面的窗口便是命令輸入窗口,它也是部分運算結果的輸出窗口,有些運算結果則會輸出在新建的窗口中。
主窗口上方的一些文字是剛運行R時出現的一些說明和指引。文字下的:> 符號便是R的命令提示符,在其後可輸出命令;>后的矩形是游標。R一般是採用交互方式工作的,在命令提示符后輸入命令,回車后便會輸出結果。
在R樸素的界面下,是豐富而複雜的運算功能。
R是一套由數據操作、計算和圖形展示功能整合而成的套件。包括:有效的數據存儲和處理功能,一套完整的數組(特別是矩陣)計算操作符,擁有完整體系的數據分析工具,為數據分析和顯示提供的強大圖形功能,一套(源自S語言)完善、簡單、有效的編程語言(包括條件、循環、自定義函數、輸入輸出功能)。
在這裡使用"環境"(environment)是為了說明R的定位是一個完善、統一的系統,而非其他數據分析軟體那樣作為一個專門、不靈活的附屬工具。
R語言之父:Ross Ihaka
書 名:R數據分析
作者:方匡南 朱建平 姜葉飛編著
出 版 社:電子工業出版社
出版時間:2015-02-01
版次:1
頁數:392
印刷時間:2015-02-01
本: 16開
紙張:膠版紙印
印 次:1
包裝:平裝
《R數據分析:方法與案例詳解(雙色)》是一本R語言和數據分析的入門教材,循序漸進、深入淺出,每個知識點盡量從實際的應用案例出發,以問題為導向,在解決問題中學習統計方法、R語言的基本使用以及編程技巧。
《R數據分析:方法與案例詳解(雙色)》內容涵蓋R數據結構、函數與優化、抽樣模擬、統計分析、假設檢驗、回歸分析、統計繪圖和R包製作等內容。
《R數據分析:方法與案例詳解(雙色)》的定位是為業界數據分析人員、經濟管理類、醫學的學生提供方法和程序上的參考,在寫作過程中盡量刪去比較理論的數學原理,這樣能夠幫助讀者輕鬆上手學習。
R作為一種統計分析軟體,是集統計分析與圖形顯示於一體的。它可以運行於UNIX、Windows和Macintosh的操作系統上,而且嵌入了一個非常方便實用的幫助系統,相比於其他統計分析軟體,R還有以下特點:
1.R是自由軟體。這意味著它是完全免費,開放源代碼的。可以在它的網站及其鏡像中下載任何有關的安裝程序、源代碼、程序包及其源代碼、文檔資料。標準的安裝文件身自身就帶有許多模塊和內嵌統計函數,安裝好后可以直接實現許多常用的統計功能。
2.R是一種可編程的語言。作為一個開放的統計編程環境,語法通俗易懂,很容易學會和掌握語言的語法。而且學會之後,我們可以編製自己的函數來擴展現有的語言。這也就是為什麼它的更新速度比一般統計軟體,如SPSS、SAS等快得多。大多數最新的統計方法和技術都可以在R中直接得到。
3. 所有R的函數和數據集是保存在程序包裡面的。只有當一個包被載入時,它的內容才可以被訪問。一些常用、基本的程序包已經被收入了標準安裝文件中,隨著新的統計分析方法的出現,標準安裝文件中所包含的程序包也隨著版本的更新而不斷變化。在另外版安裝文件中,已經包含的程序包有:base—R的基礎模塊、mle—極大似然估計模塊、ts—時間序列分析模塊、mva—多元統計分析模塊、survival—生存分析模塊等等。
4.R具有很強的互動性。除了圖形輸出是在另外的窗口處,它的輸入輸出窗口都是在同一個窗口進行的,輸入語法中如果出現錯誤會馬上在窗口中得到提示,對以前輸入過的命令有記憶功能,可以隨時再現、編輯修改以滿足用戶的需要。輸出的圖形可以直接保存為JPG、BMP、PNG等圖片格式,還可以直接保存為PDF文件。另外,和其他編程語言和資料庫之間有很好的介面。
5.如果加入R的幫助郵件列表一,每天都可能會收到幾十份關於R的郵件資訊。可以和全球一流的統計計算方面的專家討論各種問題,可以說是全世界最大、最前沿的統計學家思維的聚集地。
R是基於S語言的一個GNU項目,所以也可以當作S語言的一種實現,通常用S語言編寫的代碼都可以不作修改的在R環境下運行。R的語法是來自Scheme。R的使用與S-PLUS有很多類似之處,這兩種語言有一定的兼容性。S-PLUS的使用手冊,只要稍加修改就可作為R的使用手冊。所以有人說:R,是S-PLUS的一個“克隆”。
但是請不要忘了:R是免費的(R is free)。R語言源代碼託管在github,具體地址可以看參考資料。 。
R語言的下載可以通過CRAN的鏡像來查找。
R語言有域名為.cn的下載地址,有六個,其中兩個由Datagurn,由中國科學技術大學提供的。R語言Windows版,其中由兩個下載地點是Datagurn和USTC提供的。