搜尋此網誌

2015年10月15日 星期四

R的學習筆記之讀取資料

想玩看看R很久了,今天第一次接觸
安裝就請到官方網站吧(不詳述) https://www.r-project.org/
1.png  


使用環境非常的輕量
個人感覺有點像matlab的運作方式
主控台為Console
程式碼寫在命令稿裡面 (***.r)
接下來就來實作讀取資料吧
我從台中市政府open data網站 http://data.taichung.gov.tw/ 上面下載台中市104年7月份10大易肇事路口的資料
讀取的指令為
r=read.csv("D:\\Google 雲端硬碟\\Personal\\ProgramDesign\\R\\data\\104年7月份10大易肇事路口.csv")
因為 "\" 為關鍵符號,跟java一樣要跳脫一下字元,所以要兩個 "\"
或是用 read.table
r2=read.table("D:\\Google 雲端硬碟\\Personal\\ProgramDesign\\R\\data\\104年7月份10大易肇事路口.csv",header=TRUE,sep=",")
若不想加上跳脫字元也可以這樣寫
r3=read.table("D:/Google 雲端硬碟/Personal/ProgramDesign/R/data/104年7月份10大易肇事路口.csv",header=TRUE,sep=",")
執行指令方式只要在該命令列,按下 Ctrl + r 就可以執行了
或是直接選取多行,再按下 Ctrl + r
又或是滑鼠右鍵,點選 執行程式列或選項 也可以
2.png 
印出資料的方式為 print()
而head()則是顯示出前面幾筆的意思
其他一些相關的指令整理如下:

  • ?+函式名稱 -> 會列出該函式的說明,以網頁方式呈現
ex: ?print

  • args(函式) -> 說明該函式的參數如何使用
ex: 
> args(read.table)
function (file, header = FALSE, sep = "", quote = "\"'", dec = ".", 
    numerals = c("allow.loss", "warn.loss", "no.loss"), row.names, 
    col.names, as.is = !stringsAsFactors, na.strings = "NA", 
    colClasses = NA, nrows = -1, skip = 0, check.names = TRUE, 
    fill = !blank.lines.skip, strip.white = FALSE, blank.lines.skip = TRUE, 
    comment.char = "#", allowEscapes = FALSE, flush = FALSE, 
    stringsAsFactors = default.stringsAsFactors(), fileEncoding = "", 
    encoding = "unknown", text, skipNul = FALSE) 
NULL

  • example(函式) -> 列出函式的範例以及用法
> example(read.csv)
rd.csv> ## using count.fields to handle unknown maximum number of fields
rd.csv> ## when fill = TRUE
rd.csv> test1 <- c(1:5, "6,7", "8,9,10")

rd.csv> tf <- tempfile()

rd.csv> writeLines(test1, tf)

rd.csv> read.csv(tf, fill = TRUE) # 1 column
  X1
1  2
2  3
3  4
4  5
5  6
6  7
7  8
8  9
9 10

rd.csv> ncol <- max(count.fields(tf, sep = ","))

rd.csv> read.csv(tf, fill = TRUE, header = FALSE,
rd.csv+          col.names = paste0("V", seq_len(ncol)))
  V1 V2 V3
1  1 NA NA
2  2 NA NA
3  3 NA NA
4  4 NA NA
5  5 NA NA
6  6  7 NA
7  8  9 10

rd.csv> unlink(tf)

rd.csv> ## "Inline" data set, using text=
rd.csv> ## Notice that leading and trailing empty lines are auto-trimmed
rd.csv> 
rd.csv> read.table(header = TRUE, text = "
rd.csv+ a b
rd.csv+ 1 2
rd.csv+ 3 4
rd.csv+ ")
  a b
1 1 2
2 3 4
  • getwd() -> 取得目前工作目錄
> getwd()
[1] "C:/Users/will.GIS/Documents"

  • setwd("D:/Google 雲端硬碟/Personal/ProgramDesign/R/") -> 設定工作目錄
  • dir() -> 看工作目錄下的檔案

粗淺的心得筆記,分享給大家

沒有留言:

張貼留言