Day 23- R語言資料篩選&基礎統計 - iT 邦幫忙
文章推薦指數: 80 %
Day 23- R語言資料篩選&基礎運算 (前言:內個,我只是個剛接觸程式設計的小萌新,如果內文內容或程式碼寫的不對,還請各位大大指教Orz 另外,今天用的資料也是昨天 ...
第11屆iThome鐵人賽
DAY
23
0
自我挑戰組
新手R語言學習紀錄系列第
23篇
Day23-R語言資料篩選&基礎統計
11th鐵人賽
randypan
團隊CPR爆肝初心者
2019-10-0914:12:192582瀏覽
Day23-R語言資料篩選&基礎運算
(前言:內個,我只是個剛接觸程式設計的小萌新,如果內文內容或程式碼寫的不對,還請各位大大指教Orz
另外,今天用的資料也是昨天整理過的cp表格喔,另外,有些函數是要先安裝dplyr才能用的,要記得安裝喔。
)
通常拿到一份資料的時候不只要做資料整理,還要做一些些篩選以及基礎運算。
首先要做的是排序資料,假設我們要R對資料做排序,可以使用order函數進行,例如要讓PM2.5這個欄位由小排到大,可以用以下程式碼進行:
cp[order(cp$PM2.5),]
當然,這個方法可以應用到其他的欄位上,但是因為目前沒有需要把資料排序的需求,所以我就不把它儲存到cp資料表了。
接下來要做的是遺漏值的處理,通常在處理資料的時候會有幾筆資料是NA,這時候可以透過R語言的complete.cases()函數檢查一個資料列裡面的資料完整性。
如果結果為TRUE表示資料完整,如果回傳結果有FALSE則表示該列資料有NA值。
如果要移除含有NA值的資料時,可以用下列程式碼執行:
cp400)
輸出結果如下:
其他dyplr的函數包含:
Mutate()增加新欄位
Arrange()觀察值排序
Rename()重新命名欄位
%>%將函數串在一起執行的運算符號,可以將變數放在這個符號前面,然後在符號的另一端加上運算的元素及函數等
接下來我們來用R語言的函數量化分析這個數據。
其中包含計算最小、最大數、第一、三分位數、中位數、平均數……等。
以cp的PM2.5資料來說,單變量量化數據分析的程式碼如下:
table(cp$PM2.5)#計算同一數字出現的次數
range(cp$PM2.5)#計算數據範圍
quantile(cp$PM2.5)#計算四分位數
var(cp$PM2.5)#計算變異數
sd(cp$PM2.5)#計算標準差
summary(cp$PM2.5)#計算最小、最大數、第一、三分位數、中位數、平均數
輸出結果如下:
雙變量量化數據分析程式碼及結果如下(這邊以PM2.5及PM10做比較):
cov(cp$PM10,cp$PM2.5)#計算共變數
cor(cp$PM10,cp$PM2.5)#計算相關性
>cov(cp$PM10,cp$PM2.5)
[1]7139.546
>cor(cp$PM10,cp$PM2.5)
[1]0.8832817
這個部分其實學到這邊也就差不多了,因為很多都是套用以前學果的函數來執行資料統計,而且因為套件相容性的關係,我的電腦可以執行的套件也就是比較常用的dplyr及ggplot等,可以使用的其他套件很少,因此這邊就沒有機會使用及做介紹了Orz。
那明天就開始用ggplot做資料視覺化吧
留言
追蹤
檢舉
上一篇
Day22-R語言匯入&整理外部檔案資料
下一篇
Day24-R語言ggplot2資料視覺化Part1-基礎繪圖文法及qplot介紹
系列文
新手R語言學習紀錄
共30篇
目錄
RSS系列文
訂閱系列文
10人訂閱
26
Day26-R語言ggplot2資料視覺化Part3(1)-ggplot2+地圖
27
Day27-R語言ggplot2資料視覺化Part3(2)-choroplethr地圖面量圖
28
Day28-R語言互動式資料視覺化-Part1-ggvis套件
29
Day29-R語言互動式資料視覺化Part2-plotly套件
30
Day30-R語言假設檢定(Hypothesistesting)函數練習
完整目錄
尚未有邦友留言
立即登入留言
iT邦幫忙鐵人賽
參賽組數
1087組
團體組數
52組
累計文章數
20470篇
完賽人數
572人
鐵人賽最新文章
gotodie?那個goto到底能不能用啊?
2021/12/12更新
予焦啦!一夢終須醒......
盤點清查與檢測掃描-資通安全健診
[13th][Day23]httpresponseheader(下)
[13th][Day22]httpresponseheader(上)
[13th][Day21]golangcontext
股票怎麼選?掌握這原則,你也能找到強勢股
Gitpush
盤點清查與檢測掃描-安全性檢測
前往鐵人賽
技術推廣專區
[Day2]抓取每日收盤價
[Day1]基本工具安裝
利用python取得永豐銀行API的Nonce
[Day03]tinyML開發板介紹
永豐金融API測試員
[Day01]在享受tinyML這道美食之前
[Day3]使用ta-lib製作指標
[Day4]函數打包與買進持有報酬率試算
計算API所需要的參數:HashID
計算API所需要的參數:IV
前往鐵人賽
熱門問題
公司想要客製化一套ERP系統該選擇軟體開發?套裝系統?還是自行設立部門?
PoE交換機可以直接相連嗎?
軟體工程師會被監控嗎
禁止員工連線使用Gmail與封鎖USBport的解法
遠端重開當機電腦的方法
訂房網站DB架構
我有一個客戶中了mljx病毒勒索950美金我免費轉讓有人要接嗎?
想找PDF編輯工具,Adobe太貴了,請問還有其他推薦的替代方案嗎?
加班提醒視窗
(以解決)請問GMAIL群組.假如公司之前有業務群[email protected].有新職員收不到這個.如何把新業務加入
IT邦幫忙
站方公告
【2021iThome鐵人賽】登登登!究竟獎落誰家,2021iThome鐵人賽得獎名單正式揭曉
熱門tag
看更多
13th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
2018鐵人賽
javascript
2017鐵人賽
windows
php
python
windowsserver
linux
c#
程式設計
資訊安全
css
vue.js
sql
分享
熱門回答
公司想要客製化一套ERP系統該選擇軟體開發?套裝系統?還是自行設立部門?
想找PDF編輯工具,Adobe太貴了,請問還有其他推薦的替代方案嗎?
軟體工程師會被監控嗎
禁止員工連線使用Gmail與封鎖USBport的解法
遠端重開當機電腦的方法
PoE交換機可以直接相連嗎?
請問EXCEL如何在抓取網頁外部資料後並設定好自動更新,寫的程式可以在資料更新時自己動作?
(以解決)請問GMAIL群組.假如公司之前有業務群[email protected].有新職員收不到這個.如何把新業務加入
RedhatEnterpriselinux5.5安裝Oracle問題
MYSQL如何將欄位中的json陣列資料拆分出來
熱門文章
[13th][Day23]httpresponseheader(下)
予焦啦!一夢終須醒......
[13th][Day22]httpresponseheader(上)
強制存取控制環境中強制執行完整性
【徵才】MIS工程師(每週2次每次半天)SOHO族freelancer電腦工程師
盤點清查與檢測掃描-資通安全健診
自己在家接收來自飛機的ADS-B訊號!
再增加五隻狗勾
第五隻狗勾
軟體開發團隊“有動力自主成長”的LOC100K門檻
一週點數排行
更多點數排行
海綿寶寶(antijava)
㊣浩瀚星空㊣(yoching)
居然解出來了(partyyaya)
japhenchen(japhenchen)
raytracy(raytracy)
ccenjor(ccenjor)
fillano(fillano)
mathewkl(mathewkl)
純真的人(jer5173)
juck30808(juck30808)
×
At
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{result.label}}
{{result.account}}
關閉
延伸文章資訊
- 1第15 天:資料處理技巧(2) · 輕鬆學習R 語言
在 filter() 函數中我們輸入要篩選的資料框,以及依據什麼條件進行篩選,舉例來說我們可以將 straw_hat_df 中的女性篩選出來: > library(tidyverse) > > ...
- 2[R]如何篩選出特定子集數據? subset() - CSDN博客
在R語言中,篩選出特定子集數據的函數為subset(),經由查詢Help的結果, ... 的高級數據結構指令即具備平行處理大數據的功能。 lapply: 輸入資料結構 ...
- 37 探索式資料分析| 資料科學與R語言 - 曾意儒Yi-Ju Tseng
data.table 資料型態的特殊結構和語法設計,便於後續資料分析處理,基本語法結構如下:. DT[ i , j , by =] i 觀察值(Row) 篩選邏輯; j 所需欄位(Column)...
- 46 資料處理與清洗| 資料科學與R語言
介紹如何使用R語言完成資料讀取、處理、分析與呈現,以及大數據技術與R的整合. ... Row的篩選可使用 subset() 函數,使用方法為 subset(資料表,篩選邏輯).
- 5R 列表變數與Data Frames - 頁5,共5
如果想要篩選data frame 中的資料,可以使用條件判斷式再配合索引的方式來處理: x.data.frame[x.data.frame$y > 0 | x.data.frame$z, "x"]