Day 23- R語言資料篩選&基礎統計 - iT 邦幫忙

文章推薦指數: 80 %
投票人數:10人

Day 23- R語言資料篩選&基礎運算 (前言:內個,我只是個剛接觸程式設計的小萌新,如果內文內容或程式碼寫的不對,還請各位大大指教Orz 另外,今天用的資料也是昨天 ... 第11屆iThome鐵人賽 DAY 23 0 自我挑戰組 新手R語言學習紀錄系列第 23篇 Day23-R語言資料篩選&基礎統計 11th鐵人賽 randypan 團隊CPR爆肝初心者 2019-10-0914:12:192582瀏覽 Day23-R語言資料篩選&基礎運算 (前言:內個,我只是個剛接觸程式設計的小萌新,如果內文內容或程式碼寫的不對,還請各位大大指教Orz 另外,今天用的資料也是昨天整理過的cp表格喔,另外,有些函數是要先安裝dplyr才能用的,要記得安裝喔。

) 通常拿到一份資料的時候不只要做資料整理,還要做一些些篩選以及基礎運算。

首先要做的是排序資料,假設我們要R對資料做排序,可以使用order函數進行,例如要讓PM2.5這個欄位由小排到大,可以用以下程式碼進行: cp[order(cp$PM2.5),] 當然,這個方法可以應用到其他的欄位上,但是因為目前沒有需要把資料排序的需求,所以我就不把它儲存到cp資料表了。

接下來要做的是遺漏值的處理,通常在處理資料的時候會有幾筆資料是NA,這時候可以透過R語言的complete.cases()函數檢查一個資料列裡面的資料完整性。

如果結果為TRUE表示資料完整,如果回傳結果有FALSE則表示該列資料有NA值。

如果要移除含有NA值的資料時,可以用下列程式碼執行: cp400) 輸出結果如下: 其他dyplr的函數包含: Mutate()增加新欄位 Arrange()觀察值排序 Rename()重新命名欄位 %>%將函數串在一起執行的運算符號,可以將變數放在這個符號前面,然後在符號的另一端加上運算的元素及函數等 接下來我們來用R語言的函數量化分析這個數據。

其中包含計算最小、最大數、第一、三分位數、中位數、平均數……等。

以cp的PM2.5資料來說,單變量量化數據分析的程式碼如下: table(cp$PM2.5)#計算同一數字出現的次數 range(cp$PM2.5)#計算數據範圍 quantile(cp$PM2.5)#計算四分位數 var(cp$PM2.5)#計算變異數 sd(cp$PM2.5)#計算標準差 summary(cp$PM2.5)#計算最小、最大數、第一、三分位數、中位數、平均數 輸出結果如下: 雙變量量化數據分析程式碼及結果如下(這邊以PM2.5及PM10做比較): cov(cp$PM10,cp$PM2.5)#計算共變數 cor(cp$PM10,cp$PM2.5)#計算相關性 >cov(cp$PM10,cp$PM2.5) [1]7139.546 >cor(cp$PM10,cp$PM2.5) [1]0.8832817 這個部分其實學到這邊也就差不多了,因為很多都是套用以前學果的函數來執行資料統計,而且因為套件相容性的關係,我的電腦可以執行的套件也就是比較常用的dplyr及ggplot等,可以使用的其他套件很少,因此這邊就沒有機會使用及做介紹了Orz。

那明天就開始用ggplot做資料視覺化吧 留言 追蹤 檢舉 上一篇 Day22-R語言匯入&整理外部檔案資料 下一篇 Day24-R語言ggplot2資料視覺化Part1-基礎繪圖文法及qplot介紹 系列文 新手R語言學習紀錄 共30篇 目錄 RSS系列文 訂閱系列文 10人訂閱 26 Day26-R語言ggplot2資料視覺化Part3(1)-ggplot2+地圖 27 Day27-R語言ggplot2資料視覺化Part3(2)-choroplethr地圖面量圖 28 Day28-R語言互動式資料視覺化-Part1-ggvis套件 29 Day29-R語言互動式資料視覺化Part2-plotly套件 30 Day30-R語言假設檢定(Hypothesistesting)函數練習 完整目錄 尚未有邦友留言 立即登入留言 iT邦幫忙鐵人賽 參賽組數 1087組 團體組數 52組 累計文章數 20470篇 完賽人數 572人 鐵人賽最新文章 gotodie?那個goto到底能不能用啊? 2021/12/12更新 予焦啦!一夢終須醒...... 盤點清查與檢測掃描-資通安全健診 [13th][Day23]httpresponseheader(下) [13th][Day22]httpresponseheader(上) [13th][Day21]golangcontext 股票怎麼選?掌握這原則,你也能找到強勢股 Gitpush 盤點清查與檢測掃描-安全性檢測 前往鐵人賽 技術推廣專區 [Day2]抓取每日收盤價 [Day1]基本工具安裝 利用python取得永豐銀行API的Nonce [Day03]tinyML開發板介紹 永豐金融API測試員 [Day01]在享受tinyML這道美食之前 [Day3]使用ta-lib製作指標 [Day4]函數打包與買進持有報酬率試算 計算API所需要的參數:HashID 計算API所需要的參數:IV 前往鐵人賽 熱門問題 公司想要客製化一套ERP系統該選擇軟體開發?套裝系統?還是自行設立部門? PoE交換機可以直接相連嗎? 軟體工程師會被監控嗎 禁止員工連線使用Gmail與封鎖USBport的解法 遠端重開當機電腦的方法 訂房網站DB架構 我有一個客戶中了mljx病毒勒索950美金我免費轉讓有人要接嗎? 想找PDF編輯工具,Adobe太貴了,請問還有其他推薦的替代方案嗎? 加班提醒視窗 (以解決)請問GMAIL群組.假如公司之前有業務群[email protected].有新職員收不到這個.如何把新業務加入 IT邦幫忙 站方公告 【2021iThome鐵人賽】登登登!究竟獎落誰家,2021iThome鐵人賽得獎名單正式揭曉 熱門tag 看更多 13th鐵人賽 12th鐵人賽 11th鐵人賽 鐵人賽 2019鐵人賽 2018鐵人賽 javascript 2017鐵人賽 windows php python windowsserver linux c# 程式設計 資訊安全 css vue.js sql 分享 熱門回答 公司想要客製化一套ERP系統該選擇軟體開發?套裝系統?還是自行設立部門? 想找PDF編輯工具,Adobe太貴了,請問還有其他推薦的替代方案嗎? 軟體工程師會被監控嗎 禁止員工連線使用Gmail與封鎖USBport的解法 遠端重開當機電腦的方法 PoE交換機可以直接相連嗎? 請問EXCEL如何在抓取網頁外部資料後並設定好自動更新,寫的程式可以在資料更新時自己動作? (以解決)請問GMAIL群組.假如公司之前有業務群[email protected].有新職員收不到這個.如何把新業務加入 RedhatEnterpriselinux5.5安裝Oracle問題 MYSQL如何將欄位中的json陣列資料拆分出來 熱門文章 [13th][Day23]httpresponseheader(下) 予焦啦!一夢終須醒...... [13th][Day22]httpresponseheader(上) 強制存取控制環境中強制執行完整性 【徵才】MIS工程師(每週2次每次半天)SOHO族freelancer電腦工程師 盤點清查與檢測掃描-資通安全健診 自己在家接收來自飛機的ADS-B訊號! 再增加五隻狗勾 第五隻狗勾 軟體開發團隊“有動力自主成長”的LOC100K門檻 一週點數排行 更多點數排行 海綿寶寶(antijava) ㊣浩瀚星空㊣(yoching) 居然解出來了(partyyaya) japhenchen(japhenchen) raytracy(raytracy) ccenjor(ccenjor) fillano(fillano) mathewkl(mathewkl) 純真的人(jer5173) juck30808(juck30808) × At 輸入對方的帳號或暱稱 Loading 找不到結果。

標記 {{result.label}} {{result.account}} 關閉



請為這篇文章評分?