14個超有趣的數據分析項目,數據集都給你整理好啦(中)

文章推薦指數: 80 %
投票人數:10人

世衛組織建立了所有內部健康狀況的數據集,其中包括預期壽命,成人死亡率等方面的統計數據。

使用此數據集,探索各種變量之間的關係,預測對預期壽命的 ... GetunlimitedaccessOpeninappHomeNotificationsListsStoriesWrite14個超有趣的數據分析項目,數據集都給你整理好啦(中)-探索性數據分析探索性數據分析(EDA),也稱為數據挖掘,意思是數據分析過程中使用了多種技術來更好的理解數據。

1.紐約Airbnb數據挖掘自2008年以來,Airbnb使遊客和房東出行更方便,提出更多個性化的體驗世界的方式。

該數據集包含有關2019年紐約出租的信息以及包含其地理信息,價格,評論數量等。

可以分析的一些角度如下:哪些區域生意最好,為什麼?某些區域的流量比其他區域大,為什麼?價格,評論數量和預訂天數之間是否存在一些關係?數據集:NewYorkCityAirbnbOpenDataAirbnblistingsandmetricsinNYC,NY,USA(2019)www.kaggle.com2.哪些因素與員工離職和績效有關IBM變量了一個綜合數據集,可以使用它來了解各種因素如何影響員工的流失率和響應。

一些變量包括教育程度,工作相關性,績效評估和工作生活平衡程度等。

分析此數據集,找到任何確實影響員工滿意度的變量,另外,還可以看看是否可以對變量進行重要程度排名。

數據集:IBMHRAnalyticsEmployeeAttrition&PerformancePredictattritionofyourvaluableemployeeswww.kaggle.com3.世界大學排名您認為您的國家擁有世界上最好的大學嗎?成為“最好”大學的標準標準是什麼?該數據集包含三個全球大學排名方式。

使用此數據,您是否可以回答以下問題:頂尖的大學都在某個國家?決定世界排名的主要因素是什麼?數據集:WorldUniversityRankingsInvestigatethebestuniversitiesintheworldwww.kaggle.com4.飲酒與在校表現喝酒會影響學生的成績嗎?如果不會,那有什麼別的影響嗎?這個數據是從中學數學和替換課程的學生進行的一項調查中獲得的。

它包含幾個變量,例如飲酒量,家庭人數,參與課外活動。

利用這些數據,挖掘學校成績與各種因素之間的關係。

另外,看看是否可以根據其他變量來預測學生的成績!數據集:StudentAlcoholConsumptionSocial,genderandstudydatafromsecondaryschoolstudentswww.kaggle.com5.寵物小精靈數據挖掘對所有遊戲玩家來說,這是一個包含來自七代802個Pokemon的信息數據集。

試著回答以下幾個問題!哪一代寵物小精靈最強?哪代最弱?最初類型神奇寶貝最強?某些最弱?能否建立分類器來識別神奇寶貝?身體特徵與力量狀態(進攻,防守,速度等)之間是否有相關性?數據集:TheCompletePokemonDatasetDataonmorethan800Pokemonfromall7Generations.www.kaggle.com6.探索影響預期壽命的因素世衛組織建立了所有內部健康狀況的數據集,其中包括預期壽命,成人死亡率等方面的統計數據。

使用此數據集,探索各種變量之間的關係,預測對預期壽命的最大影響因素是什麼?請嘗試回答以下問題:最初選擇的各種預測因素是否真的影響預期壽命?實際影響預期壽命的預測變量有哪些?嬰兒和成人死亡率如何影響預期壽命?預期壽命與飲食習慣,生活方式,運動,吸煙,飲酒等是正相關還是負相關?是否接受教育對人類生命有何影響?預期壽命與飲酒是正相關還是負相關?人口稠密的國家的預期壽命是否有降低的趨勢?免疫覆蓋率對預期壽命有什麼影響?數據集:LifeExpectancy(WHO)StatisticalAnalysisonfactorsinfluencingLifeExpectancywww.kaggle.com資料來源:14个超有趣的数据分析项目,数据集都给你整理好啦对于那些对数据,数据分析或数据科学感兴趣的人,提供一份可以利用业余时间完成的数据科学项目清单,一共14个!最容易上手的就是数据可视化,以下3个数据集可以用于创建一些有意思的可视化效果并加到你的简历中。

…xw.qq.comMorefromGlobalDataVizu數據壹族Follow本賬號主要探討數據分析的五大模塊:分析目的與框架、數據收集、數據處理、數據分析和數據展現;以及傳播數據的應用以及數據洞察的價值,分享變“數”為“寶”的經驗、實際運用的方法經驗以及趣事。

Lovepodcastsoraudiobooks?Learnonthegowithournewapp.TryKnowableAboutHelpTermsPrivacyGettheMediumappGetstartedGlobalDataVizu數據壹族24Followers本賬號主要探討數據分析的五大模塊:分析目的與框架、數據收集、數據處理、數據分析和數據展現;以及傳播數據的應用以及數據洞察的價值,分享變“數”為“寶”的經驗、實際運用的方法經驗以及趣事。

FollowHelpStatusWritersBlogCareersPrivacyTermsAboutKnowable



請為這篇文章評分?