Python实现主成分分析(PCA)降维:原理及实例分析 - CSDN ...
文章推薦指數: 80 %
转载文章:Python实现主成分分析(PCA)降维:原理及实例分析简介降维是由一些问题带来的:可以缓解由维度诅咒(高维)带来的问题;可以用来压缩数据 ...
Python实现主成分分析(PCA)降维:原理及实例分析
悟乙己
2021-03-2612:10:53
820
收藏
7
分类专栏:
机器学习︱R+python
文章标签:
PCA
主成分
python
降维
原文链接:https://finthon.com/python-pca/
版权
机器学习︱R+python
专栏收录该内容
78篇文章
28订阅
订阅专栏
转载文章:Python实现主成分分析(PCA)降维:原理及实例分析
简介
降维是由一些问题带来的:
可以缓解由维度诅咒(高维)带来的问题;可以用来压缩数据,将损失数据最小化;可以将高维数据降到低维进行可视化。
主成分分析(Principalcomponentsanalysis,简称PCA)是最重要的降维方法之一。
一般我们提到降-维最容易想到的算法就是PCA,下面我们就对PCA的原理做一个总结。
PCA的scikit-learn实现
scikit-learn集成了PCA方法,调用起来也更加方便。
需要注意的是,在scikit-learn中使用了奇异值分解来计算特征向量和特征值。
PCA的调用方法非常简单,这里列出全部代码。
importnumpyasnp
importmatplotlib.pyplotasplt
fromsklearn.decompositionimportPCA
fromsklearn.datasets.samples_generatorimportmake_blobs
X,y=make_blobs(n_samples=10000,n_features=3,centers=[[3,3,3],[0,0,0],[1,1,1],[2,2,2]],
cluster_std=[0.2,0.1,0.2,0.2],random_state=9)
#降维到二维
pca=PCA(n_components=2)
pca.fit(X)
#输出特征值
print(pca.explained_variance_)
输出特征向量
print(pca.components_)
#降维后的数据
X_new=pca.transform(X)
print(X_new)
fig=plt.figure()
plt.scatter(X_new[:,0],X_new[:,1],marker='o')
plt.show()
pca.transform(X)为降维之后的数据,从100003->100002
结果如下:
#特征值
[3.785216380.03272613]
#特征向量
[[0.576016220.578461910.57757002]
[-0.32920617-0.482568820.81163454]]
#降维后的结果
[[1.290496170.01162118]
[-2.5902227-0.04141849]
[2.81225258-0.05286925]
...
[2.52492314-0.0935418]
[2.982064560.03861322]
[2.28089246-0.13618233]]
需要注意的是PCA()方法中的参数设置:
pca=PCA(n_components=0.95)
当n_components=0.95表示指定了主成分累加起来至少占95%的那些成分。
pca=PCA(n_components='mle')
当n_components='mle'表示让MLE算法自己选择降维维度的效果。
悟乙己
关注
关注
1
点赞
踩
0
评论
7
收藏
一键三连
扫一扫,分享海报
专栏目录
python实现PCA降维的示例详解
09-17
今天小编就为大家分享一篇python实现PCA降维的示例详解,具有很好的参考价值,希望对大家有所帮助。
一起跟随小编过来看看吧
pca降维python实例_Python实现PCA降维
weixin_39636102的博客
12-03
460
特征降维之PCA特征降维是无监督学习的另一个应用,在图像识别方面,经常会遇到特征维度非常高的训练样本(像素矩阵)时,很难提供数据展现,训练学习模型也很耗时耗力,特征降维不仅重构了有效的低维度特征向量,也为数据展现提供了可能,其中主成分分析(PrincipalComponentAnalysis)是应用最广泛的特征降维技术。
PCA简单来说,是一种特征选择(重构)手段,将原来的特征空间做了映射,使得...
参与评论
请先登录后发表评论~
插入表情
代码片
HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它
最详细的降维方法PCA的数学原理
weixin_43204128的博客
05-26
387
https://www.cnblogs.com/mikewolf2002/p/3429711.html
机器学习降维之PCA(python代码+数据)
热门推荐
三少说
06-27
3万+
加深PCA算法研究
降维算法之PCA及其实战
huahuaxiaoshao的博客
01-07
734
主成分分析(Principalcomponentsanalysis,以下简称PCA)是最重要的降维方法之一。
在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用。
为什么说PCA应用广泛呢?PCA是一种无监督算法,也就是我们不需要标签也能对数据做降维,这就使得其应用范围更加广泛了。
一般我们提到降维最容易想到的算法就是PCA,...
深度学习入门-mnist数据集
weixin_45720751的博客
10-03
254
深度学习入门-基于python的理论与实现
3.6.1MNIST数据集
我使用的是pyhcharm可以直接通过setting里Installtensorflow模块导入mniset数据集
tensorflow是一个采用数据流图(dataflowgraphs),用于数值计算的开源软件库
MNIST是一个入门级的计算机视觉数据集,它包含各种手写数字图片
数据集被分成两部分:60000行的训练数据集(mnist.train)和10000行的测试数据集(mnist.test)。
每一个MNIST数据单元有
python典型安装_Python主成分分析-经典案例分析
weixin_39545310的博客
11-23
45
前期已经学了如何建立变量之间的相关关系及如何分类,接下来要分析如果变量太多,或可以通过降维再进行分析,就要用到降维技术:主成分分析。
案例比较少,我们拿鸢尾花和拉面的经典案例来做分析。
主成分分析:将多个变量融合成一个变量,使得变量的个数大大降低,并且能够将有相关关系的几个指标合并为1个,消除变量之间的多重共线性。
举例如下,x1,x2,x3这三个自变量中,只有x1的变化能解释y1的变化:主成分分析主要...
主成分分析(PCA)的Python实现
weixin_42565558的博客
03-06
1262
一句话概括主成分分析
主成分分析是采取一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关。
这种将把多个变量化为少数几个互相无关的综合变量的统计分析方法就叫做主成分分析或主分量分析。
主成分分析步骤
对原始数据进行标准化处理
计算标准化数据协方差矩阵
求协方差矩阵的特征值和特征向量
将特征值按照从大到小的顺序排序,选择其中...
pca降维python实例_主成分分析PCA数据降维原理及python应用(葡萄酒案例分析)
weixin_39703926的博客
12-03
272
主成分分析(PCA)——以葡萄酒数据集分类为例1、认识PCA(1)简介数据降维的一种方法是通过特征提取实现,主成分分析PCA就是一种无监督数据压缩技术,广泛应用于特征提取和降维。
换言之,PCA技术就是在高维数据中寻找最大方差的方向,将这个方向投影到维度更小的新子空间。
例如,将原数据向量x,通过构建维变换矩阵W,映射到新的k维子空间,通常()。
原数据d维向量空间经过,得到新的k维向量空间...
PCA——python实现
yaonuliazzz的博客
05-30
478
文章目录PCA原理代码实现(python)
PCA原理
pca主要是通过计算矩阵的特征向量,利用累计贡献率大于指定数量级时(本文里取95%)对应的特征值构成的矩阵,与原矩阵做矩阵乘法,达到降维的目的。
代码实现(python)
下面额我针对一组17*8的数据集进行的pca代码实现,数据集稍后会上传,可以自行下载。
#coding:UTF-8
importnumpyasnp
importcs...
PCA主成分分析---降维(python调用实现)
u012211422的博客
08-30
8100
使用鸢尾花数据集,原始特征向量为4,现在使用python库降维为2维
importmatplotlib.pyplotasplt#加载matplotlib用于数据的可视化
fromsklearn.decompositionimportPCA#加载PCA算法包
fromsklearn.datasetsimportload_iris
data=load_iris...
python实现PCA(主成分分析)降维
不忘初心,方得始终
04-02
1万+
PCA复杂的原理在这就不说了,可以去网上看看相关资料,说的都很好,在这我主要说一下实现的过程。
PCA计算过程:
第一步:求均值。
求平均值,然后对于所有的样例,都减去对应的均值
第二步:求特征协方差矩阵
第三步:求协方差的特征值和特征向量
第四步:将特征值按照从大到小的顺序排序,选择其中最大的k个,然后将其对应的k个特征向量分别作为列向量组成特征向量矩阵.
第五
主成分分析SPSS、python实例分析
weixin_33894640的博客
03-09
6448
今天,在西瓜书上看到了主成分分析法,之前建模有接触过但是理解不够深刻,今天再次和这一位老朋友聊聊。
主成分分析(PrincipalComponentAnalysis,PCA),是一种统计方法。
通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多...
主成分分析法案例
05-31
主成分分析法案例讲解Ppt,多变量问题是经常会遇到的。
变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。
python实现pca(主成分分析)降维处理
qq_37760746的博客
11-21
360
python实现pca(主成分分析)降维处理
importnumpyasnp
fromsklearn.decompositionimportPCA
importsys
importmatplotlib.pyplotasplt
frommpl_toolkits.mplot3dimportAxes3D
defmain():
#testdata
#mat=[[-1,-1,0,2,1],[2,0,0,-1,-1],[2,0,1,1,0]]
file1=
Python实现主成分分析(PCA)降维
qq_36108664的博客
08-07
9177
主成分分析是我十分喜欢的一个将为丰富,在之前学习并总结过其matlab的实现方法。
python主成分分析实战案例
huozi07的专栏
04-29
6867
PCA主成分分析主要用于数据降维。
由一系列特征组成的多维向量,其中某些元素本身没有区分性,或者彼此区分不大。
此时,如果用它做特征区分,相似元素贡献会比较少。
我们目的是找到那些变化大的元素,即方差较大的维,去除那些变化不大的维度。
具体理论参考:http://www.ams.org/samplings/feature-column/fcarc-svd
案例示例:
#-*-coding
【python实现Hill加密】最详细的Hill加密讲解,文中附代码
qq_43115981的博客
01-01
789
前言
最近在准备网络安全期末考试,复习到Hill加密时,想起来之前做的编程作业,没有学会Hill加密求解密秘钥,今天琢磨出来了,然后准备把整个Hill加密过程清晰地整理一下,供大家参考学习。
Python爬虫实战(六):对某一关键词的百度指数数据的爬取
最新发布
韩国麦当劳的博客
01-04
186
追风赶月莫停留,平芜尽处是春山。
文章目录追风赶月莫停留,平芜尽处是春山。
一、网页分析二、接口分析url分析返回数据分析三、编写代码获取数据解密完整代码
终于有时间来更新我的博客了!!
这次咱们来搞一搞百度指数的爬取。
一、网页分析
咱们以爬虫为关键词,进行百度指数的分析
然后F12开发者模式,然后刷新,依次点击Network->XHR->index?area=0&word=...->Preview,然后你就会看到
这些都是个啥啊,显然data里面是加密了的,头秃。
10张思维导图,一文吃透Pandas技术细节
Python学习与数据挖掘
12-29
5700
哈喽,大家好。
今天Python中非常重要的一个库——Pandas。
Pandas是一个基于Numpy的强大工具集,用于数据处理、分析、挖掘和可视化。
我整理一张Pandas知识结构的思维导图,文末回复关键词获取。
下面我们用10个小节来学习Pandas,过程简洁,思路清楚。
1.数据结构Pandas中有两种数据结构Series和DataFrame。
Series用一维数组,可以存储不同类型的数据。
>>> import pandas as
©️2021CSDN
皮肤主题:博客之星2020
设计师:CY__
返回首页
悟乙己
CSDN认证博客专家
CSDN认证企业博客
码龄7年
人工智能领域优质创作者
351
原创
2382
周排名
153
总排名
692万+
访问
等级
3万+
积分
8641
粉丝
3012
获赞
1268
评论
1万+
收藏
私信
关注
作者简介
之后文章会发在知乎:https://www.zhihu.com/people/mattzheng7——微信公众号:素质云笔记
热门文章
R语言︱list用法、批量读取、写出数据时的用法
174023
k-means+python︱scikit-learn中的KMeans聚类实现(+MiniBatchKMeans)
166913
R语言数据集合并、数据增减、不等长合并
155261
R语言与格式、日期格式、格式转化
124448
PySpark︱DataFrame操作指南:增/删/改/查/合并/统计与数据处理
120485
分类专栏
付费-智能写作专栏
28篇
营销科学
37篇
Python︱基础与数据处理
27篇
streamlit
7篇
NLP︱R+python
61篇
NLP︱相关技术跟踪
22篇
机器学习︱R+python
78篇
个性化推荐
18篇
Tensorflow+Keras
18篇
知识图谱(KG/Neo4j)
16篇
R︱数据操作与清洗
36篇
R的数据操作与清洗
26篇
R语言与自然语言处理
21篇
R︱精准营销
25篇
NVIDIA-RAPID
4篇
机器学习平台Apple.Turicreate
7篇
图像︱相关技术跟踪与商业变现
23篇
图像opencv及图像基础技术
9篇
图像︱caffe
19篇
个性化推荐与检索
8篇
多模态︱相关技术跟踪
1篇
大数据、并行计算&R
15篇
R︱金融风险管控
10篇
R︱可视化
10篇
SPSSModeler&SPSS
1篇
Eviews8.0&9.0
3篇
SAS
5篇
docker/linux/API部署
7篇
python︱爬虫
2篇
八爪鱼采集器
1篇
图像︱质量评估与检索
1篇
最新评论
因果推断与反事实预测——利用DML进行价格弹性计算(二十三)
小小manor:
已投五⭐~这是我的投票链接:https://bbs.csdn.net/topics/603955366
感谢回投~
因果推断与反事实预测——利用DML进行价格弹性计算(二十三)
编程界明世隐:
文章写的真不错啊,我学习了不少
已评五星,期待互评https://bbs.csdn.net/topics/603955521
智能营销增益(UpliftModeling)模型——模型介绍(一)
悟乙己:
是一样的,T-learner=twomodel
因果推断与反事实预测——盒马KDD2021的一篇论文(二十三)
崇尚学技术的科班人:
已支持,https://bbs.csdn.net/topics/603955721
智能营销增益(UpliftModeling)模型——模型介绍(一)
再见饭特稀:
您好,请教下元学习中的T-learner和S-learner和差分响应中的Twomodel、one-model看起来是一个东西?有啥区别?还是只是不同的叫法而已
您愿意向朋友推荐“博客详情页”吗?
强烈不推荐
不推荐
一般般
推荐
强烈推荐
提交
最新文章
因果推断与反事实预测——利用DML进行价格弹性计算(二十三)
因果推断与反事实预测——盒马KDD2021的一篇论文(二十三)
Google因果推断的CausalImpact贝叶斯结构时间序列模型(二十二)
2022年2篇
2021年75篇
2020年25篇
2019年15篇
2018年40篇
2017年117篇
2016年139篇
2015年3篇
目录
目录
分类专栏
付费-智能写作专栏
28篇
营销科学
37篇
Python︱基础与数据处理
27篇
streamlit
7篇
NLP︱R+python
61篇
NLP︱相关技术跟踪
22篇
机器学习︱R+python
78篇
个性化推荐
18篇
Tensorflow+Keras
18篇
知识图谱(KG/Neo4j)
16篇
R︱数据操作与清洗
36篇
R的数据操作与清洗
26篇
R语言与自然语言处理
21篇
R︱精准营销
25篇
NVIDIA-RAPID
4篇
机器学习平台Apple.Turicreate
7篇
图像︱相关技术跟踪与商业变现
23篇
图像opencv及图像基础技术
9篇
图像︱caffe
19篇
个性化推荐与检索
8篇
多模态︱相关技术跟踪
1篇
大数据、并行计算&R
15篇
R︱金融风险管控
10篇
R︱可视化
10篇
SPSSModeler&SPSS
1篇
Eviews8.0&9.0
3篇
SAS
5篇
docker/linux/API部署
7篇
python︱爬虫
2篇
八爪鱼采集器
1篇
图像︱质量评估与检索
1篇
实付元
使用余额支付
点击重新获取
扫码支付
钱包余额
0
抵扣说明:
1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。
余额充值
延伸文章資訊
- 1【機器學習演算法實現】主成分分析(PCA)——基於python numpy
【機器學習演算法實現】主成分分析(PCA)——基於python numpy. @author:wepon @blog:http://blog.csdn.net/u012162613/articl...
- 2Python數模筆記-Sklearn(3)主成分分析 - IT人
主成分分析(Principal Components Analysis,PCA)是一種資料降維技術,通過正交變換將一組相關性高的變數轉換為較少的彼此獨立、互不相關的變數, ...
- 3主成分分析(PCA)原理詳解 - Medium
PCA(Principal Component Analysis),即主成分分析方法,是一種使用最廣泛的數據降維算法。PCA的主要思想是將n維特徵映射到k維上,這k維是全新的正交 ...
- 4python_主成分分析(PCA)降維- IT閱讀
python_主成分分析(PCA)降維 ... 主成分分析(principal component analysis)是一種常見的資料降維方法,其目的是在“資訊”損失較小的前提下,將高維的資料 ...
- 5主成分分析PCA数据降维原理及python应用(葡萄酒案例分析)
目录主成分分析(PCA)——以葡萄酒数据集分类为例1、认识PCA (1)简介(2)方法步骤2、提取主成分3、主成分方差可视化4、特征变换5、数据分类结果6、 ...