科研星球

Origin 如何做主成分分析?

最早了解到主成分分析(Principal Component Analysis,PCA)是在一位师兄的毕业答辩上,当时听得是云里雾里,一头雾水。其实,主成分分析是因子分析的一种常用方法,主要目的是为了减少变量数目,也就是降维。


在高通量测序中,主要基于基因表达量、种群丰度等进行样本的聚类,下图是一篇客户文章的基于表达量的PCA结果。


下载.jpeg

(Plant biotechnology journal, 2018)

 

那么该如何进行主成分分析呢?今天为大家介绍如何用Origin进行分析并完成散点图的绘制。

 


数据准备


 

本文所用的数据是OmicShare PCA分析工具的示例文件(如下图),大家可随意下载练习(http://www.omicshare.com/tools/Home/Soft/pca)。

 

下载 (1).jpeg


示例为6个样本的1300多个基因的表达量数据,接下来需要做得是把每个样本的对应的1300多个数据用2个数据表示,降到2维后,就可用二维的散点图展示。


这里每个基因的名称视作1个变量,因此需要对数据进行手动转置,为了分组着色,在前面加1列分组数据,如下图(Sheet1 →Sheet3)。然后打开Origin,将数据粘贴到Origin的表格中。


640.gif


对于这一点OmicShare的 PCA工具就显得智能和方便多了,直接上传数据,点提交任务就好啦。

 


分析作图


 

点窗口右侧的Apps,在弹出的窗口中点今天要用的PCA插件。


下载 (2).jpeg

 

然后选择输入数据(Input data),具体方法如下图,注意这里的数据添加小技巧。

 

640 (1).gif

 

在绘图设置中这里选2D的散点图,如下图,当然你也可以选3D的散点图(使用3个主成分),点OK 即可完成分析和作图。如果样本较多,也可以选择显示置信区间椭圆(Show Confidence Ellipse)。

下载 (3).jpeg

 

双击Score Plot中的图表,放大散点图,然后就可以对图表进行个性化调整,比如改变标记的形状、颜色、大小,显示数据标签等。

 

640 (2).gif

 

最终的的效果如下:


下载 (4).jpeg

相关推荐:

*软件资源获取:2019b for Win

*汇总!Origin Pro 零基础资源教程技巧汇总!

*Origin 2019b win 安装教程

*OriginPro 如何把软件界面变成中文?

*如何使用Origin轻松绘制3D柱形图?

*如何使用Origin轻松绘制雷达图?

*如何用Origin制作矩阵工作表

*如何用Origin绘制三维散点图

*Origin 2020 85节 最中文全视频课程

*更多Origin相关内容……



没有账号?