目前组学的数据越来越多。其中代谢组学也是其中一个热点。关于代谢组学的相关分析目前用的最多的还是metaboAnalyst (https://www.metaboanalyst.ca/) 。之前这个数据库一直都是4.0版本。最近刚刚更新了5.0的版本。趁着刚刚更新,我们也就来顺带的介绍这个数据库吧。
PS: 从18到现在被引次数就到了1700。可见这个数据库的权威以及研究代谢的人多呀
关于metaboAnalyst。其主要是基于作者开放的一个R语言包metaboAnalystR来进行分析了。如果有相关R语言操作基础的。也是可以使用这个包进行分析的。
数据库主要功能介绍
目前作者把代谢组学的数据分析基于不同的数据类型和分析目的分成了13个功能。我们可以基于这自己的数据类型和分析目的来选择不同的功能即可。
同时由于这个数据库的分析还是基于R语言来的。我们可以在分析的时候。可以选择显示R语言代码。这样在分析完之后,可以包括相关的R代码。方便下次的重复。
原始数据分析
如果我们手里获得的是原始数据,例如从GEO数据库里面下载的数据,那就需要对这些原始数据进行注释才能进行后续的分析。
首先点击最上面的原始数据分析过程。我们就可以进入到上传数据的界面了。
对于原始数据的上传的文件。主要包括一个原始检测数据(这个数据要求以zip压缩后的数据)。可以一个是对于这些检测样本的注释数据(每一个样本都是什么case/control这样的信息)。
这里我们用数据库自带的示例数据来进行分析。数据上传完之后,点击submit。就可以看到具体数据的注释信息了。同时,作者也提醒了,对于上传的时候可能需要一些时间,所以一定要耐心的。
下面就是对于数据分析的一些参数设置了。默认的设置已经设置好了。对于不熟悉的我们,其实点击下一步即可。最后,我们可以或者对于这些原始数据的注释的结果。同时对于所有样本的PCA可视化结果。
最后,我们可以下载所有的注释后的的结果和图,同时也可以选择开始新的分析来进行后续的富集以及其他分析。
例如我们想要对这些代谢物质进行富集分析。可以直接点击富集分析即可。通过富集分析,我们就可以得到相关代谢物的功能是什么了。
同时如果基于代谢组学的数据来进行诊断标志物的选择,也可以直接点击biomarker analysis的。这样也可以或者具体ROC曲线的结果。