网络药理学:7、零基础复现一篇生信文章:对交集靶点做GO、KEGG标注和富集分析(微生信在线作图、logP和p值在线转化)、DAVID、metascape数据库使用教程

前言

数据库网址

本文复现论文步骤

对交集靶点做GO和KEGG的标注和富集分析,对应步骤【一】和【和】

一、DAVID数据库下载GO和KEGG所需数据集

见如下文章:

https://zhuanlan.zhihu.com/p/657096321

该文章只提了如何下载KEGG数据集,下载GO数据集的话,则是如下:

下载下来分别是GO的三个数据集文件。

二、GO和KEGG富集分析

推荐视频(必看!)

在进行该文章复现之前,希望大家能对GO和KEGG富集分析有一个大概的了解,推荐把以下前置知识看完,总共也才用时十几分钟。

B站:https://www.bilibili.com/video/BV16GpmeSEkD/,主要把什么是富集分析,为什么需要富集分析,以及什么是GO和KEGG富集分析讲清楚了。

up主补充在评论区的知识点:P值大小可以简单的理解为可信度的高低,p值越小可信度越高。在本次的例子中,P值越小,我们就越有把握说某个基因是差异基因;p值越大,结果不具有可信度,就没把握说某个基因是差异基因。

因此在统计学上通常以p=0.05为标准,小于0.05结果可信度高,大于0.05的数据一般用不了

B站:https://www.bilibili.com/video/BV1zF41197XB/,这个讲了常见GO富集分析的结果图有哪些,怎么看结果图(譬如横纵坐标有什么意义),还讲了如何快速从Log P转为P值,以及如何利用微生信在线做图。

但是up主讲错了一点,就是metascape可以勾选多条条件,譬如把Go的CC、BP、MF都勾选上,然后去富集分析。

做出来的图长这样:

B站:https://www.bilibili.com/video/BV1HU4y1m7Vu/,详细讲解了GO数据集的各个数值代表的意义。

B站:https://www.bilibili.com/video/BV1Fg411n7hx/,讲了怎麽从metascape下载KEGG的数据集。

其他补充:Fold Enrichment≈富集因子≈Rich Factor。而FDR是另一种指标,一般KEGG气泡图的横坐标是前者。

B站:https://www.bilibili.com/video/BV1zG411A7kG/,教你KEGG富集分析后如何挑选核心通路,进而挑选核心靶点。

如下视频对于小白不是很推荐,不是说视频不好,而是初学者暂时用不到:

R代码

待更