KEGG富集分析原理

富集分析概念

  • 基因功能注释: 通过基因的CDS或氨基酸序列与数据库(Nr)做系列比对,找出在数据库中与其最相似的,提取其功能注释信息作为该基因的功能注释

用户登录名称 yjp@1858447101409070.onaliyun.com
AccessKey ID LTAI4Fra4zyQQSnn4geVNG4v
AccessKeySecret 1aJXo4atnDXPEYfNX1p6lrZJLK1a4y

  1. 933个差异基因可以在KEGG里面注释到,ko_ID是map的id
  2. gene 这一栏说明的是拟南芥3W个基因里面注释到pathway里面的基因数目。
  3. 7085是背景基因集。背景基因集就是拟南芥全部的3w个基因,可以在KEGG数据库注释到的基因。

我主要想只要:差异基因里面最主要参与哪个功能。

  • 看参与pathway的DEG,缺点是不准确,差异基因最多的通路不是我关心的通路。
  • 因此需要富集
    通路富集的富集因子,表示差异基因中注释到的某通路的基因比例与所有基因中注释到该通路的基因比例的比值。

什么是显著性

理解为评价指标,用超几何分布检验计算出来。

文章主要用显著性指标表示。通路富集的富集因子,用的不广泛。

在线富集平台

  • KOBAS