5  FDR校正

5.1 什么是FDR校正?

FDR (false discovery rate),即校正后的P值,中文一般译作错误发现率。在转录组分析中,主要用在差异表达基因的分析中,控制最终分析结果中,假阳性结果的比例。

为什么要用FDR?

在转录组分析中,如何确定某个转录本在不同的样品中表达量是否有差异是分析的核心内容之一。一般来说,我们认为,不同样品中,表达量差异在两倍以上的转录本,是具有表达差异的转录本。为了判断两个样品之间的表达量差异究竟是由于各种误差导致的还是本质差异,我们需要根据所有基因在这两个样本中的表达量数据进行假设检验。常用的假设检验方法有t-检验、卡方检验等。很多刚接触转录组分析的人可能会有这样一个疑问,一个转录本是不是差异表达,做完假设检验看P-value不就可以了么?为什么会有FDR这样一个新的概念出现?这是因为转录组分析并不是针对一个或几个转录本进行分析,转录组分析的是一个样品中所转录表达的所有转录本。所以,一个样品当中有多少转录本,就需要对多少转录本进行假设检验。这会导致一个很严重的问题,当数据量很大时,在单次假设检验中较低的假阳性比例会累积到一个非常惊人的程度。

5.2 分析前的数据准备

一列P值

5.3 R语言怎么做FDR校正

p.adjust(
  c(0.01,0.05,0.01,0.05,0.03,0.02),  # P值列表
  method ="BH"                       # FDR校正的方法
)
# [1] 0.030 0.050 0.030 0.050 0.045 0.040

5.4 BioLadder生信云平台在线做FDR校正

不想写代码?可以用BioLadder生信云平台在线做FDR校正。

网址:https://www.bioladder.cn/web/#/chart/58