GWAS中的赢家诅咒与其校正 Winner’s curse correction

  1. GWAS中的赢家诅咒 Winner’s curse
  2. 赢家诅咒的校正 WC correction
  3. winnerscurse R包
  4. 参考

GWAS中的赢家诅咒 Winner’s curse

GWAS中的赢家诅咒是指遗传效应的大小由于GWAS中的筛选过程(通过全基因组显著阈值筛选lead SNP)而被系统性地过高估计

赢家诅咒本用来指代在拍卖中类似的现象。即使一件拍卖品对所有买家来说都有相同的价值(出价是无偏的),最后拍得物品的赢家很可能过高估计了拍卖偏的内在价值。类比于GWAS,lead SNP即为赢家,而它的效应量可能过高估计了真实的遗传效应。
image

赢家诅咒的校正 WC correction

假设观察到的\beta_{Observed}的近似分布为:

\beta_{Observed} \sim N(\beta_{True},\sigma^2)

\beta_{Observed}的一个例子
image

  • $c$ : 显著性阈值对应的Z分数

上面的式子等价于

{{\beta_{Observed} - \beta_{True}}\over{\sigma}} \sim N(0,1)

{{\beta_{Observed} - \beta_{True}}\over{\sigma}}的一个例子
image

在通过阈值筛选的情况下,\beta_{Observed}的近似抽样分布(实际上为一个截断正态分布 truncated normal distribution)为:

f(x,\beta_{True}) ={{1}\over{\sigma}} {{\phi({{{x - \beta_{True}}\over{\sigma}}})} \over {\Phi({{{\beta_{True}}\over{\sigma}}-c}) + \Phi({{{-\beta_{True}}\over{\sigma}}-c})}}

其中

|{{x}\over{\sigma}}|\geq c

  • \phi(x) : 标准正态分布的概率密度函数
  • \Phi(x) : 标准正态分布的累积分布函数

从以上的近似抽样分布可以得到,筛选出来的SNP的效应量的期望分布为:

E(\beta_{Observed}; \beta_{True}) = \beta_{True} + \sigma {{\phi({{{\beta_{True}}\over{\sigma}}-c}) - \phi({{{-\beta_{True}}\over{\sigma}}-c})} \over {\Phi({{{\beta_{True}}\over{\sigma}}-c}) + \Phi({{{-\beta_{True}}\over{\sigma}}-c})}}

  • \beta_{Observed} is biased.
  • 偏差的大小由 \beta_{True}, SE \sigma, 以及用于筛选的显著性阈值决定.

公式推导可以参考 Ghosh, A., Zou, F., & Wright, F. A. (2008). Estimating odds ratios in genome scans: an approximate conditional likelihood approach. The American Journal of Human Genetics, 82(5), 1064-1074. 中的Appendix A

用这个式子便可以对效应量进行赢家诅咒的校正。

winnerscurse R包

可以使用这个R包进行赢家诅咒的校正。

https://amandaforde.github.io/winnerscurse/articles/winners_curse_methods.html

参考

  • Bazerman, M. H., & Samuelson, W. F. (1983). I won the auction but don’t want the prize. Journal of conflict resolution, 27(4), 618-634.
  • Göring, H. H., Terwilliger, J. D., & Blangero, J. (2001). Large upward bias in estimation of locus-specific effects from genomewide scans. The American Journal of Human Genetics, 69(6), 1357-1369.
  • Zhong, H., & Prentice, R. L. (2008). Bias-reduced estimators and confidence intervals for odds ratios in genome-wide association studies. Biostatistics, 9(4), 621-634.
  • Ghosh, A., Zou, F., & Wright, F. A. (2008). Estimating odds ratios in genome scans: an approximate conditional likelihood approach. The American Journal of Human Genetics, 82(5), 1064-1074.

Also see reference: https://amandaforde.github.io/winnerscurse/articles/winners_curse_methods.html

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

您正在使用您的 WordPress.com 账号评论。 注销 /  更改 )

Twitter picture

您正在使用您的 Twitter 账号评论。 注销 /  更改 )

Facebook photo

您正在使用您的 Facebook 账号评论。 注销 /  更改 )

Connecting to %s