GWAS中的赢家诅咒 Winner’s curse
GWAS中的赢家诅咒是指遗传效应的大小由于GWAS中的筛选过程(通过全基因组显著阈值筛选lead SNP)而被系统性地过高估计。
赢家诅咒本用来指代在拍卖中类似的现象。即使一件拍卖品对所有买家来说都有相同的价值(出价是无偏的),最后拍得物品的赢家很可能过高估计了拍卖偏的内在价值。类比于GWAS,lead SNP即为赢家,而它的效应量可能过高估计了真实的遗传效应。
赢家诅咒的校正 WC correction
假设观察到的的近似分布为:
的一个例子
- $c$ : 显著性阈值对应的Z分数
上面的式子等价于
的一个例子
在通过阈值筛选的情况下,的近似抽样分布(实际上为一个截断正态分布 truncated normal distribution)为:
其中
: 标准正态分布的概率密度函数
: 标准正态分布的累积分布函数
从以上的近似抽样分布可以得到,筛选出来的SNP的效应量的期望分布为:
is biased.
- 偏差的大小由
, SE
, 以及用于筛选的显著性阈值决定.
公式推导可以参考 Ghosh, A., Zou, F., & Wright, F. A. (2008). Estimating odds ratios in genome scans: an approximate conditional likelihood approach. The American Journal of Human Genetics, 82(5), 1064-1074. 中的Appendix A
用这个式子便可以对效应量进行赢家诅咒的校正。
winnerscurse R包
可以使用这个R包进行赢家诅咒的校正。
https://amandaforde.github.io/winnerscurse/articles/winners_curse_methods.html
参考
- Bazerman, M. H., & Samuelson, W. F. (1983). I won the auction but don’t want the prize. Journal of conflict resolution, 27(4), 618-634.
- Göring, H. H., Terwilliger, J. D., & Blangero, J. (2001). Large upward bias in estimation of locus-specific effects from genomewide scans. The American Journal of Human Genetics, 69(6), 1357-1369.
- Zhong, H., & Prentice, R. L. (2008). Bias-reduced estimators and confidence intervals for odds ratios in genome-wide association studies. Biostatistics, 9(4), 621-634.
- Ghosh, A., Zou, F., & Wright, F. A. (2008). Estimating odds ratios in genome scans: an approximate conditional likelihood approach. The American Journal of Human Genetics, 82(5), 1064-1074.
Also see reference: https://amandaforde.github.io/winnerscurse/articles/winners_curse_methods.html