前言
受推上业内大佬启发,本文将总结对于初学GWAS有较大帮助的综述文章,这些文章多由领域内的leading scientist执笔,引用上千,有较大影响力。对于想快速了解十几年来GWAS发展的同学来说,是不可错过的文章。本文基于Abdel Abdellaoui的推文以及作者个人经验。如有其他推荐,欢迎补充。
综述推荐与导读
第一篇
Hirschhorn, J. N., & Daly, M. J. (2005). Genome-wide association studies for common diseases and complex traits. Nature reviews genetics, 6(2), 95-108.
https://www.nature.com/articles/nrg1521
首先介绍最早的关于GWAS介绍的Review之一,于GWAS刚刚萌芽的2005年发表,那时人类基因组测序刚刚完成,dbSNP开始建立,Hapmap项目也开始启动,这些项目奠定了GWAS研究发展的基础。这篇综述该介绍了GWAS相比于传统遗传学方法的优缺点,当时可用的测序高通量测序方法,以及GWAS研究中需要注意的核心问题等。可以说是将传统遗传学与现代基因组学衔接的一篇开山之作之一,值得一读。
个人推荐指数:10
第二篇
Balding, D. J. (2006). A tutorial on statistical methods for population association studies. Nature reviews genetics, 7(10), 781-791.
https://www.nature.com/articles/nrg1916
该综述介绍了早期GWAS研究中可用的的统计学工具。简要的介绍了GWAS研究核心的遗传学与统计学原理 ,并简要梳理了GWAS各个环节上会用到的基础的统计学原理与工具。该文章对于初学者理解GWAS的检验原理有很大帮助,后续的GWAS检验方法基本是基于这些基本原理的扩展与补充,万变不离其宗。
个人推荐指数:8
第三篇
McCarthy, M. I., Abecasis, G. R., Cardon, L. R., Goldstein, D. B., Little, J., Ioannidis, J., & Hirschhorn, J. N. (2008). Genome-wide association studies for complex traits: consensus, uncertainty and challenges. Nature reviews genetics, 9(5), 356-369.
https://www.nature.com/articles/nrg2344
该文发表于2008年,正是第一波GWAS的热潮结果发表后的时期,文中基于第一波GWAS的文章,总结了当时GWAS的研究现状,着重梳理了当时GWAS研究的不足与挑战,为接下来的GWAS研究指出了方向。
个人推荐指数:9
第四篇
Manolio, T. A., Collins, F. S., Cox, N. J., Goldstein, D. B., Hindorff, L. A., Hunter, D. J., … & Visscher, P. M. (2009). Finding the missing heritability of complex diseases. Nature, 461 (7265), 747-753.
https://www.nature.com/articles/nature08494
寻找复杂疾病的“丢失的遗传力“自始至终都是GWAS研究中的一个热门话题,该文总结了丢失的遗传力可能的来源并给出了可能研究的方法。是一篇较有影响力的文章。
个人推荐指数:8
第五篇
Ioannidis, J., Thomas, G., & Daly, M. J. (2009). Validating, augmenting and refining genome-wide association signals. Nature Reviews Genetics, 10(5), 318-329.
https://www.nature.com/articles/nrg2544
该文发表于2009,当时GWAS研究已经发现大量的与疾病关联的位点,但这些位点大多都只是真正引起功能改变的因果变异的marker,如何确定在大量的关联中找出因果变异变成了一个不可回避的问题。该文章总结了可以提高GWAS结果可靠性与寻找因果变异的早期方法。
个人推荐指数:7
第六篇
Marchini, J., & Howie, B. (2010). Genotype imputation for genome-wide association studies. Nature Reviews Genetics, 11(7), 499-511.
https://www.nature.com/articles/nrg2796
该文对基因型插补(genotype imputation)方法进行了总结,介绍了相关的基本概念与常用指标,该文对于理解基因型插补的理论基础有较大帮助。
个人推荐指数:6
第七篇
Price, A. L., Zaitlen, N. A., Reich, D., & Patterson, N. (2010). New approaches to population stratification in genome-wide association studies. Nature reviews genetics, 11(7), 459-463.
https://www.nature.com/articles/nrg2813
群体分层一直是GWAS研究中一个必须要妥善应对的问题,该文总结了对于群体分层的处理方法。文章较短,但梳理得简洁明了,对于理解 λgc,PCA,线性混合模型等帮助很大。推荐阅读。
个人推荐指数:9
第八篇
Visscher, P. M., Wray, N. R., Zhang, Q., Sklar, P., McCarthy, M. I., Brown, M. A., & Yang, J. (2017). 10 years of GWAS discovery: biology, function, and translation. The American Journal of Human Genetics, 101(1), 5-22.
https://www.sciencedirect.com/science/article/pii/S0002929717302409?via%3Dihub
对GWAS问世10年来GWAS研究发展与成果的总结,该文介绍了GWAS的科学基础,并基于大量GWAS研究总结出了一些普遍的结论,同时举出了三个被广泛研究的复杂疾病的典型例子。
个人推荐指数:8
第九篇
Pasaniuc, B., & Price, A. L. (2017). Dissecting the genetics of complex traits using summary association statistics. Nature reviews genetics, 18(2), 117-127.
https://www.nature.com/articles/nrg.2016.142
该文发表于2017年,随着GWAS的summary statistics不断积累,使用summary statistics的下游分析方法也如雨后春笋般出现,该文总结了使用GWAS summary statistics来对疾病分析的post-GWAS方法,例如gene-based analysis,fine-mapping,以及PRS等。
个人推荐指数:8
第十篇
Tam, V., Patel, N., Turcotte, M., Bossé, Y., Paré, G., & Meyre, D. (2019). Benefits and limitations of genome-wide association studies. Nature Reviews Genetics, 20(8), 467-484.
https://www.nature.com/articles/s41576-019-0127-1
该文总结了GWAS研究的优势与不足,对于加深对GWAS的理解与了解未来发展方向有较大帮助。
个人推荐指数:7
第十一篇
Uffelmann, E., Huang, Q. Q., Munung, N. S., De Vries, J., Okada, Y., Martin, A. R., … & Posthuma, D. (2021). Genome-wide association studies. Nature Reviews Methods Primers, 1(1), 1-21.
https://www.nature.com/articles/s43586-021-00056-9
发表于2021年,目前最新的GWAS完整流程讲解,总结较为全面,可以查漏补缺,值得一读。
个人推荐指数:9