多基因风险分数 PRS( Polygenic risk score)系列之六:metaGRS介绍

目录

  1. PRS回顾
  2. 为什么要构建metaGRS
  3. metaGRS构建方法
  4. 总结
  5. 参考

回顾

  1. GWASLab:多基因风险分数 PRS( Polygenic risk score)系列之一:概念入门
  2. GWASLab:多基因风险分数 PRS( Polygenic risk score)系列之二:使用PLINK计算PRS(C+T方法)
  3. GWASLab:多基因风险分数 PRS( Polygenic risk score)系列之三:使用PRSice计算PRS(C+T方法)
  4. ldpred2 (预留链接)
  5. prs-cs(预留链接)

为什么要构建metaGRS

以往的PRS研究中,PRS模型通常以单一的GWAS概括性数据为基础进行计算,但此方法往往不能达到较高的预测能力,主要是因为

  1. 有限的样本量
  2. 目标表型较为显著的异质性
  3. 对基因组覆盖的不完全
  4. 基因定型与插补存在较大不确定性

等原因。

在存在上述问题的情况下使用单一PRS进行预测会降低准确度,为了解决以上描述的问题,Michael Inouye等人最早在冠状动脉疾病(CAD)的预测中,引入了metaGRS的概念,类似于meta分析,meGRS将多个GRS进行合并得到metaGRS,以提升其风险预测能力。

metaGRS构建方法

本文以 Abraham,G等人在2019年发表的论文为例,简要介绍metaGRS的构建方法:

第一步:常规的单一PRS的计算

第二步:使用弹性网络来构建metaGRS,具体步骤如下所示

例如,Abraham,G等人构建的对IS缺血性中风的metaGRS中,纳入了如下的GRS,包括了AS(所有中风),以及中风的各个亚型(IS, SVS, LAS, CES),以及各个中风的风险因子(例如血压,BMI,2型糖尿病,冠状动脉疾病等)的GRS

注:弹性网络 elastic net:

在损失函数中同时加入L1 (Lasso回顾)与L2(Ridge回归)的正则项:

该计算可以通过R包glmnet实现

https://cran.r-project.org/web/packages/glmnet/index.html

第三步:最后和单一PRS时一样,需要使用独立样本对metaGRS进行验证


总结

目前使用metaGRS的研究还比较少,且集中于特定的表型(CAD和IS),但可以预计随着PRS研究数量不断增加,在未来metaGRS的应用也会随之增加。

参考

Inouye, Michael, et al. “Genomic risk prediction of coronary artery disease in 480,000 adults: implications for primary prevention.” Journal of the American College of Cardiology 72.16 (2018): 1883-1893.

Abraham, G., Malik, R., Yonova-Doing, E. et al. Genomic risk score offers predictive performance comparable to clinical risk factors for ischaemic stroke. Nat Commun 10, 5819 (2019). https://doi.org/10.1038/s41467-019-13848-1

Friedman, Jerome, Trevor Hastie, and Rob Tibshirani. “glmnet: Lasso and elastic-net regularized generalized linear models.” R package version 1.4 (2009): 1-24.

《多基因风险分数 PRS( Polygenic risk score)系列之六:metaGRS介绍》有4个想法

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

您正在使用您的 WordPress.com 账号评论。 注销 /  更改 )

Facebook photo

您正在使用您的 Facebook 账号评论。 注销 /  更改 )

Connecting to %s