背景回顾:
LD score 回归: 连锁不平衡分数回归 LD score regression
双变量/跨性状LD分数回归(Bivariate/Cross-trait LD Score regression)
简介与原理:
该方法使用GWAS的概括性数据来估计一对表型的遗传相关。该方法基于以下的事实:GWAS检验中,对一个SNP效应量的估计通常也会包含与该SNP成LD的其他SNP的效应,也就是说一个与其他SNP成高LD的SNP,通常也会有更高的卡方检验量。而当我们把卡方检验量替换为,来自两个相关表型的GWAS的Z分数的乘积时,这个事实依然存在。所以基于此,我们可以将单表型的LD分数回归扩展成如下所示的 双变量/跨性状LD分数回归 :

详细推导见:
Bulik-Sullivan, B., Finucane, H., Anttila, V. et al. An atlas of genetic correlations across human diseases and traits. Nat Genet 47, 1236–1241 (2015). https://doi.org/10.1038/ng.3406
下面简单介绍使用方法:
数据下载,数据清理等步骤与 单表型的LD分数回归基本相同,详见 连锁不平衡分数回归 LD score regression
我们只需要将 单表型的LD分数 中 -h2 的选项改为 -rg, 再加上要估计遗传相关的两个表型的数据清理后的文件即可:
ldsc.py \
--rg scz.sumstats.gz,bip.sumstats.gz \
--ref-ld-chr eur_w_ld_chr/ \
--w-ld-chr eur_w_ld_chr/ \
--out scz_bip
--rg
:计算遗传相关性 (genetic correlation),参数为上一步处理好的数据文件名
--ref-ld-chr
:使用的按染色体号分类的LD score文件名,参数为LD score文件所在文件夹的路径。默认情况下ldsc会在文件名末尾添加染色体号,例如 --ref-ld-chr eur_w_ld_chr/
的意思就是使用 eur_w_ld_chr/1.l2.ldscore ... eur_w_ld_chr/22.l2.ldscore
这些文件
。如果你的染色体号在其他位置,也可以使用@来告诉LDSC,例如 --ref-ld-chr ld/chr@
。当然也可以用 --ref-ld
来指定一个整体的LD score文件。
eur_w_ld_chr/22.l2.ldscore
这些文件--w-ld-chr
:指定ldsc回归权重所用的LDscore文件,理论上对于SNPj的LD分数,应当包含这个SNP与其他所有SNP的R2之和,但实际操作中,LD score回归对于计算权重的SNP的选择并不敏感,所以一般情况下我们可以使用与 --ref-ld
与相同的文件。.
--out
: 输出文件的路径与前缀
运行后我们就能得到如下结果:
Genetic Covariance
------------------
Total Observed scale gencov: 0.3644 (0.0368)
Mean z1*z2: 0.1226
Intercept: 0.0037 (0.0071)
Genetic Correlation
-------------------
Genetic Correlation: 0.6561 (0.0605)
Z-score: 10.8503
P: 1.9880e-27
Summary of Genetic Correlation Results
p1 p2 rg se z p h2_obs h2_obs_se h2_int h2_int_se gcov_int gcov_int_se
scz.sumstats.gz bip.sumstats.gz 0.656 0.06 10.85 1.988e-27 0.522 0.053 1.001 0.009 0.004 0.007
Genetic Correlation: 0.6561 (0.0605) 即为我们需要估计的遗传相关
除此之外,LDSC还会输出一个Summary of Genetic Correlation Results,当有多组遗传相关需要估计时,查看该表格会更加方便。
常见问题:
为什么rg会在[-1,1]的范围以外: (https://github.com/bulik/ldsc/issues/78)
ldsc的算法并没有限定[-1,1]的范围,当rg接近一时,加上估计误差有时就会导致rg在范围外
参考:
Bulik-Sullivan, B., Finucane, H., Anttila, V. et al. An atlas of genetic correlations across human diseases and traits. Nat Genet 47, 1236–1241 (2015). https://doi.org/10.1038/ng.3406
https://github.com/bulik/ldsc/wiki/Heritability-and-Genetic-Correlation
相关链接:
这个公式的图有问题,应该是E[z1jz2j|lj]。吧?
赞赞
感谢指正,贴错公式了,已更改
赞赞