关键词: 外显子组, pLOF,UKBB,rare variants, gene-based analysis
本文目录:
1.背景
2.Genebass介绍
3.使用方法
4.参考
1.背景
目前为止大规模的GWAS研究已经成功的发现了大量的与人类疾病或表型相关的常见变异,但对于稀有变异与疾病的关联,我们目前还没有系统性的探索。生物银行规模的外显子组测序给我们提供了宝贵的机会以探索基因以及稀有编码变异对于人类表性的影响。UKBB的主要研究人员(Neale lab)利用UKBB的28万多人的外显子组测序数据,通过单核苷酸检验,与基因检验系统性地分析了3700种数量与二分类表型,并将数据公开在Genebass数据库中。
2.Genebass介绍:
Genebass数据集包含了3817种表型的基于基因与基于单变异检验的概括性数据,该数据库的概括性数据基于UK Biobank 28万1852人的外显子组测序数据。
检验方法使用的是基于线性混合模型,并校正case-control比例的SAIGE-GENE(预留链接,最近挖的坑有点多),包括了以下三种检验统计量:
- 单变异检验 :single-variant tests
- 基因负荷检验 :gene-based burden (mean)
- SKAT-O检验 :SKAT-O (hybrid variance/mean) tests.
上述的检验基于以下的注释:
- pLoF(predicted loss-of-function 功能缺失型)变异,包括被LOFTEE注释的高置信度的变异。
- 类错义变异(missense-like variants),包括错义变异与被LOFTEE注释的低置信度的变异。
- 同义变异 synonymous variants.
3.使用方法
Genebass主页链接:
可以在搜索框中输入想查询的基因,或想浏览的表型。

数据展示页面的布局:

以BMI为例:
在搜索框搜索BMI后,我们可以看到 Gene-based tests的概括性数据,曼哈顿图与QQ图。可以点击不同tab查看三种不同注释组的结果。

通过顶部的导航栏可以切换单变异或基因的数据,也可以调整面板的宽度:

切换到单变异检验的曼哈顿图:

在下方点击Variant ID / Gene Name后,还可以查看该变异或基因的PheWAS数据:

另外还可以查询该表型的详细信息:

Genebass还提供了数据库的下载链接:https://genebass.org/downloads

注意:需要通过Hail来加载数据:
Hail:https://hail.is/
4.参考
https://www.medrxiv.org/content/10.1101/2021.06.19.21259117v1