状态同源 / 血缘同源 IBS / IBD – 概念与计算(PLINK)

IBD与IBS均是,基于遗传信息,表示样本对之间亲缘关系的指标,具体定义如下:

血缘同源(Identity By Descent,IBD),子代中共有的等位基因来源于同一祖先。

状态同源(identical by state ,IBS),两个个体拥有相同的等位基因(不一定来源以同一祖先)。

The origin of IBD segments is depicted via a pedigree.

图1: 橙色IBD片段表示来自同一祖先的片段

通常IBD无法直接观测,但IBS可以通过两个体基因型算出。

个体 1个体2IBS
AAAA2
AAAa1
AAaa0
在某一基因座,两个体可能有 0个,1个,或2个相同的等位基因

IBD可以让我们了解两个体间的亲缘关系,虽然无法直接测得,但可以根据IBS以及等位基因频率的分布来推定。

PLINK中使用 PI_HAT 值来推定IBD的值。该方法基于隐马尔科夫模型 hidden Markov model (HMM),通过矩估计(method-of-moments)来计算 IBD=1, 2或0 的概率。

PI_HAT:为IBD比例 , 即 P(IBD=2) + 0.5*P(IBD=1),PI_HAT的值与对应关系如下所示:

  • PI_HAT=0 无亲缘关系
  • PI_HAT=0.25 表兄弟
  • PI_HAT=0.5 亲子或兄弟姐妹
  • PI_HAT=1 本人或同卵双胞胎

PLINK1.9中提供了–genome的选项,以计算 PI_HAT (注意,计算前强烈建议对SNP进行pruning)

输出文件会被写进 .genome的文件中,每一列的内容如下

FID1	Family ID for first sample
IID1	Individual ID for first sample
FID2	Family ID for second sample
IID2	Individual ID for second sample
RT	Relationship type inferred from .fam/.ped file
EZ	IBD sharing expected value, based on just .fam/.ped relationship
Z0	P(IBD=0)
Z1	P(IBD=1)
Z2	P(IBD=2)
PI_HAT	Proportion IBD, i.e. P(IBD=2) + 0.5*P(IBD=1)
PHE	Pairwise phenotypic code (1, 0, -1 = AA, AU, and UU pairs, respectively)
DST	IBS distance, i.e. (IBS2 + 0.5*IBS1) / (IBS0 + IBS1 + IBS2)
PPC	IBS binomial test
RATIO	HETHET : IBS0 SNP ratio (expected value 2)

参考:

https://www.cog-genomics.org/plink2/ibd

PLINK: A Tool Set for Whole-Genome Association and Population-Based Linkage Analyses

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

您正在使用您的 WordPress.com 账号评论。 注销 /  更改 )

Twitter picture

您正在使用您的 Twitter 账号评论。 注销 /  更改 )

Facebook photo

您正在使用您的 Facebook 账号评论。 注销 /  更改 )

Connecting to %s