Ti/Tv ratio (Ts/Tv ratio) 的参考值与意义

在WGS中,我们通常使用Ti/Tv ratio (Ts/Tv ratio) 来评估 variants call的质量。Ti/Tv即为结果中 transitions 与 transversions 的比值。

Ti(Ts)是指:transitions 同类核苷酸之间的变异 (嘌呤->嘌呤,嘧啶->嘧啶),如 C <-> T , A <-> G 。

Tv是指:transversions 不同类核苷酸之间的变异(嘌呤-> 嘧啶 , 嘌呤 ->嘧啶) ,如 C<->A , T<->G等。

figure3

图1: Ti 与 Tv的示意图

人类全基因组的ti/tv ratio 约为 2.0 ~2.2 左右,如果是全外显子组,那么由于在CpG岛中大量的甲基化胞嘧啶,ti/tv ratio 会偏高,达到3左右。

如果 transition 与 transversion 是随机发生的(没有其他生物因素干扰),那么理论上ti/tv应为0.5左右,这单纯是因为总共有tv的种类是ti的两倍(见图1)。然而在实际环境中,甲基化的胞嘧啶( methylated cytosine )发生脱氨基( deamination )反应变成胸腺嘧啶的几率高于其他变异 (C->T属于ti),所以ti/tv的比值会升高到2左右。 全外显子组中,由于在CpG岛中大量的甲基化胞嘧啶的存在 ti/tv 会更高。如果你的 ti/tv 值偏离太多,那可能意味着variant call过程中有较大的偏差(bias)。

参考:

https://biodatamining.biomedcentral.com/articles/10.1186/s13040-018-0186-4

https://www.cureffi.org/2012/10/17/descriptive-statistics-and-quality-control-on-variants/

https://www.nature.com/articles/ng.806

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4308666/

https://gatk.broadinstitute.org/hc/en-us/articles/360035531572-Evaluating-the-quality-of-a-germline-short-variant-callset