在WGS中,我们通常使用Ti/Tv ratio (Ts/Tv ratio) 来评估 variants call的质量。Ti/Tv即为结果中 transitions 与 transversions 的比值。
Ti(Ts)是指:transitions 同类核苷酸之间的变异 (嘌呤->嘌呤,嘧啶->嘧啶),如 C <-> T , A <-> G 。
Tv是指:transversions 不同类核苷酸之间的变异(嘌呤-> 嘧啶 , 嘌呤 ->嘧啶) ,如 C<->A , T<->G等。

图1: Ti 与 Tv的示意图
人类全基因组的ti/tv ratio 约为 2.0 ~2.2 左右,如果是全外显子组,那么由于在CpG岛中大量的甲基化胞嘧啶,ti/tv ratio 会偏高,达到3左右。
如果 transition 与 transversion 是随机发生的(没有其他生物因素干扰),那么理论上ti/tv应为0.5左右,这单纯是因为总共有tv的种类是ti的两倍(见图1)。然而在实际环境中,甲基化的胞嘧啶( methylated cytosine )发生脱氨基( deamination )反应变成胸腺嘧啶的几率高于其他变异 (C->T属于ti),所以ti/tv的比值会升高到2左右。 全外显子组中,由于在CpG岛中大量的甲基化胞嘧啶的存在 ti/tv 会更高。如果你的 ti/tv 值偏离太多,那可能意味着variant call过程中有较大的偏差(bias)。
参考:
https://biodatamining.biomedcentral.com/articles/10.1186/s13040-018-0186-4
https://www.cureffi.org/2012/10/17/descriptive-statistics-and-quality-control-on-variants/
https://www.nature.com/articles/ng.806