连续纯合子片段分析 ROH

作者: bioYIYI | 来源:发表于2020-04-06 20:46 被阅读0次

1.什么是ROHs分析?

连续性纯合片段(runs of homozygosity, ROHs)是指一类基因组中出现的连续不间断的纯合现象,表现为一段染色体区域缺乏杂合子。

2.研究ROHs的意义

连续性纯合片段现象最早发现于肿瘤病变组织或近亲婚配家系中孟德尔遗传疾病的病人,较长的纯合片段能够通过激活隐性遗传等位基因的效应诱导疾病发生。以往研究者缺乏有效的手段对全基因组范围内的连续性纯合片段进行全面的描述,因此对全基因组范围内的ROHs情况认识不足。单核苷酸多态性(single nucleotide polymorhphisms, SNPs)是人类最常见的遗传变异,一般指在人群中频率大于1%的单个核苷酸的变异,包括转换、颠换、缺失和插入。利用一定数量一定密度的SNPs分型信息,可以反映基因组上一定区域的纯合情况,从而可以用来检测ROHs。近年来,随着高通量基因分型技术的发展和成熟,全基因组关联研究被广泛用于研究SNPs与复杂疾病/性状的关联,这些SNPs信息使得进行全基因组范围的ROHs研究成为可能。自2006年以来,多个研究应用HAPMAP计划的SNPs数据,研究和描述了非近亲婚配人群中的ROHs水平,发现这种连续纯合的现象在人类基因组中非常常见。此后,ROHs作为一类新的遗传现象逐渐得到人们的关注。研究者认为这类广泛存在的ROHs很可能携带低外显率的隐性遗传致病等位基因,从而影响复杂疾病的发生发展。根据这一假设,一些研究采用病例对照研究设计探讨了ROHs与疾病发生的关系,发现ROH与精神分裂症、老年痴呆和多种肿瘤均存在关联。

3.ROHs相关的分析

1)ROHs确定的方法:

在基因组某一段区域内,当一定数量一定密度的 SNPs 表现为纯合时,可以判断该区域存在 ROHs 现象,相比于以往的遗传标志物,SNP 可以提供更多的遗传变异的信息,检测成本低,因而逐渐被应用于 ROHs 的检测。

2)纯合子定位(homozygosity mapping):

在血缘紧密的小范围人群中,寻找在疾病人群基因组中存在但在健康人群中不存在的连续纯合,从而定位某种隐性遗传的突变的方法。该方法基于的假设就是在血缘紧密的人群中,有害隐性突变易于被富集,产生连续纯合的现象的方法来寻找致病基因。

3)检测ROHs的软件:

a.PLINK

PLINK 中使用滑动窗口的方法来进行 ROHs 的检测:特定 SNP 数目的窗口以一定的步长在 SNP 芯片上滑动,对能够满足一定参数(默认:缺失率<5,杂合率<1)的窗口进行拼接从而完成对 ROHs 的检测。这个过程在 PLINK v1.07中通过命令“homozyg “来完成,考虑到基因组上存在一定数量的拷贝数改变,这种拷贝数改变(CNV)往往较短,通过 PLINK 进行 ROHs 的检测时无法将这类拷贝数改变区分开来,参考以前的研究,长度在 0.5Mb 以上的拷贝数改变在健康人群中非常少见,因此将 ROHs 的长度限制设置为 0.5Mb。另外,如果一个ROH 包含两个距离超过 0.1Mb 的 SNPs,那么这个 ROH 被打断为两个 ROHs。每个 ROH 包含的 SNPs 数量阈值尚无统一定论,因此分别评估 SNPs 阈值为50,60,70,80,90,100 个 SNPs 的 ROHs 的情况。

b.gemini

image.png image.png

注:关注小编,将在后续推出Gemini、PLINK软件介绍

4.ROHs的分类和评价指标

在 Pemberton 等人的研究中,研究者用混合高斯分布拟合了 ROHs 长度的分布,从而将 ROHs 分为了三类,(1)短片段 ROHs(class A);(2)中等长度 ROHs(class B);(3)长片段 ROHs(class C)。对照的界值为 class A: 500Kb-700Kb, class B: 700Kb-1500Kb, class C:超过 1500Kb 。

相关文章

网友评论

    本文标题:连续纯合子片段分析 ROH

    本文链接:https://www.haomeiwen.com/subject/rfjiphtx.html