美文网首页组学
基因组中的GC 含量和重复元件变化导致基因和染色体的错误丢失

基因组中的GC 含量和重复元件变化导致基因和染色体的错误丢失

作者: 球果假水晶蓝 | 来源:发表于2022-11-18 17:25 被阅读0次

背景
许多短读reads组装的基因组被发现是不完整的并且包含错误。脊椎动物基因组计划一直在生产新的参考基因组组装,重点是尽可能完整和无错误,这需要利用长读长、HIC数据、新的组装算法和人工管理。相对于先前的基因组,对最近的参考资料进行更彻底的评估可以提供改进的概述。

结果
在这里,我们评估新的脊椎动物基因组参考相对于相同物种的先前组装,在两种情况下,相同的个体,包括哺乳动物(鸭嘴兽)、两只鸟(斑胸草雀、安娜的蜂鸟)和一条鱼(攀鲈) . 我们发现在之前的组装中高达 11% 的基因组序列完全缺失。在脊椎动物基因组计划斑胸草雀组装中,我们鉴定了八个新的富含 GC 和repeat-rich micro-chromosomes。缺失序列的影响偏向于富含 GC 的 5'-近端启动子和蛋白质编码基因和长链非编码 RNA 的 5' 外显子区域。26% 到 60% 的基因包含结构或序列错误,这些错误可能导致在使用以前的基因组组装时误解它们的功能。

结论
我们的研究结果揭示了regulatory landscapes和蛋白质编码序列,这些序列在以前的组装中被大大忽略了,现在出现在脊椎动物基因组计划参考基因组中。

期刊 genomebiology

相关文章

  • 基因组中的GC 含量和重复元件变化导致基因和染色体的错误丢失

    背景许多短读reads组装的基因组被发现是不完整的并且包含错误。脊椎动物基因组计划一直在生产新的参考基因组组装,重...

  • 生信编程实战第2题(python、R、shell)

    题目来自生信技能树论坛 统计人类参考基因组的每条染色体长度,每条染色体N的含量,GC含量因为我下载的是hg38,所...

  • 生信步骤|kmc+genomescope进行基因组调查

    在组装未知基因组时,往往需要利用重测序数据提前进行基因组调查,以获取其基因组规模,杂合率,重复序列比例,GC含量等...

  • hg38按照200k分区间统计测序深度及GC含量

    hg38按照200k分区间统计测序深度及GC含量 以前是自己写脚本: 【直播】我的基因组47:测序深度和GC含量的...

  • 工具 | GenomeScope and KMC

    介绍 GenomeScope 可以从未组装的测序数据推断基因组的全局特性,包括基因组大小、重复元件丰度和杂合率。G...

  • 基因组-GC偏好

    GC偏好通常存在于二代测序技术。 1、什么是GC偏好? 测序中的GC偏好指的是基因组上GC含量在50%左右的区域更...

  • 2018-04-06-题目

    求:hg19每条染色体长度,每条染色体N的含量,GC含量 1.了解一下python中字典的意思和应用 2.看视频

  • 基因组-genome survey(2)

    在实际基因组概貌调查中,流式细胞术、染色体基数观察和基因组调查测序往往是同时进行的。在此,我们主要介绍下基因组调查...

  • 基因组学

    基因组概论 基因组(Genome)指的是细胞内全套染色体及其所携带的全部基因,包括基因序列和基因间序列。C值(C ...

  • 基因组 组装教程 (T2T)

    导读 本文将介绍T2T基因组,并提供一份基因组组装的资料,其中包含:基因组组装数据和组装策略介绍;染色体水平基因组...

网友评论

    本文标题:基因组中的GC 含量和重复元件变化导致基因和染色体的错误丢失

    本文链接:https://www.haomeiwen.com/subject/cxcvxdtx.html