美文网首页
后缀树算法

后缀树算法

作者: 小潤澤 | 来源:发表于2020-10-11 13:47 被阅读0次

后缀树算法

后缀树算法在现代的比对工具中也是非常常见的一类比对算法,常用的STAR软件利用的就是后缀树算法,而bowtie,BWA等比对软件用的是BWT算法,这就是为什么STAR的比对速度要比其他二代软件快,索引比其他二代软件大的原因

构建后缀树算法

构建后缀树算法的流程类似于BWT算法,比方说我的 ref 序列为:ATCATGATC$,类似于BWT算法依次向前移位,并去掉第一个元素

上表的第一行表示位置信息

并且根据你的ref序列的特点来构建树

image.png

其中黑色点代表结点,[3,9]表示位置信息,代表上表中3到9号位置的两个元素,其他的以此类推

对于ref:ATCATGATC$
开头第一个元素无非是A,T,C,G四种元素,那么由0号节点出发,分为四类

  1. AT,由于ref中A与T总是相连的,所以划归到一起
  2. T,由于T后面接着 C 或者 G,所以单独拿出来
  3. C,由于C后面接着 A 或 $,所以单独拿出来
  4. G,由于ref中只有GATC$,所以只有这一种类型

倘若现在有一条reads:ATCA,首先走结点0->1->6->12,并储存位置信息,这就比对完成了,即比对到位置信息为[0,3]

又比如有一条reads:CATGA,首先走结点0->3->10,储存位置信息,这就比对完成了,即比对到位置信息为[2,6]

再如有一条reads:ATC,可以走结点0->1->6,即比对到位置信息为[0,2];也可以走结点0->16->17,即比对到位置信息为[6,9]

参考:孟叔live

相关文章

  • 后缀树算法

    后缀树算法 后缀树算法在现代的比对工具中也是非常常见的一类比对算法,常用的STAR软件利用的就是后缀树算法,而bo...

  • 算法导论:后缀树

    算法导论:后缀树 参考资料:在线构造后缀树Ukkonen's Algorithm构造后缀树实录后缀树系列在阅读本文...

  • 字符串算法小结

    hash kmp和ac自动机 后缀数组,后缀自动机,后缀树 扩展kmp manacher算法 回文自动机 可删改的...

  • 基本序列算法

    构建后缀树 开始构建后缀树 通过后缀树简化寻找重复序列的过程 还可以找出序列的重复次数,以及每次的起始位点。 找寻...

  • 字符串匹配

    BF算法 暴力匹配算法O(n*m) RK算法 O(n) BM算法 坏字符规则好后缀规则O(m)

  • 10.12 bwa使用 安装文件路径与使用 sh权限

    我们这里将用于流程构建的BWA就是其中最优秀的一个,它将BW(Burrows-Wheeler)压缩算法和后缀树相结...

  • 基础序列算法

    参考:山东大学生物信息学课程 构建后后缀树 最高分-子序列问题 构建后缀树 简介后缀树提出的目的是用来支持有效的字...

  • P45-字符串搜索-KMP算法

    (1)BF 暴力算法 (2)RK 暴力的优化,伪hash算法 (3)BM算法(3.1)坏字符规则 (3.2)好后缀...

  • 后缀树(suffix tree & array)

    定义:后缀数组(suffix array)是将字符串的所有后缀进行排序放入数组中。后缀树(suffix tree)...

  • 表达式树

    表达式树中缀表达式转换为后缀表达式后缀表达式总结

网友评论

      本文标题:后缀树算法

      本文链接:https://www.haomeiwen.com/subject/fwcepktx.html