美文网首页
2020-06-19

2020-06-19

作者: Seafairy | 来源:发表于2020-06-19 14:49 被阅读0次

问题:之前一直处理fasta文件,最近用了一个现成的数据集(data来自PDB),发现:一个pdb文件中的序列既有protein序列、又有DNA序列;并且序列中每个残基不是由一个字母表示,而是一个氨基酸残基由三个字母表示、一个核苷酸残基由两个字母表示。下述例子是一个pdb文件(ID:10mh)的截图,有三个链A,B,C,链A是protein序列,链B和C是DNA序列。

概况来说,即:

PDB文件中SEQRES (sequence residues)中protein序列和DNA序列。

1. 一个PDB文件中既有protein序列,又有DNA序列。

2. 序列中氨基酸残基、核苷酸残基的表示方式。

解决:

(1)如果是蛋白质复合体的话,它的pdb文件里会包括protein序列和DNA序列的信息。

         蛋白质复合体(蛋白质复合物)是有两个以上功能相关的多肽链通过二硫键或者其他蛋白质相互左右所形成的复合物。如蛋白质与DNA的特定序列结合形成复合物。 

(2)pdb文件里序列的表示,每个氨基酸残基由三个字母缩写表示,每个核苷酸残基由两个字母缩写表示。不同于fasta文件,每个氨基酸残基、每个核苷酸残基均由一个字母简写表示。

二十种氨基酸:第一列是三个字母的缩写表示,第二列是单字母表示。(参考:https://baike.baidu.com/item/氨基酸/303574?fr=aladdin)

但是,经观察发现,除了上述二十种氨基酸之前,还有一些其他的非常见的氨基酸残基,但是几乎检索不到它们的缩写及简写!

例如,PDB_ID:173d的序列中氨基酸序列大部分由非常见氨基酸残基组成。

相关文章

  • 【JMeter】ERROR o.a.j.u.BeanShellI

    【执行BeanShell Sampler报错】2020-06-19 17:39:38,166 ERROR o.a....

  • 2020-06-22

    2020-06-21 2020-06-20 2020-06-19 2020-06-18 2020-06-16 20...

  • 2020-06-24

    2020-06-23 2020-06-22 2020-06-21 2020-06-20 2020-06-19 20...

  • 2020-06-20

    2020-06-19 2020-06-18 2020-06-16 2020-06-15 2020-06-14 20...

  • 2020-06-21

    2020-06-20 2020-06-19 2020-06-18 2020-06-16 2020-06-15 20...

  • 2020-06-23

    2020-06-22 2020-06-21 2020-06-20 2020-06-19 2020-06-18 20...

  • 五绝 木芙蓉

    芙蓉倩影陪, 兀自把花开。 水岸妆风景, 妖形不弱梅。 押平水韵十灰 2020-06-19于宁德

  • 不要和不努力的人交往

    教育随笔2020-06-19 不要和不努力的人交往 暑假将近,天气炎热,部分学生心情浮躁,放弃学习,个别学生不...

  • 黄斑水肿45岁以上人群

    【网络摘录】 黄斑水肿是黄斑变性吗 黄斑水肿和黄斑变性区别细说 2020-06-19 黄斑变性通常指老年性黄斑变性...

  • 七绝 土楼

    池碧枫红好个秋, 层林染彩白云游。 何时了却教孙事, 好去漳州看土楼。 押平水韵十一尤 2020-06-19于宁德

网友评论

      本文标题:2020-06-19

      本文链接:https://www.haomeiwen.com/subject/xewyxktx.html