part one 接前次
前面我写过一篇The protocol of using PluriTest.org to proceed pluripotency assessment via ftp server,简单介绍了一下使用ftp协议上传数据的方法,该方法主要针对于fastq.gz文件>1.5G的情况。
今日将某些<1.5 G数据通过在线方式上传,发现速度快得惊人(~10 M/s)。因此,以后还是建议通过网页上传更为方便和妥当。
下面我简单说一下,在通过ftp协议上传时遇到的问题。
(1)上传数据不完整,双端数据配对错误
第一次上传的时候,直接拖了4个文件过去,耐心等待过后,准备手动点击“开始”的时候,发现数据传输不完整,真的是要了卿命了;
将不完整的数据删除之后,重新上传,顺序又被打乱了。该方法默认,1-2数据配对,3-4数据配对。而我恰好删除了2,4,再重新上传的时候,1-3已经配对了,2-4配对,从而直接导致分析不成功。(当然这可能是我在上传的时候选了“自动匹配文库”造成的,如果不选这个选项,或许不同。虽然我很好奇,但是实在不想试了,如果有人试了,可以告诉我哦~)
(2)经常找不到“pending”这个按钮

而说明书中明确提到,上传结束之后,要点击“pending”来手动开始分析,而怪就怪在这个“pending”的行踪飘忽不定。想要得到“pending”,必须严格遵守以下步骤:
A. 点击“upload”之后,有一个很奇怪的长串字符,在ftp服务器中双击名字为这个长字符串的文件夹,然后将数据从本地拖拽到该文件夹下,此时网页上就出现了pending。

B.数据上传结束之后,在pending页面,点击“analysis”
C.等待系统发送邮件,通知分析已经结束。
但是我常常收到这封邮件,让我百思不得其解,同样的数据,时而成功,时而失败。

以下是数据结果页面的情况,成功为绿色,疑惑黄色,未成功开始分析则是感叹号

明明是一样的数据,上传的时候三遍核对大小,配对无误,仍然是得到一些非常奇怪的结果,一口老血吐在键盘上。
part two 在线上传速度杠杠的
今天意外的使用了在线上传的方式,速度快到飞起。一直固执的认为有ftp协议,上传速度会更快,然鹅,我被打脸了,没试过的东西,就不要下定论,有图有真相。

而且,我意外的发现了,可能造成自己分析结果时而成功时而失败的原因。
因为有了文件上传不完整的糟心经历,我是尽量避免同时上传多个文件,担心是这个原因引起的。因此就算是双端测序的同一个样本,我也是先上传完R1,再上传R2。转到网页上传我也是打算这个干,先把R1拖到网页里面,点击上传,上传成功后再拖R2。可是当我拖入R1,点击上传之后,发现网页提示我未知错误,无法配对。此时此刻。。。我大概明白了一些东西。
那就是,上传的时候一个样本一个样本的上传,双端数据同时上,先配对上,然后pending,最后analysis。
但愿是这么一个原因,我已经按照这个要求重新上传数据了,如果结果打脸,那我就认了,好吧,我尽力了。
以下是我曾经怀疑过数据分析失败的原因
- 数据格式不对:经查验,我们是认真的fastq.gz
- 双端长度不对: zless *.gz| wc -l 数过发现没问题
- 数据处理流程有问题:样本处理结果打脸,同一个样本,可成功也可失败
- 网页工具不太好:你们说呢?
好了,不管怎么样,有问题就解决问题,没法解决就哭吧。
加油吧,拜拜~
网友评论