[問題] NGS的SRA資料庫
大家好~
小弟最近在研究NGS方面的問題
因為跟先前用過的資料庫有點不太一樣
所以有一些基本的問題想要請教各位
===========================================================================
目標是想要進一步的分析NGS所定序出來的序列
1.請問我要如何下載序列
我知道在SRA資料庫下載的序列都是.sra檔
剛剛稍微研究一下可以利用fastq-dump這個執行檔來轉換成.fastq檔
假設我想要研究的主題是人類的whole genomic DNA
請問我要如何下載到這些序列
(因為我在SRA裡只看的到ACCESSION number,但我不知道這些number是什麼物種)
2.在.fastq檔裡有一個欄位是spot,請問這是代表什麼意思?
3.在.fastq檔裡有很多條序列
EX:
@SRR096072.lite.sra.1 FVUWOJD02F4NLA length=255
ATCG......
+SRR096072.lite.sra.1 FVUWOJD02F4NLA length=255
FFFFFFFFFFFFFFFFFFFFFFIIIIIIIIIIIIIII...
@SRR096072.lite.sra.2 FVUWOJD02G1J77 length=290
ATCG......
+SRR096072.lite.sra.2 FVUWOJD02G1J77 length=290
FFFFFFFFFFFFFFFFFFFFFFIIIIIIIIIIIIII...
@SRR096072.lite.sra.3
.
.
@SRR096072.lite.sra.4
.
.
@SRR096072.lite.sra.5
.
.
.
請問我該如何讀這些序列?
是@SRR096072.lite.sra.1 繼續接 @SRR096072.lite.sra.2
繼續接@SRR096072.lite.sra.3 一直下去這樣嗎?
抱歉問題有點多,有勞各位了!!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 111.252.100.21
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):
BioMedInfo 近期熱門文章
PTT職涯區 即時熱門文章
6
14