[工具] 如何知道 BLAST output 所屬的species
請問BLAST的小問題
我現在想要知道我用blast之後 (against nr database)
所output出來的每條sequence 各是屬於哪個species
我知道如果用default的output format
他會秀出 >gb|AAT93342.1| YPR002C-A [Saccharomyces cerevisiae]
裡面就會包含species的資訊
但是如果我想要用-m 8這種 tabular 的output format
就只會得到
sp|Q06127|YL334_YEAST gi|74644934|sp|Q06127.1|YL334_YEAST 100.00 126 0 0 1 126 1 126 8e-48 193
sp|Q06127|YL334_YEAST gi|74644557|sp|Q96VH1.1|YC018_YEAST 73.44 64 15 1 14 75 21 84 2e-06 55.8
sp|Q06127|YL334_YEAST gi|158564315|sp|Q6B0V7.2|YPR02_YEAST 68.75 64 18 1 14 75 2 65 2e-04 49.7
sp|Q06127|YL334_YEAST gi|51014097|gb|AAT93342.1| 70.31 64 17 1 14 75 2 65 2e-04 49.7
第二欄這樣的id
雖然有些可以從id直接看出species
但仍有許多無法直接辨識
我想請問是否有人知道如何讓blast output出簡潔的資料 但又要包含species的資訊
又或者
gi|74644934
這個GenBank Identifier該要如何轉換呢?
是否有tool或是對應表?
感謝!!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.109.22.146
※ 編輯: Zing119 來自: 140.109.22.146 (06/07 03:03)
→
06/07 14:33, , 1F
06/07 14:33, 1F
→
06/07 14:43, , 2F
06/07 14:43, 2F
→
06/08 10:14, , 3F
06/08 10:14, 3F
→
06/08 10:15, , 4F
06/08 10:15, 4F
推
06/11 01:18, , 5F
06/11 01:18, 5F
→
06/11 01:20, , 6F
06/11 01:20, 6F
→
06/11 01:21, , 7F
06/11 01:21, 7F
推
06/12 18:42, , 8F
06/12 18:42, 8F
→
10/04 07:46, , 9F
10/04 07:46, 9F
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):
BioMedInfo 近期熱門文章
PTT職涯區 即時熱門文章