[問題] 請教有關Blast 的使用問題
假設有三條蛋白質序列 p1 p2 p3 以 .fasta 格式
放在同一個 test.txt 檔案中
而今天我有需要將這三條蛋白質序列分別兩兩做Blast 的動作
於是我就將這個檔案另存成一個名為 db 的檔案
並將db 轉換成Blast 所需要的資料庫格式 (formatdb -p T -i db)
但是當執行blastall 時 (blastall -m 8 -p blastp -d db -i test.txt -o out.txt)
我只得到了 (p1,p1) (p1,p3) (p2,p2) (p2,p3) (p3,p1) (p3,p3) 共六種比對結果
少了(p1, p2) 或 (p2, p1) 的結果
而我所想要得到的應該是所有蛋白質序列兩兩比對的結果 (共九種結果)
或是其中的上三角形或下三角形的結果 (全部扣除掉重複的部分)
而如果序列更多時,會漏掉更多結果
請問有沒有其他Unix軟體或辦法可以解決這問題? (我用的是 ncbi 的 blast-2.2.14)
我實在不想把序列全部分成一個個的檔案再寫程式用 bl2seq 兩兩去跑 (很耗時)
請板上對blast 熟悉的先進予以回答
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.119.162.50
Biotech 近期熱門文章
PTT職涯區 即時熱門文章
-14
46
6
29