[轉錄][求救] 有關FASTA format

看板BioMedInfo (生醫資訊)作者 (huggie)時間16年前 (2008/06/02 12:38), 編輯推噓3(3015)
留言18則, 5人參與, 最新討論串1/4 (看更多)
※ [本文轉錄自 Biotech 看板] 作者: TZUKI (漢堡) 看板: Biotech 標題: [求救] 有關FASTA format 時間: Mon Jun 2 12:21:37 2008 有個問題很困擾... 就是如何能不使用一些特殊程式來將不是FASTA format 的序列轉換成FASTA 我想了很久 也只能想出用word來去算字數再來依長度分行 這方法感覺很遜... 請問板上的大大們 有沒有更好的方法? 不然每次我都只能慢慢來>"< -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 134.208.44.23

06/02 12:38,
借轉 BioMedInfo 歡迎任何dry lab 討論唷
06/02 12:38
-- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.129.160.62

06/02 12:40, , 1F
請問來源格式?
06/02 12:40, 1F

06/02 12:53, , 2F
我猜應該是像GenBank或EMBL那樣的format吧 我要上seminar
06/02 12:53, 2F

06/02 12:53, , 3F
晚點再回好了...不過在下載時 就可以下載fasta格式了
06/02 12:53, 3F

06/02 13:04, , 4F
如果有來源格式就好辦了
06/02 13:04, 4F

06/02 13:41, , 5F
沒有來源格式應該也可以寫~ 不過一次只能一筆 ^^
06/02 13:41, 5F

06/02 13:42, , 6F
我上seminar偷上b中 cot幫人家寫個code算了XD
06/02 13:42, 6F

06/02 14:02, , 7F
寫支小程式是ok啦.. 只是如果可以瞭解問題詳細細節比較方便
06/02 14:02, 7F

06/03 06:24, , 8F
#!/usr/bin/perl -w
06/03 06:24, 8F

06/03 06:25, , 9F
open(IN,'data.txt');
06/03 06:25, 9F

06/03 06:25, , 10F
<IN>;
06/03 06:25, 10F

06/03 06:25, , 11F
@a=<IN>;
06/03 06:25, 11F

06/03 06:25, , 12F
$seq=join('',@a);
06/03 06:25, 12F

06/03 06:26, , 13F
$seq=~s/\s//g;
06/03 06:26, 13F

06/03 06:26, , 14F
print length($seq);
06/03 06:26, 14F

06/03 06:26, , 15F
<>;
06/03 06:26, 15F

06/03 06:26, , 16F
以上
06/03 06:26, 16F

06/03 06:29, , 17F
不過這只有算序列長度而已,分行就再加個for印出,不難
06/03 06:29, 17F

06/03 06:31, , 18F
其他像.gb或.embl之類的也差不多,格式有的話隨手可寫
06/03 06:31, 18F
文章代碼(AID): #18GtbPfC (BioMedInfo)
文章代碼(AID): #18GtbPfC (BioMedInfo)