[問題] 請問有無方便的程式或方法可幫我解決難題..
請教各位高手,
我手上有外送回來定序的DNA序列文字檔(.txt)
裡頭大約有約700-1000條,檔案已經轉成FASTA格式了,
但是,我想從每條DNA序列中"擷取"出我想要的部份,
舉例如下:
-------------------------------------------------------------
>123456
ACGTGGTTAACCTTGGCCCCTACCTCTGTGCTGTGGGGCGGATC
TGAAAAGCTGGTCTTTGGCGTTGAAATTGTCCCAAAGTCAACGTGTGGTT
我想要得到如下形式
>123456
TACCTCTGTGCTGTGGGGCGGATCTGAAAAGCTGGTCTTT
-------------------------------------------------------------
這些我想要擷取的序列都是呈現 TACXXXXXXXXXTTT 的格式,
因為我一直找不到好方法來做,
所以目前是以Emeditor打開原始的文字檔,以正規表示法標示出我想要的位置
,然後....一條一條地將不要的部份刪除,再將之複製貼上到另外的文字檔上 ,
這樣土法煉鋼還蠻笨的也花了我很多時間在這些重複性工作~~
想請教各位高手,是否有快一點的方法,請教教我吧!! 謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.5.61
BioMedInfo 近期熱門文章
PTT職涯區 即時熱門文章