Re: [問題] 請問有無方便的程式或方法可幫我解決難 …

看板BioMedInfo (生醫資訊)作者 (薛丁格的貓)時間16年前 (2008/07/31 11:58), 編輯推噓1(104)
留言5則, 3人參與, 最新討論串3/5 (看更多)
: ※ 引述《enisx (東方有比目魚,不比不行)》之銘言: : : 請教各位高手, : : 我手上有外送回來定序的DNA序列文字檔(.txt) : : 裡頭大約有約700-1000條,檔案已經轉成FASTA格式了, : : 但是,我想從每條DNA序列中"擷取"出我想要的部份, : : 舉例如下: : : ------------------------------------------------------------- : : >123456 : : TACCTCTGTGCTGTGGGGCGGATCTGAAAAGCTGGTCTTT : -- : ※ 發信站: 批踢踢實業坊(ptt.cc) : ◆ From: 132.183.24.60 : 推 alpe:grep -P '/TAC.*TTT/' target.txt 有linux的話? 07/30 01:12 : 推 vixen:一樓的辦法遇到Unix/Win換行符號之差可能會有閃失 07/31 01:15 其實我比較想用 php 寫 shell script 去跑 seq.php #!/usr/local/bin/php -q <?php if(count($argv) < 2) { die("\n pearl_reg file1 file2 ... ... \n"); } array_shift($argv); $reg = array_shift($argv); if(empty($reg)) die(); echo $reg."\n"; foreach($argv as $fn){ $fc = file_get_contents($fn); $chk = preg_match_all("$reg", $fc, $match); if(!$chk) echo "\n $fn Not Match\n"; if(count($match[1]) == 0) continue; foreach($match[1] as $line){ $line = preg_replace("/\s/", '', $line); echo "\n$line\n"; } } echo "\n"; ?> test >123456 ACGTGGTTAACCTTGGCCCCTACCTCTGT GCTGTGGGGCGGATCTGAAAAGCTGGTCTTTGGCGTTGAAATTGTCCCAAAGTACA____ACTC TGTGCTGTGGGGCGGATCTGAAAAGCTGGTCTTT #php seq.php '/(TAC.*?TTT)/is' test /(TAC.*?TTT)/is TACCTCTGTGCTGTGGGGCGGATCTGAAAAGCTGGTCTTT TACA____ACTCTGTGCTGTGGGGCGGATCTGAAAAGCTGGTCTTT -- Live Long and Prosper -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 60.248.154.212

08/01 14:03, , 1F
c++也可以用這樣的東西去做嗎?
08/01 14:03, 1F

08/01 16:19, , 2F
行啊.
08/01 16:19, 2F

08/01 18:13, , 3F
晚上來 release win 下的執行檔好了
08/01 18:13, 3F

08/01 21:00, , 4F
哇~~感謝a大
08/01 21:00, 4F

08/01 21:00, , 5F
順道請問一下..這樣子原始序號會留著吧?!
08/01 21:00, 5F
※ 編輯: alpe 來自: 59.121.121.35 (08/02 01:19)
文章代碼(AID): #18aJXG_u (BioMedInfo)
討論串 (同標題文章)
文章代碼(AID): #18aJXG_u (BioMedInfo)