Re: [問題] 請問有無方便的程式或方法可幫我解決難 …
: ※ 引述《enisx (東方有比目魚,不比不行)》之銘言:
: : 請教各位高手,
: : 我手上有外送回來定序的DNA序列文字檔(.txt)
: : 裡頭大約有約700-1000條,檔案已經轉成FASTA格式了,
: : 但是,我想從每條DNA序列中"擷取"出我想要的部份,
: : 舉例如下:
: : -------------------------------------------------------------
: : >123456
: : TACCTCTGTGCTGTGGGGCGGATCTGAAAAGCTGGTCTTT
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc)
: ◆ From: 132.183.24.60
: 推 alpe:grep -P '/TAC.*TTT/' target.txt 有linux的話? 07/30 01:12
: 推 vixen:一樓的辦法遇到Unix/Win換行符號之差可能會有閃失 07/31 01:15
其實我比較想用 php 寫 shell script 去跑
seq.php
#!/usr/local/bin/php -q
<?php
if(count($argv) < 2) {
die("\n pearl_reg file1 file2 ... ... \n");
}
array_shift($argv);
$reg = array_shift($argv);
if(empty($reg)) die();
echo $reg."\n";
foreach($argv as $fn){
$fc = file_get_contents($fn);
$chk = preg_match_all("$reg", $fc, $match);
if(!$chk) echo "\n $fn Not Match\n";
if(count($match[1]) == 0) continue;
foreach($match[1] as $line){
$line = preg_replace("/\s/", '', $line);
echo "\n$line\n";
}
}
echo "\n";
?>
test
>123456
ACGTGGTTAACCTTGGCCCCTACCTCTGT
GCTGTGGGGCGGATCTGAAAAGCTGGTCTTTGGCGTTGAAATTGTCCCAAAGTACA____ACTC
TGTGCTGTGGGGCGGATCTGAAAAGCTGGTCTTT
#php seq.php '/(TAC.*?TTT)/is' test
/(TAC.*?TTT)/is
TACCTCTGTGCTGTGGGGCGGATCTGAAAAGCTGGTCTTT
TACA____ACTCTGTGCTGTGGGGCGGATCTGAAAAGCTGGTCTTT
--
Live Long and Prosper
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 60.248.154.212
→
08/01 14:03, , 1F
08/01 14:03, 1F
→
08/01 16:19, , 2F
08/01 16:19, 2F
→
08/01 18:13, , 3F
08/01 18:13, 3F
推
08/01 21:00, , 4F
08/01 21:00, 4F
→
08/01 21:00, , 5F
08/01 21:00, 5F
※ 編輯: alpe 來自: 59.121.121.35 (08/02 01:19)
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 3 之 5 篇):
BioMedInfo 近期熱門文章
PTT職涯區 即時熱門文章