Re: 請問要去哪抓所有人類蛋白質序列的資料呢?
※ 引述《ubiquitin.bbs@nculs.twbbs.org.tw (幸福金金幸福)》之銘言:
: 所以
: 這個檔案應該有包含一些功能
: 參考資料上的敘述
: 我想要找只有 fasta 檔就好
: 感謝感謝
用 perl 寫去 NCBI 抓資料就好啦...
例如抓所有 virus 的 protein fasta
先查詢有多少筆:
http://www.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?
db=protein&retmax=1&usehistory=y&term=viruses[orgn]
再從查結果...去抓對應的資料 (XXX, YYY, ZZZ)
http://www.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?
rettype=fasta&retmode=text&retstart=XXX&retmax=2000&
db=protein&query_key=YYY&WebEnv=ZZZ
--
我是瓶男~我很難懂!
http://blog.yam.com/chhuang
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.62.84.89
討論串 (同標題文章)
Biotech 近期熱門文章
PTT職涯區 即時熱門文章