Re: 請問要去哪抓所有人類蛋白質序列的資料呢?
※ 引述《soom (是個呆逼)》之銘言:
> ※ 引述《ubiquitin (幸福金金幸福)》之銘言:
> > 我想抓所有蛋白質序列來分析
> > 之前有試過以 swiss prot 連結 UniProt
> > http://www.expasy.uniprot.org/database/download.shtml
> > 但是抓下來的fasta 檔案似乎是所有生物的
> > 我用手提電腦跑 perl 寫的程式
> > 結果記憶體不夠....
> > 所以想先抓所有人類的蛋白 fasta 檔就好
> > 只要人類蛋白的
> > 敘列名稱和氨基酸序列
> > 請問眾大大們
> > 要去去哪抓呢?
> 同一個網頁,
> 畫面的左側有一個聯結可以通向UniProtKB的ftp
> ftp://ftp.expasy.org/databases/uniprot/current_release/knowledgebase/
> 進去以後選taxonomic_divisions資料夾
> 在裡面就有uniprot_sprot_human.dat.gz跟uniprot_trembl_human.dat.gz
> 兩個檔案,可以自行選擇需要的檔案
> 希望有幫到你..
我看他的 readme 提到
The UniProt Knowledgebase (UniProtKB) is the central access point for
extensively curated protein information, including function, classification
and cross-references.
所以
這個檔案應該有包含一些功能
參考資料上的敘述
我想要找只有 fasta 檔就好
感謝感謝
--
◤◥ Origin: 中央生科˙生生不息 nculs.twbbs.org.tw
◣◢ Author: ubiquitin 從 leu.ibms.sinica.edu.tw 發表
討論串 (同標題文章)
Biotech 近期熱門文章
PTT職涯區 即時熱門文章