[問題] 如何下載NCBI 的搜尋結果 (大量資料)消失
以要搜尋 homo species 的 protein 序列來說,
在NCBI 選擇protein後,搜尋內輸入 txid9606[organism:exp],
找到筆數約 459323,
直接以FASTA 再 send file 即可,
但對於過大的筆數,如本例,會很難下載到完整的。
於是寫信問 NCBI 的結果,提出建議使用eutils,
但是根據實測的結果,以及事後再詢問 NCBI ,
如果筆數過多,還是會有筆數不完整的問題 (少了幾百到幾千筆) \./
再寫信問,又建議下載 pre-formatted nr 加上 gi list,
利用 fastacmd 來截取 subset ,
試過之後,以 fastacmd –i gilist –d nr -o fasta 的結果,
居然有13 G之多,不曉得哪裡出問題了?!
想請問版上有經驗的人,是如何取得 NCBI 的特定物種序列呢 >"<
--
※ 發信站: 批踢踢實業坊(ptt.cc)
推
07/08 13:48, , 1F
07/08 13:48, 1F
→
07/08 13:48, , 2F
07/08 13:48, 2F
→
07/08 13:49, , 3F
07/08 13:49, 3F
推
07/08 16:04, , 4F
07/08 16:04, 4F
→
07/08 16:30, , 5F
07/08 16:30, 5F
→
07/08 16:31, , 6F
07/08 16:31, 6F
→
07/08 16:31, , 7F
07/08 16:31, 7F
→
07/08 16:32, , 8F
07/08 16:32, 8F
推
07/08 16:41, , 9F
07/08 16:41, 9F
推
07/08 16:42, , 10F
07/08 16:42, 10F
推
07/08 16:43, , 11F
07/08 16:43, 11F
→
07/08 21:41, , 12F
07/08 21:41, 12F
→
07/09 17:38, , 13F
07/09 17:38, 13F
→
07/09 18:04, , 14F
07/09 18:04, 14F
→
07/09 18:07, , 15F
07/09 18:07, 15F
→
07/09 18:08, , 16F
07/09 18:08, 16F
→
07/09 18:10, , 17F
07/09 18:10, 17F
→
07/09 18:11, , 18F
07/09 18:11, 18F
→
07/09 20:58, , 19F
07/09 20:58, 19F
→
07/09 21:00, , 20F
07/09 21:00, 20F
→
07/09 21:03, , 21F
07/09 21:03, 21F
→
07/09 21:06, , 22F
07/09 21:06, 22F
→
07/09 21:09, , 23F
07/09 21:09, 23F
→
07/09 21:09, , 24F
07/09 21:09, 24F
→
07/15 23:24, , 25F
07/15 23:24, 25F
BioMedInfo 近期熱門文章
PTT職涯區 即時熱門文章