[問題] 如何把全部 GEO 中某 GPL 的全樣本抓回?

看板BioMedInfo (生醫資訊)作者 (Logit(odds))時間11年前 (2012/08/20 23:38), 編輯推噓4(406)
留言10則, 5人參與, 最新討論串1/1
我需要抓 GPL10558 (illumina HumnaHT-12) 的全樣本 http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL10558 內部有 3000 多片分散在 133 個 GSE 內 請問有沒有方法能直接下載 還是要靠各種 tricky 方式處理? (parser , wget .....0rz) -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.239.247

08/21 03:00, , 1F
印象中沒有
08/21 03:00, 1F

08/21 03:01, , 2F
把GSEXXX從網頁pasre下來,然後用wget去fetch ftp比較快
08/21 03:01, 2F

08/21 03:01, , 3F
不過小心各實驗normalization的方法有所出入
08/21 03:01, 3F

08/21 08:55, , 4F
請問下載的檔名有沒有規律或是能知道,如果檔案名知道
08/21 08:55, 4F

08/21 08:56, , 5F
下載的 URL 都把他列出來, 把他放在一 HTML 檔案中,就可
08/21 08:56, 5F

08/21 08:57, , 6F
用軟體一次批次下載
08/21 08:57, 6F

08/23 16:56, , 7F
果然是跟我想的一樣要靠 parser + wget
08/23 16:56, 7F

08/23 16:57, , 8F
鬱悶
08/23 16:57, 8F

08/23 21:25, , 9F
寫個perl script 去抓就好
08/23 21:25, 9F

08/24 17:34, , 10F
R 的 GEOQuery 行嗎?
08/24 17:34, 10F
文章代碼(AID): #1GCbdlM5 (BioMedInfo)
文章代碼(AID): #1GCbdlM5 (BioMedInfo)