[請益] Web Data Extraction
請教大家
有人有研究過Web Data Extration嗎?
是不是所有網站的資料都可以抓到呢
我找到了一個Java-based的library叫Web Harvest
在試過他給的範例後發現有的網站可以抓的到資料
但是有的不行例如gmail或yahoo mail
尤其是gmail登入後的首頁開啟原始碼頁面發現
都是JSON格式的資料已經不是一般的HTML頁面
請問有人有實作過或研究過Web Data Extraction的東西嗎?
有沒有軟體或library可以用在所有的網站上呢?
如果需要從底層寫要從哪邊著手? Java Scoket嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 75.53.47.129
推
06/21 15:28, , 1F
06/21 15:28, 1F
推
06/22 23:56, , 2F
06/22 23:56, 2F
Soft_Job 近期熱門文章
27
61
PTT職涯區 即時熱門文章