[請益] 爬蟲是容易觸法的行為嗎?

看板Soft_Job (軟體人)作者 (銀河)時間7年前 (2018/06/16 23:24), 7年前編輯推噓21(21048)
留言69則, 25人參與, 7年前最新討論串1/2 (看更多)
不好意思 打擾大家 最近在學習爬蟲 小弟想請教 假設做書籍資訊相關的爬蟲 而資料來源打算用網路書店的資料(內容包含 書名 價格 出版社......等 公開資訊) 在遵守Robot.txt的情況下,會有任何可能會觸法嗎? 會不會被認定同一秒發太多請求對 他們伺服器是攻擊的行為? 會問這個原因是因為之前爬一些國外網站有被Ban ip,雖然可以用代理解決,但會不會這隱 含被告的風險呢? 網路上找了很多資料,但沒有一個詳細的解答,有人說會,也有人說不會,也有真的起訴成功 和失敗的案例,但資料來源都是在中國,不知道在台灣能不能這樣做 (btw 假設一秒請求16次的情況下) 先謝謝大家了 最近被這個問題困擾很久 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.200.202.47 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1529162696.A.2E5.html ※ 編輯: bajifa (1.200.202.47), 06/16/2018 23:25:52

06/16 23:48, 7年前 , 1F
《刑法》第360條規定:「無故以『電腦程式』或其他電
06/16 23:48, 1F

06/16 23:48, 7年前 , 2F
磁方式干擾他人電腦或其相關設備,致生損害於公眾或他
06/16 23:48, 2F

06/16 23:48, 7年前 , 3F
人者,處三年以下有期徒刑、拘役或科或併科十萬元以下
06/16 23:48, 3F

06/16 23:48, 7年前 , 4F
罰金。」。
06/16 23:48, 4F

06/16 23:49, 7年前 , 5F
有辦法舉證你損害公眾或他人才有辦法告吧。也就是你沒
06/16 23:49, 5F

06/16 23:49, 7年前 , 6F
把他搞到服務失常應該是告不成。
06/16 23:49, 6F

06/16 23:53, 7年前 , 7F
既然會ban IP 就代表別人不想你爬資料了
06/16 23:53, 7F

06/16 23:54, 7年前 , 8F
一秒16次還好…你要考慮的不是這方向…找暫時性重製
06/16 23:54, 8F

06/17 00:49, 7年前 , 9F
走到法律這一個第部不太可能會發生你放心 除非你是用學
06/17 00:49, 9F

06/17 00:50, 7年前 , 10F
網去爬某些網站導致人家當機那真的要賠錢沒錯
06/17 00:50, 10F

06/17 01:00, 7年前 , 11F
假如1秒請求16次網站就會掛點,網站要告的應該是開發
06/17 01:00, 11F

06/17 01:01, 7年前 , 12F
那網站的工程師吧...
06/17 01:01, 12F

06/17 01:01, 7年前 , 13F
前年美國有判例,有廠商爬linked被吉,法院判無罪,理
06/17 01:01, 13F

06/17 01:01, 7年前 , 14F
由是linked數據以公開方式供大家取用,後來linked就改
06/17 01:01, 14F

06/17 01:01, 7年前 , 15F
成只有登入後才看得到完整數據了。
06/17 01:01, 15F

06/17 01:02, 7年前 , 16F
爬蟲比較多的問題是copyright issue吧
06/17 01:02, 16F

06/17 01:14, 7年前 , 17F
大公司的對外網站防火牆都有ddos防護設備
06/17 01:14, 17F

06/17 01:16, 7年前 , 18F
然後你這個可能普通防火牆就自動ban ip了
06/17 01:16, 18F

06/17 01:24, 7年前 , 19F
看你爬的程度 之前聽說 有人爬掛新聞網站 結果人家找上
06/17 01:24, 19F

06/17 01:24, 7年前 , 20F
門 最後和解把資料買下來
06/17 01:24, 20F

06/17 10:00, 7年前 , 21F
那那些比價網站是如何做的呢?
06/17 10:00, 21F

06/17 10:21, 7年前 , 22F
我五分鐘固定爬一次就被ban了QQ
06/17 10:21, 22F

06/17 11:06, 7年前 , 23F
模擬成瀏覽器也會被ban?
06/17 11:06, 23F

06/17 11:09, 7年前 , 24F
要有刑責或民事侵權都要看狀況認定包括舉證內容有沒有到位,
06/17 11:09, 24F

06/17 11:09, 7年前 , 25F
但基本上一個原則是人家設下了一個門檻比如說驗證碼或是特定
06/17 11:09, 25F

06/17 11:09, 7年前 , 26F
的驗證防護方式就不要太白目硬要去解,包括不要把別人的服
06/17 11:09, 26F

06/17 11:09, 7年前 , 27F
務搞掛
06/17 11:09, 27F

06/17 11:10, 7年前 , 28F
向樓上的新聞網站搞掛 有可能得賠上一筆費用,雖然說一篇新
06/17 11:10, 28F

06/17 11:10, 7年前 , 29F
聞稿授權轉載的授權費用沒多少但是量多起來還是挺客觀的
06/17 11:10, 29F

06/17 11:14, 7年前 , 30F
另外有些內容跟資訊是屬於該公司特有,著作權還是要顧一下,
06/17 11:14, 30F

06/17 11:14, 7年前 , 31F
免得服務上線,該公司的法務找上你和解都是100~200k起跳(
06/17 11:14, 31F

06/17 11:14, 7年前 , 32F
律師費+實際侵權程度跟奇摩子)
06/17 11:14, 32F

06/17 11:18, 7年前 , 33F
不過另外說的是爬蟲其實也沒說好爬,因為通常正常來說內容
06/17 11:18, 33F

06/17 11:18, 7年前 , 34F
類的平台網站會有類似 limit request 的 module 掛在伺服器
06/17 11:18, 34F

06/17 11:18, 7年前 , 35F
設定上,有些是因為上cdn省waf或是上好cache不怕你爬,你只
06/17 11:18, 35F

06/17 11:18, 7年前 , 36F
是其中的使用者而已,沒有持續一直同步 mis/it 根本不會處理
06/17 11:18, 36F

06/17 11:18, 7年前 , 37F
06/17 11:18, 37F

06/17 11:19, 7年前 , 38F
只是後續就是剛講的,資料怎麼來的,拿了不該拿了會不會有
06/17 11:19, 38F

06/17 11:19, 7年前 , 39F
問題很難說,包括你圖片內剛好有別人的商標又另一件事情了
06/17 11:19, 39F

06/17 11:20, 7年前 , 40F
最後總結是
06/17 11:20, 40F

06/17 11:21, 7年前 , 41F
做資料研究 -> 低調、不要礙到人為主
06/17 11:21, 41F

06/17 11:21, 7年前 , 42F
做服務平台、或轉售資訊 -> 找律師事務所付費諮詢
06/17 11:21, 42F

06/17 11:32, 7年前 , 43F
再補充下,這方面其實不只是爬蟲而已,像你如果平台給員工
06/17 11:32, 43F

06/17 11:32, 7年前 , 44F
維護,然後你沒有盡好責任監督上架內容有問題,雇主也是有連
06/17 11:32, 44F

06/17 11:32, 7年前 , 45F
帶責任的
06/17 11:32, 45F

06/17 11:33, 7年前 , 46F
所以說你會顧慮到爬蟲的法律問題 我覺得是非常好的
06/17 11:33, 46F

06/17 11:33, 7年前 , 47F
但因為網友不可能知道你究竟真正的目的要用在哪裡
06/17 11:33, 47F

06/17 11:36, 7年前 , 48F
若你有已知的風險但無法評估究竟影響到程度或責任有多大 你
06/17 11:36, 48F

06/17 11:36, 7年前 , 49F
就必須要找相關專業的人幫你看 例如你的是法律問題若有必要
06/17 11:36, 49F

06/17 11:36, 7年前 , 50F
就是找專攻或是相關問題有實務經驗的律師事務所去詢問(但這
06/17 11:36, 50F

06/17 11:36, 7年前 , 51F
是經驗跟專業正常情況不是免費幫你的,所以會有一定的收費)
06/17 11:36, 51F

06/17 12:01, 7年前 , 52F
非常謝謝大家的意見,這樣我以後爬蟲到時候會更謹慎並且注
06/17 12:01, 52F

06/17 12:01, 7年前 , 53F
意是否遵守他們網站的規則還有網路禮儀
06/17 12:01, 53F

06/17 14:37, 7年前 , 54F
alog你要不要回一篇
06/17 14:37, 54F

06/17 18:27, 7年前 , 55F
樓主拜託不要刪文阿
06/17 18:27, 55F

06/17 20:26, 7年前 , 56F
alog大大專業
06/17 20:26, 56F

06/17 20:59, 7年前 , 57F
alog大大自己回應一篇吧 若原PO自刪這些心血就沒了
06/17 20:59, 57F

06/17 23:16, 7年前 , 58F
google搜索引擎也是爬蟲而來,會有alog提到的問題嗎?
06/17 23:16, 58F

06/17 23:33, 7年前 , 59F
google的引擎有遵守robots.txt啊 只爬公開資料
06/17 23:33, 59F

06/17 23:38, 7年前 , 60F
換句話說只要遵守robots.txt(X
06/17 23:38, 60F

06/17 23:42, 7年前 , 61F
06/17 23:42, 61F

06/18 07:34, 7年前 , 62F
4縮 ptt給人爬爽的 是不是該吉一波當作一輪募資啦?
06/18 07:34, 62F

06/18 12:17, 7年前 , 63F
結論其實就是違法,只是你怎麼做到人家不會告你而已
06/18 12:17, 63F

06/18 12:22, 7年前 , 64F
比價都結合導購返利,你告了營收反而會變低…
06/18 12:22, 64F

06/20 10:00, 7年前 , 65F
記得也有違反網站的TOS被民事提供的樣子. 他們也不是
06/20 10:00, 65F

06/20 10:02, 7年前 , 66F
要索償, 只是要求法院頒令在相關資料移除前關站而已
06/20 10:02, 66F

06/20 10:04, 7年前 , 67F
提告
06/20 10:04, 67F

06/20 15:06, 7年前 , 68F
很久以前台北市政府怎麼告 某公車app作者的?
06/20 15:06, 68F

06/20 15:06, 7年前 , 69F
有點忘了 還把人家搞到下架
06/20 15:06, 69F
文章代碼(AID): #1R9Il8Bb (Soft_Job)
文章代碼(AID): #1R9Il8Bb (Soft_Job)