Re: [閒聊] 內政部實價登錄網站

看板Soft_Job (軟體人)作者 (★閃亮數學推理★)時間13年前 (2012/11/15 22:17), 編輯推噓28(280156)
留言184則, 15人參與, 最新討論串4/21 (看更多)
1. 我會說你根本不懂open data 2. 政府所有的資料都是本來就應該要公開給民眾的 除非有密字級以上或有特定法律規定 3. 我還真的不知道原來政府引進資訊系統後還會造成資料流通的花費增加 請問資訊科技的目的是什麼 4. 非官方網站各自喊價民眾有自主選擇的權力 實價登錄的初衷是資訊的透明化 其他人要拿去做什麼那都不重要 請不要倒果為因 5. 這件事情本來應該是某政務委員最愛推動的XX雲要做的 open government data 已經是世界潮流了 他的目的最簡單來說就是要讓所有人民能夠存取政府的資料 當然不可能要求人民人人都擁有資訊處理的能力 所以政府在開放資料的時候通常是必須以"降低使用資料的門檻"為目標 而非提升使用門檻 這個逆行倒施的做法居然還有人支持 實在難以理解這類思維 6. 資訊產業的未來之一將會是資料探勘(Data mining) 擁有資料探勘的技術將會是台灣有機會與國際對抗的一個領域 現在整天喊雲 你雲裡面沒東西 就算有東西好了 你根本不會用 或者東西通通都是一堆滿滿惡意雜訊 還要對你說Aren't you thankful? 今天你阻擋了資料的來源 就等於你阻擋了明日可能產出的相關技術與產業 給幾個連結大家有興趣的可以去看 http://www.opendata.tw/ http://creativecommons.tw/blog/02011226 這裡給台北市政府一個好評 我個人認為他們是全台灣跑最前面也最能掌握open data精髓的單位 (比起中央都好太多了) http://data.taipei.gov.tw/opendata/rule;jsessionid=21795FA463828F7F4D3E89E4820F218D ※ 引述《IBIZA (溫一壺月光作酒)》之銘言: : 1.其實實價登錄資料可以直接向政府要raw data : 填好申請單付工本費幾千元, 就可以拿到資料 : 根本不需要自己去grab整個網站的資料, 還拖累想要上網站查詢的民眾 : 詳情請參考 政府資訊公開法 : 不動產成交案件實際資訊申報登錄及查詢收費辦法 : 內政部檔案申請閱覽須知 : 內政部及所屬機關提供政府資訊收費標準 : http://www.land.moi.gov.tw/chhtml/landfaq1.asp?fqid=774&cid=2 : 2.非官方網站提供區段均價, 又不公開區段劃分原則 : 只會淪為各自喊價, 徒增爭議, 失去實價登錄的初衷 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 1.163.165.221

11/15 22:34, , 1F
1.本來就是有公開的
11/15 22:34, 1F

11/15 22:34, , 2F
2.哪邊的流動花費增加了?
11/15 22:34, 2F

11/15 22:35, , 3F
3.資料使用門檻的提升是因為有人去grab網站, 防礙正常使用
11/15 22:35, 3F

11/15 22:37, , 4F
當初沒有任何人爬網站,單純使用量就把網站塞爆了
11/15 22:37, 4F

11/15 22:42, , 5F
沒有任何人grab網站? 跟據地圖版實價登錄網站的facebook官網
11/15 22:42, 5F

11/15 22:42, , 6F
他們是還沒開放前就已經準備要進去grab資料了吧?
11/15 22:42, 6F

11/15 22:43, , 7F
然後內政部實價登錄網站一開放, 地圖版的官網就開始討論他們
11/15 22:43, 7F

11/15 22:44, , 8F
連上去下載資料的經過
11/15 22:44, 8F

11/15 22:44, , 9F
這叫「當初沒有任何人爬網站」?
11/15 22:44, 9F

11/15 22:45, , 10F
crab是正常網路會發生的事情 你要認為是攻擊就定法阻止
11/15 22:45, 10F

11/15 22:46, , 11F
現在不就是設法阻止嗎?
11/15 22:46, 11F

11/15 22:46, , 12F
你要資料去申請嘛 幹嘛用grab的?
11/15 22:46, 12F

11/15 22:49, , 13F
樓上根本沒搞懂時價登錄的意義 我已經說了 資料開放
11/15 22:49, 13F

11/15 22:50, , 14F
資料本來就是開放的 但是要大量下載應該循途徑去申請光碟
11/15 22:50, 14F

11/15 22:50, , 15F
不要從網站grab, 這樣很難懂嗎?
11/15 22:50, 15F

11/15 22:51, , 16F
不是只有你一個網站想上去看價錢
11/15 22:51, 16F

11/15 22:54, , 17F
如果你認為申請太慢 費用太貴, 你可以push政府去改變作法
11/15 22:54, 17F

11/15 22:54, , 18F
但是 不要從網站grab, 這樣很難懂嗎?
11/15 22:54, 18F

11/15 23:00, , 19F
「不要從網站grab」... 我完全不認同這句話
11/15 23:00, 19F

11/15 23:00, , 20F
也對。並不是硬逼政府開放API, 讓我們grab才叫open data.
11/15 23:00, 20F

11/15 23:01, , 21F
資料是開放的,但請依照規定讀取。不要佔用真正使用者
11/15 23:01, 21F

11/15 23:01, , 22F
的頻寬。
11/15 23:01, 22F

11/15 23:01, , 23F
開放API就不用用爬蟲去取了好嗎...
11/15 23:01, 23F

11/15 23:01, , 24F
還是那句話
11/15 23:01, 24F

11/15 23:02, , 25F
你希望政府開放甚麼 請請循途徑去push, 在沒有開放api或是
11/15 23:02, 25F

11/15 23:02, , 26F
cvs下載等方式之前, 麻煩請用現有方式去申請資料
11/15 23:02, 26F

11/15 23:02, , 27F
不要grab網站, 佔用一般使用者的頻寬
11/15 23:02, 27F

11/15 23:03, , 28F
這樣很難懂嗎?
11/15 23:03, 28F

11/15 23:04, , 29F
API很容易就可以跟一般使用者頻寬完全分開來
11/15 23:04, 29F

11/15 23:04, , 30F
用頻寬來當作不要開放API的藉口真是一點道理也沒有
11/15 23:04, 30F

11/15 23:04, , 31F
是, 有很多方法可以作 但是這些方法沒有建立前, 請不要用
11/15 23:04, 31F

11/15 23:04, , 32F
grab的方式
11/15 23:04, 32F

11/15 23:04, , 33F
見鬼了 我哪裡說不要開放了?
11/15 23:04, 33F

11/15 23:04, , 34F
你要說現在一般使用者的頻寬。現在政府網站只能讓你看十分
11/15 23:04, 34F

11/15 23:05, , 35F
鐘,就會把人踢走。這就是你所捍衛的頻寬!!笑死人了!
11/15 23:05, 35F

11/15 23:05, , 36F
誰希望政府開放api或是cvs下載 請去push政府
11/15 23:05, 36F

11/15 23:05, , 37F
不要現在沒得下載就用grab, 影響我們一般人正常使用
11/15 23:05, 37F

11/15 23:05, , 38F
什麼爛網站 才幾個人上線就炸了 政府還說要做雲端
11/15 23:05, 38F

11/15 23:05, , 39F
另外 我使用上並沒有十分鐘就被踢的問題喔
11/15 23:05, 39F
還有 105 則推文
11/15 23:45, , 145F
說是大家一起搞掛的總是沒錯
11/15 23:45, 145F

11/15 23:46, , 146F
而且一支crawler 起碼有幾百人戰力吧
11/15 23:46, 146F

11/15 23:46, , 147F
我們不用管是crawler還是人,一個網站稱不了千人流量就是爛
11/15 23:46, 147F

11/15 23:46, , 148F
crawler 大概就抵兩三個人吧
11/15 23:46, 148F

11/15 23:47, , 149F
會把crawler當幾百人戰力,就說明你完全不懂crawler
11/15 23:47, 149F

11/15 23:47, , 150F
如果兩三人的話 那豈不是要下載很久@@
11/15 23:47, 150F

11/15 23:48, , 151F
你以為是哈利波特, 揮個魔杖 data 就全部抓好囉 ?
11/15 23:48, 151F

11/15 23:48, , 152F
以前用netant grab網站的確都是一開幾十連線在抓啊XD
11/15 23:48, 152F

11/15 23:48, , 153F
不過那可以調整就是了..
11/15 23:48, 153F

11/15 23:50, , 154F
開幾十個大概抓個兩秒 就可以等廠商去重開機了 何苦呢
11/15 23:50, 154F

11/15 23:50, , 155F
你把crawler當BT用嗎?ㄆㄆ
11/15 23:50, 155F

11/15 23:51, , 156F
同時開幾十個連線,你要sync還有存入資料庫也很苦啊老大
11/15 23:51, 156F

11/15 23:52, , 157F
netant都是整個檔案抓下來 不用存入資料庫^^
11/15 23:52, 157F

11/15 23:54, , 158F
所以才說你不懂crawler在幹嘛啊!!你以為是下載機器人喔
11/15 23:54, 158F

11/15 23:58, , 159F
講越多只會透漏自己無知的程度 :(
11/15 23:58, 159F

11/16 00:00, , 160F
難怪他會在那邊大聲要大家做一些莫名其妙的事情
11/16 00:00, 160F

11/16 00:01, , 161F
dryman, 抱歉, 我的確不該用我砍站的經驗去看crawler..
11/16 00:01, 161F

11/16 00:01, , 162F
真氣人 -_________-|| 本來是不想去砍...
11/16 00:01, 162F

11/16 00:02, , 163F
他現在這樣我就很去砍下來 ocr ... 這種手法根本就白痴嘛
11/16 00:02, 163F

11/16 00:02, , 164F
文字改圖這種智障事情也幹的出來... 唉....
11/16 00:02, 164F

11/16 00:03, , 165F
有爬站能力的人,這種根本擋不住他,字以為聰明的白痴政府
11/16 00:03, 165F

11/16 00:04, , 166F
別為這種事浪費自己的時間啊~~~ (咦XD)
11/16 00:04, 166F

11/16 00:04, , 167F
不管下這命令的市政府還是包商,都只充分顯示其智能的缺陷
11/16 00:04, 167F

11/16 00:05, , 168F
包商應該是不能下令的, 不過這倒不是第一次看到就是了
11/16 00:05, 168F

11/16 00:05, , 169F
政府官員在記者會上的說法是 "包商建議的"
11/16 00:05, 169F

11/16 00:06, , 170F
正常流程應該是政府的人問包商怎麼擋 然後包商建議方法吧
11/16 00:06, 170F

11/16 00:07, , 171F
擋個屁,有那個閒功夫浪費那個CPU不如想辦法提昇QOS 智缺..
11/16 00:07, 171F

11/16 00:11, , 172F
沒有新資料 明天早上八點才有...
11/16 00:11, 172F

11/16 00:11, , 173F
明天早上八點才會知道一個月的修補能不能承受得住尖峰流量了
11/16 00:11, 173F

11/16 00:12, , 174F
整段看下來...有一個感覺,你先承認你就是...
11/16 00:12, 174F

11/16 00:14, , 175F
我先承認啊 我對crawler的認知 是受之前砍站的影響
11/16 00:14, 175F

11/16 00:14, , 176F
所以認為應該都是很多線在不斷的抓or try
11/16 00:14, 176F

11/16 00:16, , 177F
如果是慢慢抓 那的確影響不大
11/16 00:16, 177F

11/16 00:37, , 178F
不要再造窯了啦
11/16 00:37, 178F

11/16 06:21, , 179F
圖片真的很好笑
11/16 06:21, 179F

11/16 13:04, , 180F
To IBIZA: 是公開,但不是開放。因為1. 一個月後才給資料,
11/16 13:04, 180F

11/16 13:04, , 181F
市場變化很大的.. 2. 資料的授權也寫的不清不楚...
11/16 13:04, 181F

11/16 21:20, , 182F
不要再造謠啦 不提供資料乾脆把網站收掉算了
11/16 21:20, 182F

11/17 23:27, , 183F
拜託外行的不要再誤導鄉民 說crawler會打掛網站根本是
11/17 23:27, 183F

11/17 23:28, , 184F
外行的 居然一堆鄉民聞之起舞... 倒果為因 積非成是
11/17 23:28, 184F
文章代碼(AID): #1GfFc976 (Soft_Job)
討論串 (同標題文章)
文章代碼(AID): #1GfFc976 (Soft_Job)