Re: [心得] Similarweb | SEMrush | GA 哪個最不準?

看板Soft_Job (軟體人)作者 (天真可愛CQD)時間3年前 (2022/07/20 11:43), 3年前編輯推噓4(4029)
留言33則, 3人參與, 3年前最新討論串2/2 (看更多)
※ 引述《danceofdie (zong)》之銘言: : 1. 對於資料流量來源的總結,兩家公司都以隱私為由不公開資料來源,所以看完官方文件後也是不知道實際的來源是什麼。 https://www.similarweb.com/corp/ourdata/ https://www.semrush.com/kb/998 雖然很模糊,但這兩家其實有大概講一下資料來源 - 拿一堆關鍵字丟搜尋引擎的結果頁面看結果 - 跟上面類似,不過是去拉維基百科之類的大型公開資料 - 跟第三方買各種資料 - 第一方資料(不過說能拿到 GA 資料但不講怎麼拿到 GA 資料,毛毛的) 這種大規模資料搜集有時候生意不是那麼好端上檯面。 自己沒做過,但古早有聽人講過「到處下廣告,然後用廣告成效估計網站用量」之類的招 這招現在應該沒有五年十年前這麼好用,但大概還是有把戲能變? 另外 similarweb 直接在網站上提到他們會跟 ISP 買資料。 某個程度上滿嚇人的... 總之,他們的主要資料大~概~不是實際用量數據。 而是各種側面資料,加上一部分流量資料來作為估計用的基準。 這樣估計出來的資料光是能落在同一個數量級就很了不起了。 GA 直接用 JavaScript 測量網站使用狀況,品質會好得多 但也不會是百分之百準確 - Firefox 某些情況下會擋 GA,Brave 應該也會擋 - 跑在客戶端的 code 本來就不可能完全可信 - 會各種被塞(黑帽 SEO?)資料 -- 頂天立地:愛孩子就要支持蘿莉控 https://goo.gl/Zmk62o -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.47.15.211 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1658288600.A.606.html ※ 編輯: GALINE (114.47.15.211 臺灣), 07/20/2022 12:03:05

07/20 17:48, 3年前 , 1F
我印象中 similarweb 是透過網路封包分析(跟 ISP 買資料
07/20 17:48, 1F

07/20 17:48, 3年前 , 2F
理論上應該會比 GA 這種埋在 client side 的追蹤來得更準
07/20 17:48, 2F

07/20 17:48, 3年前 , 3F
主要是裝個 AD block or 不啟用 javascript
07/20 17:48, 3F

07/20 17:49, 3年前 , 4F
GA 基本上就追蹤不到了
07/20 17:49, 4F

07/20 17:49, 3年前 , 5F
而且近幾年瀏覽器對隱私越來越嚴格,越來越多防止追蹤功能
07/20 17:49, 5F

07/20 20:58, 3年前 , 6F
如果是 shared host 或雲端服務,分析能力還是有限
07/20 20:58, 6F

07/20 21:00, 3年前 , 7F
現在HTTPS幾乎標配,除非環境污染 MITM,不然打穿機率不高
07/20 21:00, 7F

07/20 21:01, 3年前 , 8F
自己的機器或固定外部IP應該就能抓很準了
07/20 21:01, 8F

07/20 21:02, 3年前 , 9F
突然想到DNS那個方向應該還是有招...
07/20 21:02, 9F

07/21 01:00, 3年前 , 10F
正常環境不會有MITM
07/21 01:00, 10F

07/21 01:02, 3年前 , 11F
數據資料可以一魚多吃 當你使用平台的服務就同意他
07/21 01:02, 11F

07/21 01:02, 3年前 , 12F
們可以怎麼使用你的資料 而且賠償是有上限的
07/21 01:02, 12F

07/21 01:04, 3年前 , 13F
有些數據也不一定需要ISP 那邊買
07/21 01:04, 13F

07/21 01:06, 3年前 , 14F
當你拉進那些免費的字體、JS、服務就是幫別人收集資
07/21 01:06, 14F

07/21 01:06, 3年前 , 15F
料完善他們的服務
07/21 01:06, 15F

07/21 01:20, 3年前 , 16F
舉例說 SEMRUSH 可以知道某網站數據狀況,上面的數
07/21 01:20, 16F

07/21 01:20, 3年前 , 17F
據缺很意外跟 GA 上的資料接近,即使有誤差。可是那
07/21 01:20, 17F

07/21 01:20, 3年前 , 18F
個網站呢用的AWS、Cloudfront + Cloudflare 的服務
07/21 01:20, 18F

07/21 01:22, 3年前 , 19F
其他就是一些常見的 GA、FB PIXEL、BING 追蹤轉換、
07/21 01:22, 19F

07/21 01:22, 3年前 , 20F
成效的東西
07/21 01:22, 20F

07/21 01:23, 3年前 , 21F
還有 Google Font
07/21 01:23, 21F

07/21 01:25, 3年前 , 22F
你說究竟是誰出賣了這個網站的呢 不知道 但是一開
07/21 01:25, 22F

07/21 01:25, 3年前 , 23F
始你同意了服務條款,他們也得到你的授權,他只要
07/21 01:25, 23F

07/21 01:25, 3年前 , 24F
適當的去掉可以識別的資料他們怎麼用你也拿他們沒
07/21 01:25, 24F

07/21 01:25, 3年前 , 25F
什麼辦法 畢竟免費服務麻
07/21 01:25, 25F

07/21 01:32, 3年前 , 26F
像某家賣IP Geo 資料的業者,他們怎麼可以抓到很準
07/21 01:32, 26F

07/21 01:32, 3年前 , 27F
確的 Country/City 可以思考一下他們以前推了什麼服
07/21 01:32, 27F

07/21 01:32, 3年前 , 28F
務給網友XD
07/21 01:32, 28F

07/21 01:37, 3年前 , 29F
還有一些數據平台資料鎖很緊,爬蟲還不一定爬得穩,
07/21 01:37, 29F

07/21 01:37, 3年前 , 30F
不是合作夥伴我是不相信啦XD
07/21 01:37, 30F

07/21 15:04, 3年前 , 31F
「正常」是不應該有...(望向 superfish 案
07/21 15:04, 31F

07/21 15:05, 3年前 , 32F
CDN 業者拿到的資料品質應該也不錯
07/21 15:05, 32F

07/21 15:16, 3年前 , 33F
這年頭資料都被賣來賣去的啊....
07/21 15:16, 33F
文章代碼(AID): #1YrtdOO6 (Soft_Job)
文章代碼(AID): #1YrtdOO6 (Soft_Job)