[請益] 班佛定律至少要有3000樣本數是怎麼算的?

看板ask-why (知識奧秘)作者 (依法不依人)時間3年前 (2021/11/09 00:04), 2年前編輯推噓0(0012)
留言12則, 2人參與, 3年前最新討論串1/6 (看更多)
班佛定律老實說很冷門 我看了1,20本經濟或統計的書也沒啥人引用過 有人說可以用來檢驗選舉或帳目有無人為篡改 條件是隨機資料要有3000筆以上 隨機資料和隨機抽樣意思差不多 就是不能有外部人為干預下自然產生的結果 比如統計樣本至少要有1068才能反應母體 那3000這數字是怎麼得出來的? 若有這限制 也無法用來檢驗選舉作票 因為每投票所的人口不到3000 通常都在2000以下 投票率七成則在1500以下 數據永遠不到3000筆 至少每個投票所母數要有5000 投票率六成以上才能符合門檻值 樣本數量根本未達標 還有人用這理論在檢驗 不是很奇怪?? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.168.239.230 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/ask-why/M.1636387454.A.2DD.html

06/24 07:48, 3年前 , 1F
應是檢定力(power of test)的考慮. 欲檢定是否符合班佛定律
06/24 07:48, 1F

06/24 07:50, 3年前 , 2F
如果有100筆或110筆資料, 也就是 n = 100 以上大概就可以做
06/24 07:50, 2F

06/24 07:51, 3年前 , 3F
卡方近似檢定了, 甚至更小的樣本也勉強可以. 然而只有檢定
06/24 07:51, 3F

06/24 07:53, 3年前 , 4F
力夠高, 才可能合理地檢測出不符合該定律的情況. 也就是說,
06/24 07:53, 4F

06/24 07:55, 3年前 , 5F
必須決定一個不符班佛定律的分布, 然後要求上述卡方檢定拒
06/24 07:55, 5F

06/24 07:56, 3年前 , 6F
絕 "資料符合班佛定律" 這假說的機率夠高, 例如 0.90 以上.
06/24 07:56, 6F

06/24 10:15, 3年前 , 7F
經計算, 如果乖離比例(真實比例與班佛定律機率相對離差)平
06/24 10:15, 7F

06/24 10:17, 3年前 , 8F
方的平均是 0.01, 相當於平均 10% 的乖離率, 則 n=3000 時
06/24 10:17, 8F

06/24 10:18, 3年前 , 9F
檢定力約 0.99, 如果 n = 2000, 檢定力略高於 0.90, 哦...
06/24 10:18, 9F

06/24 10:20, 3年前 , 10F
這是在顯著水準定為 0.05 的情況.
06/24 10:20, 10F

06/30 20:03, 3年前 , 11F
那用統計學就好了 樣本數1068就能達到95%的信心水準
06/30 20:03, 11F

06/30 20:04, 3年前 , 12F
班佛定律樣本數要2000才達到90% 應該被奧坎剃刀砍掉
06/30 20:04, 12F
※ 編輯: souldragon (118.168.234.48 臺灣), 06/30/2022 20:05:24
文章代碼(AID): #1XYKf-BT (ask-why)
討論串 (同標題文章)
文章代碼(AID): #1XYKf-BT (ask-why)