Re: [解題] 高二下數學 敘述統計觀念
※ 引述《choucj (心塵)》之銘言:
: ※ 引述《yonex (戴奧尼索斯)》之銘言:
: : 4.重點開始:為何計算樣本變異數要用 n-1 除?
: : 假設:母體平均數μ 樣本平均數 M
: : 計算母體變異數時用 N 來除,無論就邏輯或直覺而言,都是非常顯然的
: : 但是我們現在要做的是:以樣本變異數來估計母體變異數
: : ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
: : 在處理樣本時,計算「觀測值與"平均數"間離差的平方加總」的當下,
: : 那個"平均數"究竟是母體平均數還是樣本平均數呢?
: : 當然以母體平均數是最好,不過如"2."所述,我們擁有的只是樣本平均數
: : ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
: : 母體的變異量:Σ(Xi-μ)^2
: : 樣本的變異量:Σ(Xi-M)^2
: : Σ(Xi-μ)^2=Σ(Xi-M+M-μ)^2=Σ(Xi-M)^2+n(M-μ)^2
: : ^^^^^^^^^^^^ ^^^^^^^^^^^
: 抱歉這邊我切斷一下,
: 因為您底下的敘述,又是利用更多問題來解釋一個問題的方式。
: 當然您有提出一個故事
你好,我想你誤會我的原意了...
因為我預設回覆的問題是:為何樣本變異數不選擇 n,而選擇 n-1
對於一個資質普通的高中生,
我的陳述說明了:
樣本變異量仍然除以n,所估計到的母體變異數就會「低估」了
就估計母體而言,樣本變異量的分母放 n-1,會緩和低估現象...
就二選一的前提來說,我的工作已經結束....
我承認一個程度較佳的學生可能還會進一步的問:
換成n-1來估計母體,難道就不會高估嗎?
n-0.5 n-0.3 .....其餘的可能性不該繼續考慮嗎?
是的,這確實是有繼續努力下去的必要...
但我並不打算繼續回答下去...
因為這討論牽扯到不偏估計理論,對一個中學生無疑是不勝負荷的...
用 n-1 除是為了滿足「不偏性」使得E(s^2)=σ^2成立...
在統計上一個好的估計量常被要求滿足不偏性
樣本變異數究竟是否為母體變異數的不偏估計
這還牽扯到各樣本是否獨立的問題
經由簡單隨機抽樣,若所選取之樣本可以再放回
此時母體變異數定義為以 N 為分母,
那麼樣本變異數以n-1來除才滿足不偏性
若是有限母體取後不放回(事實上這更普遍),
即使樣本變異數以n-1來除仍是有偏的
這時反而是母體該採取 N-1....(國外教材中以這個觀點更為常見)
至於「標準差」估計母體,以不偏性考量,
則無論是以 n-1、n 來除,標準差的估計都有「誤差」...
換言之...除以 n 或除以 n-1,都是「人為」的...
既然是「人為」的,當然就可以講出一番道理,但這道理卻不絕對,
這也是統計學和數學在學習心理上的差異(統計學不是數學)
(或許我們說:隨機性數學與確定性數學之差異會更好)
即使對於初學統計的大學生來說,這一整串的論證仍然容易造成混淆
何況是對於沒接觸過推論統計的中學生而言呢?
這也是我提起費曼的故事以為殷鑑的原因...
我同意一個老師要儘量站在高觀點的立場來指導數學
但是當此立場與學習者之認知有所衝突時,
便應該以學生的可接受性為主要考量。
僅僅解釋為何 n-1 會比 n 來的適當,對中學生我想是夠了....
在這裡提供一個自由度觀點解釋的理路
對象是中學生,當然不偏性估計的討論只好捨棄.....
.............
樣本點對於平均數的離差定義為 Di=Xi-M
但是 n 個離差 D1,...,Dn , 並不代表n個獨立自由變數
因為受一個先天的限制式所約束:ΣDi=Σ(Xi-M) = 0
所以只有 n-1 個是自由的
換言之...當我們知道了五個離差中的四個,第五個離差值便自動決定
這就是最初淺的「自由度」解釋,大概也是一般高中生比較能接受的....
n 個離差,具有n-1個自由度
這代表離差佈於R^n空間中的n-1度子空間
而其平方和 ΣDi^2 (樣本變異"量") 也具有 n-1個自由度
這在向量空間中代表著 n 度空間中,一點至原點距離的平方
因而樣本變異"數"也是具有 n-1 個自由度
一個自由度提供一份變異量,
n-1 個自由度提供 n-1 份變異量。
所以總變異量是 n-1 份變異量的和,
除以 n-1 就是平均每一自由度的貢獻。
這就是之所以除以自由度,而不是除以離差數的原因...
嫻熟線性代數的學生,更可以用較抽象的高觀點去體會...
R^n 中的一個向量 X=(X1,...,Xn)
投影到 S=(1,1,...,1)的分量就是樣本平均數。
樣本變異數即是垂直投影向量,也就是殘差向量的長度平方
顯然....S的自由度為1,X的自由度為n,(空間概念中可能你會喜歡叫它維度,這無妨..)
因而樣本變異數的自由度為n-1
................
試圖以「包裝後的數學語言」讓一個中學生得以體會
你的出發點是值得嘉許的
但切莫注意不可曲學以詮釋...
即使是良善的立意也不代表什麼事情都能妥協
像是該用數學期望值時,就不應該刻意省略,
寫下 "Σ(Xi-M)^2= n-1個母體變異數" 是不被允許的
發明一些不存在的統計陳述更要避免...
這對學生的誤導比幫助還要更大....
你可以再仔細檢視一下自己的論述,訛誤處挺多的...
我就不一一舉證了...
不過你的立意是良好的,我讚美你嘗試的努力...
規避不偏性而又能具備完備的解釋,就我而言也是做不到.....
但我卻也不想走一條以偏蓋全的路啦...
把努力放在未來,對學生還是比較好的....
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.56.182.48
推
06/19 01:06, , 1F
06/19 01:06, 1F
※ 編輯: yonex 來自: 61.56.182.48 (06/19 04:07)
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 6 之 10 篇):
tutor 近期熱門文章
PTT職涯區 即時熱門文章
51
108