Re: [解題] 高二下數學 敘述統計觀念

看板tutor (家教)作者 (戴奧尼索斯)時間18年前 (2007/06/19 00:58), 編輯推噓1(100)
留言1則, 1人參與, 最新討論串6/10 (看更多)
※ 引述《choucj (心塵)》之銘言: : ※ 引述《yonex (戴奧尼索斯)》之銘言: : : 4.重點開始:為何計算樣本變異數要用 n-1 除? : : 假設:母體平均數μ 樣本平均數 M : : 計算母體變異數時用 N 來除,無論就邏輯或直覺而言,都是非常顯然的 : : 但是我們現在要做的是:以樣本變異數來估計母體變異數 : : ^^^^^^^^^^^^^^^^^^^^^^^^^^^^ : : 在處理樣本時,計算「觀測值與"平均數"間離差的平方加總」的當下, : : 那個"平均數"究竟是母體平均數還是樣本平均數呢? : : 當然以母體平均數是最好,不過如"2."所述,我們擁有的只是樣本平均數 : : ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ : : 母體的變異量:Σ(Xi-μ)^2 : : 樣本的變異量:Σ(Xi-M)^2 : : Σ(Xi-μ)^2=Σ(Xi-M+M-μ)^2=Σ(Xi-M)^2+n(M-μ)^2 : : ^^^^^^^^^^^^ ^^^^^^^^^^^ : 抱歉這邊我切斷一下, : 因為您底下的敘述,又是利用更多問題來解釋一個問題的方式。 : 當然您有提出一個故事 你好,我想你誤會我的原意了... 因為我預設回覆的問題是:為何樣本變異數不選擇 n,而選擇 n-1 對於一個資質普通的高中生, 我的陳述說明了: 樣本變異量仍然除以n,所估計到的母體變異數就會「低估」了 就估計母體而言,樣本變異量的分母放 n-1,會緩和低估現象... 就二選一的前提來說,我的工作已經結束.... 我承認一個程度較佳的學生可能還會進一步的問: 換成n-1來估計母體,難道就不會高估嗎? n-0.5 n-0.3 .....其餘的可能性不該繼續考慮嗎? 是的,這確實是有繼續努力下去的必要... 但我並不打算繼續回答下去... 因為這討論牽扯到不偏估計理論,對一個中學生無疑是不勝負荷的... 用 n-1 除是為了滿足「不偏性」使得E(s^2)=σ^2成立... 在統計上一個好的估計量常被要求滿足不偏性 樣本變異數究竟是否為母體變異數的不偏估計 這還牽扯到各樣本是否獨立的問題 經由簡單隨機抽樣,若所選取之樣本可以再放回 此時母體變異數定義為以 N 為分母, 那麼樣本變異數以n-1來除才滿足不偏性 若是有限母體取後不放回(事實上這更普遍), 即使樣本變異數以n-1來除仍是有偏的 這時反而是母體該採取 N-1....(國外教材中以這個觀點更為常見) 至於「標準差」估計母體,以不偏性考量, 則無論是以 n-1、n 來除,標準差的估計都有「誤差」... 換言之...除以 n 或除以 n-1,都是「人為」的... 既然是「人為」的,當然就可以講出一番道理,但這道理卻不絕對, 這也是統計學和數學在學習心理上的差異(統計學不是數學) (或許我們說:隨機性數學與確定性數學之差異會更好) 即使對於初學統計的大學生來說,這一整串的論證仍然容易造成混淆 何況是對於沒接觸過推論統計的中學生而言呢? 這也是我提起費曼的故事以為殷鑑的原因... 我同意一個老師要儘量站在高觀點的立場來指導數學 但是當此立場與學習者之認知有所衝突時, 便應該以學生的可接受性為主要考量。 僅僅解釋為何 n-1 會比 n 來的適當,對中學生我想是夠了.... 在這裡提供一個自由度觀點解釋的理路 對象是中學生,當然不偏性估計的討論只好捨棄..... ............. 樣本點對於平均數的離差定義為 Di=Xi-M 但是 n 個離差 D1,...,Dn , 並不代表n個獨立自由變數 因為受一個先天的限制式所約束:ΣDi=Σ(Xi-M) = 0 所以只有 n-1 個是自由的 換言之...當我們知道了五個離差中的四個,第五個離差值便自動決定 這就是最初淺的「自由度」解釋,大概也是一般高中生比較能接受的.... n 個離差,具有n-1個自由度 這代表離差佈於R^n空間中的n-1度子空間 而其平方和 ΣDi^2 (樣本變異"量") 也具有 n-1個自由度 這在向量空間中代表著 n 度空間中,一點至原點距離的平方 因而樣本變異"數"也是具有 n-1 個自由度 一個自由度提供一份變異量, n-1 個自由度提供 n-1 份變異量。 所以總變異量是 n-1 份變異量的和, 除以 n-1 就是平均每一自由度的貢獻。 這就是之所以除以自由度,而不是除以離差數的原因... 嫻熟線性代數的學生,更可以用較抽象的高觀點去體會... R^n 中的一個向量 X=(X1,...,Xn) 投影到 S=(1,1,...,1)的分量就是樣本平均數。 樣本變異數即是垂直投影向量,也就是殘差向量的長度平方 顯然....S的自由度為1,X的自由度為n,(空間概念中可能你會喜歡叫它維度,這無妨..) 因而樣本變異數的自由度為n-1 ................ 試圖以「包裝後的數學語言」讓一個中學生得以體會 你的出發點是值得嘉許的 但切莫注意不可曲學以詮釋... 即使是良善的立意也不代表什麼事情都能妥協 像是該用數學期望值時,就不應該刻意省略, 寫下 "Σ(Xi-M)^2= n-1個母體變異數" 是不被允許的 發明一些不存在的統計陳述更要避免... 這對學生的誤導比幫助還要更大.... 你可以再仔細檢視一下自己的論述,訛誤處挺多的... 我就不一一舉證了... 不過你的立意是良好的,我讚美你嘗試的努力... 規避不偏性而又能具備完備的解釋,就我而言也是做不到..... 但我卻也不想走一條以偏蓋全的路啦... 把努力放在未來,對學生還是比較好的.... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.56.182.48

06/19 01:06, , 1F
未看先推....一系列要看都還沒看
06/19 01:06, 1F
※ 編輯: yonex 來自: 61.56.182.48 (06/19 04:07)
文章代碼(AID): #16ThdJpD (tutor)
討論串 (同標題文章)
文章代碼(AID): #16ThdJpD (tutor)