Re: [解題] 高二下數學 敘述統計觀念

看板tutor (家教)作者 (心塵)時間18年前 (2007/06/16 23:57), 編輯推噓1(100)
留言1則, 1人參與, 最新討論串4/10 (看更多)
※ 引述《yonex (戴奧尼索斯)》之銘言: : ※ 引述《Simon (我是素食寶寶N ﰠ )》之銘言: : : 1.年級:高二 : : 2.科目:數學 : : 3.章節:敘述統計 : : 請問 為何母體變異數(標準差) 與 樣本變異數(標準差)的公式中 : : 前者分母取 N 後者則取 N-1 : : 為何會有這樣的差別,有何理論根據嗎? : : 另外,考試時如果要考母體的變異數(標準差) 是否一定會指明? : 考試的話,通常會說明這是樣本或母體... : 否則,可依照現行課本所陳述,一律視為討論「樣本」變異數(標準差) : 1.如果說,「平均數」提供了觀測資料「中心點」的位置 : 那麼,「離差」就是表達資料分散的狀況(離差越小,資料同質性越高) : 在各種離差統計量中,以「標準差」最為常用... : 2.母體的統計量常常是不容易得到的 : (例如:調查全國老百姓體重,困難度可想而知了) : 所以抽樣調查,用樣本統計量推論母體統計量 : 如果說母體的全部資料總是可以(輕鬆)取得,那還學什麼統計呢? : 在這裡先謹記:我們往往擁有的,只是樣本的資料數據 : 當然,樣本數越大越好,至於要多大,在這裡就不節外生枝了.... : 3.將:「觀測值與平均數間離差的平方加總後,再取平均」 : 我們稱之為「變異數」,可是因為變異數將資料的測量單位取了平方 : 所以為了讓單位一致起見,取其開平方值,定義為「標準差」 : 無論是標準差或變異數,都是衡量觀測值和平均值之間差異的統計量 : --------------------- : 4.重點開始:為何計算樣本變異數要用 n-1 除? : 假設:母體平均數μ 樣本平均數 M : 計算母體變異數時用 N 來除,無論就邏輯或直覺而言,都是非常顯然的 : 但是我們現在要做的是:以樣本變異數來估計母體變異數 : ^^^^^^^^^^^^^^^^^^^^^^^^^^^^ : 在處理樣本時,計算「觀測值與"平均數"間離差的平方加總」的當下, : 那個"平均數"究竟是母體平均數還是樣本平均數呢? : 當然以母體平均數是最好,不過如"2."所述,我們擁有的只是樣本平均數 : ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ : 母體的變異量:Σ(Xi-μ)^2 : 樣本的變異量:Σ(Xi-M)^2 : Σ(Xi-μ)^2=Σ(Xi-M+M-μ)^2=Σ(Xi-M)^2+n(M-μ)^2 : ^^^^^^^^^^^^ ^^^^^^^^^^^ 抱歉這邊我切斷一下, 因為您底下的敘述,又是利用更多問題來解釋一個問題的方式。 當然您有提出一個故事,不過, 我想這是可以「努力」的部分,暫時還不用靠一個例子來帶過。 我們的目的想是在解釋Σ(Xi-M)^2代表的應該是多少個變異數。 例如:標準差的基本定義裡面, 我們允許Σ(Xi-μ)^2代表n個樣本變異數。 (這點同時代表(Xi-μ)^2為1個樣本變異數..................(*)) 所以針對樣本的變異數表達方式, 我們只要瞭解Σ(Xi-M)^2應該是代表多少個變異數?n或n-1,n-2甚至n-(1/2)? 這個數字的答案,就是我們去除以n或n-1,n-2,...的理由。 我們若將上式轉為 Σ(Xi-M)^2 = Σ(Xi-μ)^2 - n(M-μ)^2 = n個母體變異數 - n個平均數的母體變異數 ~~~~~~~~~~~~~~~~~~~~~~(**) (**) = n[(X1+X2+...+Xn)/n-μ]^2 = n[(X1+X2+...+Xn)-nμ]^2/n^2 = [(X1+X2+...+Xn)-nμ]^2/n = [(X1-μ)+(X2-μ)+...+(Xn-μ)]^2/n = [(X1-μ)^2+(X2-μ)^2+...+(Xn-μ)^2+...]/n , PS:...略XD = n個母體變異數/n = 1個母體變異數 上面也就說明了,如果說每個樣本Xi都產生1個母體變異數, 那n個樣本X1,X2,...,Xn就產生了n個母體變異數, 那這n個樣本的平均數M就是產生了1/n個母體變異數。 所以,Σ(Xi-M)^2 = n個母體變異數 - n個平均數的母體變異數 = n個母體變異數 - n*(1/n個母體變異數) = n-1個母體變異數。 上面便解釋了將Σ(Xi-M)^2除以n-1的理由。 : 由式子我們可看出:樣本變異量低估了母體變異量 : 如果說樣本變異量仍然除以n,所估計到的母體變異數就會「低估」了 : 就估計母體而言,樣本變異量的分母放 n-1 ,會緩和低估現象... : 不用 n 而以 n-1 來除的合理性就在於此... : 事實上,本問題在初等統計中...通常是以「不偏性」等觀念來說明... : 「自由度」的解釋,則是需要線性代數的觀念 : 這樣的學習路線,對於一個高中生來說是無以負荷的.... : 即使對初學統計者而言,也不適當 : 至於為什麼? 這又是另一齣漫長的故事,不打算繼續囉唆了.... : : 雖然公式就是公式 但還是想瞭解一下比較學理方面講解 : : 像我教學生時 也會試著去解釋公式的來源與意義 : : 例如 母體的平均數 μ 與 樣本平均數的不同意義 : : 所以想了解一下 上述的問題 : 有一次加州理工學院的物理學家請教費曼: : 何以自旋(spin)1/2的粒子必須遵守費米-狄拉克統計? : 費曼說:「先給我一些時間,我準備用大一普通物理的觀念程度試著回答你」 : 過沒幾天費曼告訴那位教授: : 「很抱歉,我已經試過了,但是一直無法把它簡化到大一程度。 : 也就是說,我們其實還不瞭解真正了解這個現象...」 : 同樣的,挑戰者號太空梭失事的真相調查,忙壞了全世界的科學家.... : 其實那也不過是一杯冰水與橡皮筋的故事... : 任何正常程度的中小學生都能掌握..... : 還有後話,不過先就此打住了.... : 我只是相信:當一個人能夠用深入淺出的方式表達, : 通常意味著對問題的脈絡有著更通透的瞭解... : 否則,我會懷疑他對於那些觀念,真有他以為的那麼充分掌握?! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.120.196.114

06/17 01:16, , 1F
講得相當清楚, 不曉得教給高中生的接受度如何? :D
06/17 01:16, 1F
文章代碼(AID): #16T0Xsh6 (tutor)
討論串 (同標題文章)
文章代碼(AID): #16T0Xsh6 (tutor)