Re: [解題] 高二下數學 敘述統計觀念
※ 引述《yonex (戴奧尼索斯)》之銘言:
: ※ 引述《Simon (我是素食寶寶N ﰠ )》之銘言:
: : 1.年級:高二
: : 2.科目:數學
: : 3.章節:敘述統計
: : 請問 為何母體變異數(標準差) 與 樣本變異數(標準差)的公式中
: : 前者分母取 N 後者則取 N-1
: : 為何會有這樣的差別,有何理論根據嗎?
: : 另外,考試時如果要考母體的變異數(標準差) 是否一定會指明?
: 考試的話,通常會說明這是樣本或母體...
: 否則,可依照現行課本所陳述,一律視為討論「樣本」變異數(標準差)
: 1.如果說,「平均數」提供了觀測資料「中心點」的位置
: 那麼,「離差」就是表達資料分散的狀況(離差越小,資料同質性越高)
: 在各種離差統計量中,以「標準差」最為常用...
: 2.母體的統計量常常是不容易得到的
: (例如:調查全國老百姓體重,困難度可想而知了)
: 所以抽樣調查,用樣本統計量推論母體統計量
: 如果說母體的全部資料總是可以(輕鬆)取得,那還學什麼統計呢?
: 在這裡先謹記:我們往往擁有的,只是樣本的資料數據
: 當然,樣本數越大越好,至於要多大,在這裡就不節外生枝了....
: 3.將:「觀測值與平均數間離差的平方加總後,再取平均」
: 我們稱之為「變異數」,可是因為變異數將資料的測量單位取了平方
: 所以為了讓單位一致起見,取其開平方值,定義為「標準差」
: 無論是標準差或變異數,都是衡量觀測值和平均值之間差異的統計量
: ---------------------
: 4.重點開始:為何計算樣本變異數要用 n-1 除?
: 假設:母體平均數μ 樣本平均數 M
: 計算母體變異數時用 N 來除,無論就邏輯或直覺而言,都是非常顯然的
: 但是我們現在要做的是:以樣本變異數來估計母體變異數
: ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
: 在處理樣本時,計算「觀測值與"平均數"間離差的平方加總」的當下,
: 那個"平均數"究竟是母體平均數還是樣本平均數呢?
: 當然以母體平均數是最好,不過如"2."所述,我們擁有的只是樣本平均數
: ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
: 母體的變異量:Σ(Xi-μ)^2
: 樣本的變異量:Σ(Xi-M)^2
: Σ(Xi-μ)^2=Σ(Xi-M+M-μ)^2=Σ(Xi-M)^2+n(M-μ)^2
: ^^^^^^^^^^^^ ^^^^^^^^^^^
抱歉這邊我切斷一下,
因為您底下的敘述,又是利用更多問題來解釋一個問題的方式。
當然您有提出一個故事,不過,
我想這是可以「努力」的部分,暫時還不用靠一個例子來帶過。
我們的目的想是在解釋Σ(Xi-M)^2代表的應該是多少個變異數。
例如:標準差的基本定義裡面,
我們允許Σ(Xi-μ)^2代表n個樣本變異數。
(這點同時代表(Xi-μ)^2為1個樣本變異數..................(*))
所以針對樣本的變異數表達方式,
我們只要瞭解Σ(Xi-M)^2應該是代表多少個變異數?n或n-1,n-2甚至n-(1/2)?
這個數字的答案,就是我們去除以n或n-1,n-2,...的理由。
我們若將上式轉為
Σ(Xi-M)^2 = Σ(Xi-μ)^2 - n(M-μ)^2
= n個母體變異數 - n個平均數的母體變異數
~~~~~~~~~~~~~~~~~~~~~~(**)
(**) = n[(X1+X2+...+Xn)/n-μ]^2
= n[(X1+X2+...+Xn)-nμ]^2/n^2
= [(X1+X2+...+Xn)-nμ]^2/n
= [(X1-μ)+(X2-μ)+...+(Xn-μ)]^2/n
= [(X1-μ)^2+(X2-μ)^2+...+(Xn-μ)^2+...]/n , PS:...略XD
= n個母體變異數/n
= 1個母體變異數
上面也就說明了,如果說每個樣本Xi都產生1個母體變異數,
那n個樣本X1,X2,...,Xn就產生了n個母體變異數,
那這n個樣本的平均數M就是產生了1/n個母體變異數。
所以,Σ(Xi-M)^2 = n個母體變異數 - n個平均數的母體變異數
= n個母體變異數 - n*(1/n個母體變異數)
= n-1個母體變異數。
上面便解釋了將Σ(Xi-M)^2除以n-1的理由。
: 由式子我們可看出:樣本變異量低估了母體變異量
: 如果說樣本變異量仍然除以n,所估計到的母體變異數就會「低估」了
: 就估計母體而言,樣本變異量的分母放 n-1 ,會緩和低估現象...
: 不用 n 而以 n-1 來除的合理性就在於此...
: 事實上,本問題在初等統計中...通常是以「不偏性」等觀念來說明...
: 「自由度」的解釋,則是需要線性代數的觀念
: 這樣的學習路線,對於一個高中生來說是無以負荷的....
: 即使對初學統計者而言,也不適當
: 至於為什麼? 這又是另一齣漫長的故事,不打算繼續囉唆了....
: : 雖然公式就是公式 但還是想瞭解一下比較學理方面講解
: : 像我教學生時 也會試著去解釋公式的來源與意義
: : 例如 母體的平均數 μ 與 樣本平均數的不同意義
: : 所以想了解一下 上述的問題
: 有一次加州理工學院的物理學家請教費曼:
: 何以自旋(spin)1/2的粒子必須遵守費米-狄拉克統計?
: 費曼說:「先給我一些時間,我準備用大一普通物理的觀念程度試著回答你」
: 過沒幾天費曼告訴那位教授:
: 「很抱歉,我已經試過了,但是一直無法把它簡化到大一程度。
: 也就是說,我們其實還不瞭解真正了解這個現象...」
: 同樣的,挑戰者號太空梭失事的真相調查,忙壞了全世界的科學家....
: 其實那也不過是一杯冰水與橡皮筋的故事...
: 任何正常程度的中小學生都能掌握.....
: 還有後話,不過先就此打住了....
: 我只是相信:當一個人能夠用深入淺出的方式表達,
: 通常意味著對問題的脈絡有著更通透的瞭解...
: 否則,我會懷疑他對於那些觀念,真有他以為的那麼充分掌握?!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.120.196.114
推
06/17 01:16, , 1F
06/17 01:16, 1F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 4 之 10 篇):
tutor 近期熱門文章
PTT職涯區 即時熱門文章