[解題] 高一下 數據分析 相關係數與迴歸直線

看板tutor (家教)作者 (誰是我的小天使?!)時間12年前 (2013/06/18 10:14), 編輯推噓16(16081)
留言97則, 11人參與, 最新討論串1/1
1.年級:高一下 2.科目:數學科 3.章節:第四章 數據分析 高雄市新興高中100學年度下學期第三次段考 題目來源:http://ppt.cc/EfBi 4.題目: S高中的高一有學生700位,第一次期中考與第二次期中考的數學 成績分別以X與Y表示(用0至100評分),若X與Y的相關係數為0.83, 則下列敘述何者正確? (A) 由相關係數得知,X與Y有正向關係(即第一次期中考考得好, 則第二次期中考考得會比較好;反之,則第二次期中考考得會 比較差) (B) 此兩次段考成績適合用x=a+by表示其相關情形(其中a,b為 ^^^^^^^^ 常數,b>0) (C) 2x+5與5-2y的相關係數為0.83 (D) 7+2x與5-2y的相關係數為-0.83 (E) ( log x )×50與( log y )×50的相關係數為 | log 0.83 | 5.想法: 這題新興高中給的答案是(A)(B)(D), 只是我對(B)選項有點不解, 雖然查了一下維基百科http://ppt.cc/pMFV 簡單線性回歸(英語:simple linear regression) 應用時機: 1. 以單一變數預測 2. 判斷兩變數之間相關的方向和程度 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ 但是很難理解如何用簡單線性迴歸去看兩變數間的相關程度, 一個迴歸係數為正的迴歸直線無法直接看出它們的相關程度吧? 即使是題目已給相關係數為0.83的高度相關, 這迴歸直線也只能看出他們的分佈情況,而非相關情況阿0.0 所以想請問所學是統計專長的老師, 還請您指點迷津,感恩! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.64.108.17 ※ 編輯: diego99 來自: 61.64.108.17 (06/18 10:16)

06/18 10:47, , 1F
應該單純就是因為高度相關所以適用迴歸直線罷了
06/18 10:47, 1F
題目已經說明它的相關係數了, 在選項裡面放個適合用迴歸直線表示其相關情形是件很奇怪的事情... 我要表達的是這條直線並無法表示相關情況阿。

06/18 12:27, , 2F
答案沒問題,你邏輯很怪
06/18 12:27, 2F
可以請老師您提出哪邊的邏輯很怪嗎? ※ 編輯: diego99 來自: 61.64.108.17 (06/18 12:44)

06/18 12:42, , 3F
我個人覺得和不合適~或是數值高不高~是很主觀的問題
06/18 12:42, 3F

06/18 12:43, , 4F
除非有一開始就定義出題者所謂的合適準則為何
06/18 12:43, 4F

06/18 12:44, , 5F
X與Y之間相關性高,且其關係接近X=a+bY <=這樣算相關情形嗎?
06/18 12:44, 5F

06/18 12:45, , 6F
我也覺得那個選項的用字不夠明確
06/18 12:45, 6F

06/18 12:46, , 7F
何謂相關性高~~我覺得這就很有爭議了
06/18 12:46, 7F

06/18 12:47, , 8F
有些課本或參考書會列出高中低度相關,相關係數的參考值
06/18 12:47, 8F

06/18 12:48, , 9F
但終究也是主觀認定,實際上根據回歸目的不同,「高」的門檻
06/18 12:48, 9F

06/18 12:48, , 10F
也是會變化的
06/18 12:48, 10F

06/18 12:49, , 11F
拍謝我廢話很多XD
06/18 12:49, 11F
不會,很感謝你們:) 現在我倒是滿期待知道我邏輯很怪的點在哪 ※ 編輯: diego99 來自: 61.64.108.17 (06/18 12:53)

06/18 12:57, , 12F
統計學上的相關性分析指的是兩變數間直線線性相關程度
06/18 12:57, 12F

06/18 12:58, , 13F
一般來說相關係數絕對值介於0.5與1之間就是強相關
06/18 12:58, 13F

06/18 12:59, , 14F
既然相關係在數學模型上對於直線的配適度高 使用題目
06/18 12:59, 14F

06/18 13:00, , 15F
使用B選項所說的方程式表達相關性是很合理的
06/18 13:00, 15F

06/18 13:31, , 16F
簡單回歸的話 相關係數達顯著 迴歸係數也會達顯著
06/18 13:31, 16F

06/18 13:32, , 17F
中學蠻多關於統計的題目都這樣 想太多反而選不出來
06/18 13:32, 17F

06/18 13:35, , 18F
以學生角度來選答案~會踹測出題老師的想法選擇B對
06/18 13:35, 18F

06/18 13:36, , 19F
以家教老師的想法~我會跟學生說這個選項其實不合理
06/18 13:36, 19F

06/18 13:37, , 20F
我覺得這是可以跟學生討論的~
06/18 13:37, 20F

06/18 13:38, , 21F
也有學生會問~~如過用一個699次的多項式來算出方程式
06/18 13:38, 21F

06/18 13:38, , 22F
這樣可以達成0誤差~~這樣是OK的嗎
06/18 13:38, 22F

06/18 13:44, , 23F
這選項明明就非常合理...
06/18 13:44, 23F

06/18 14:15, , 24F
原則上適用回歸直線的情況為|r|>0.7,即高度相關
06/18 14:15, 24F
感謝各位老師的回應, http://ppt.cc/DtI6 剛剛看了一下這一篇,順便複習了一下很久以前學的, 假設相關係數(或判定係數)夠高並且被檢定為顯著好了, 真的會有人說適合用一條直線來表示資料間的「相關」情形嗎?@@ ※ 編輯: diego99 來自: 61.64.108.17 (06/18 14:30)

06/18 15:26, , 25F
相關係數跟判定係數是兩件事情... 建議你找本統計的書
06/18 15:26, 25F

06/18 15:29, , 26F
好好看過 相關係數絕對值大小指的是兩隨機變數聯合
06/18 15:29, 26F

06/18 15:30, , 27F
率分佈在一條直線附近的配適程度 判定係數在講回歸模
06/18 15:30, 27F

06/18 15:31, , 28F
型解釋力 簡單線性回歸基本上就是以相關係數為基礎
06/18 15:31, 28F

06/18 15:32, , 29F
我沒說這兩個一樣喔...
06/18 15:32, 29F

06/18 15:34, , 30F
判定係數不是在說明資料間"相關"情形...
06/18 15:34, 30F

06/18 15:34, , 31F
簡單"線性"回歸 所以相關情形以直線作為判定準則
06/18 15:34, 31F
可是我看的書好像不是這樣耶, 判定係數R^2 = SSR/SST,目的是用來說明迴歸式的解釋能力, 做到這個地步的確可以解釋兩變數間呈現高度相關。 我要說明的事情是, 就算是用簡單線性迴歸, 你還是必須將判定係數計算出來, 才能知道兩變數間的相關情況, 而不是只拿出一條最適合直線出來就要說可以表示兩變數間的相關情形。

06/18 15:45, , 32F
為什麼不行,題目都說了"適合",也說了表示相關"情形"
06/18 15:45, 32F

06/18 15:46, , 33F
當然,有錯還請指正。
06/18 15:46, 33F
※ 編輯: diego99 來自: 61.64.108.17 (06/18 15:48)
還有 26 則推文
還有 2 段內文
06/18 16:27, , 60F
我想發問 為什麼b>0一定要加?
06/18 16:27, 60F
其實我更好奇的是明明題目就有說相關係數了, 為什麼選項中還要寫個適合用一條直線表示相關情形... 感覺一整個鬼打牆阿... 無論如何,感謝指教啦 :) ※ 編輯: diego99 來自: 61.64.108.17 (06/18 16:31)

06/18 16:29, , 61F
我覺得括號就算整個拿掉也可以選,只是加了括號的描述更精準
06/18 16:29, 61F

06/18 16:31, , 62F
我認為這題用字精確,完全沒問題,但是d老師大概聽不進去
06/18 16:31, 62F

06/18 17:00, , 63F
我的疑問只有一個~~相關係數多高才較高? WHY?
06/18 17:00, 63F

06/18 17:01, , 64F
數值要多高才叫做適合線性函數的模型? WHY?
06/18 17:01, 64F

06/18 17:02, , 65F
變成兩個疑問了 ...
06/18 17:02, 65F

06/18 17:06, , 66F
要是b<0表示變數間是反向關係, 相關係數必為負...
06/18 17:06, 66F

06/18 17:06, , 67F
所以要是沒寫b>0一定不能選
06/18 17:06, 67F

06/18 17:07, , 68F
更不用說括號拿掉了
06/18 17:07, 68F

06/18 17:09, , 69F
多高才適合的問題樓上D大跟W大有回答了
06/18 17:09, 69F

06/18 17:12, , 70F
可是選項本身沒有錯誤吧
06/18 17:12, 70F

06/18 17:12, , 71F
感覺像是:「他是男生」與「他是男高中生」的差別而已
06/18 17:12, 71F

06/18 17:16, , 72F
r=0.83 => R^2=0.83^2 , r 達顯著 <=> beta 達顯著
06/18 17:16, 72F

06/18 17:18, , 73F
沒有阿都說r=0.83了 r跟b在簡單回歸必定同號...
06/18 17:18, 73F

06/18 17:20, , 74F
不能使用b<0去表達XY之間關係 那是模型選擇錯誤...
06/18 17:20, 74F

06/18 17:21, , 75F
男高中生必定男生 男生未必男高中生...
06/18 17:21, 75F

06/18 17:22, , 76F
B沒寫有什麼差
06/18 17:22, 76F

06/18 17:27, , 77F
嗯~可是「他是男生」這個選項不會因為沒說高中生而不能選啊
06/18 17:27, 77F

06/18 17:27, , 78F
沒寫的話就可能"不適合"用X=a+bY表示關係 因為當b<0時
06/18 17:27, 78F

06/18 17:28, , 79F
跟兩變數相關性剛好相反 試想兩變數樣本在二維平面上
06/18 17:28, 79F

06/18 17:29, , 80F
排列成正斜率 可是你用負斜率直線方程式代表它
06/18 17:29, 80F

06/18 17:29, , 81F
這樣就是"不適合" 而題目要"適合"
06/18 17:29, 81F

06/18 17:30, , 82F
因為題目要的是男高中生不是男生而已~
06/18 17:30, 82F

06/19 01:31, , 83F
b沒寫也沒差阿 題目講適合 你硬要用負的去說不行
06/19 01:31, 83F

06/19 01:31, , 84F
適合是指用這個模型去描述 但用哪個是你選定的問題
06/19 01:31, 84F

06/19 01:32, , 85F
你不能選定一個錯的去推翻這東西 只是b有講會更精確罷了
06/19 01:32, 85F

06/19 01:38, , 86F
b如果沒寫就未必適合 我只是把不適合的地方舉例
06/19 01:38, 86F

06/19 01:38, , 87F
因為是多選題 要完全正確才能選吧
06/19 01:38, 87F

06/19 01:42, , 88F
我覺得B大的想法很有問題
06/19 01:42, 88F

06/19 01:47, , 89F
你是指b>0的部分嗎T^T
06/19 01:47, 89F

06/19 01:57, , 90F
當然是,b有沒有寫大於零哪有差啊
06/19 01:57, 90F

06/19 02:00, , 91F
好吧 可能我邏輯上有點錯誤 但寫<0或=0肯定不行的吧
06/19 02:00, 91F

06/19 02:00, , 92F
寫>0是比較嚴謹的做法
06/19 02:00, 92F
這題我最初的問題是 在相關係數夠高的情況下,是不是真的能用一條直線去表示其相關情況? 在我原本的認知中,只能說大多數樣本點會散佈在離這條直線很近的地方, 而非直接用這條直線就能把他們的相關情況給找出來。 不過有專家們的背書,我想我應該知道要如何跟學生解釋了。 感謝版上各位統計專家的指教 :) ※ 編輯: diego99 來自: 61.64.108.17 (06/19 11:39)

06/19 22:33, , 93F
Y_hat = a+bx 不代表所有點在一直線上 但有那個趨勢在
06/19 22:33, 93F

06/19 22:34, , 94F
Y_hat 是Y的估計值 相關係數(r)越接近-1或1
06/19 22:34, 94F

06/19 22:35, , 95F
判定係數 (R^2=r^2) 也會越高 代表真實的點會離直線越近
06/19 22:35, 95F

06/20 00:03, , 96F
A反而怪,「比較好、差」是跟什麼比也沒說清楚
06/20 00:03, 96F

06/20 00:04, , 97F
「相關情形」改成「關係」就較不會有混淆之虞了
06/20 00:04, 97F
文章代碼(AID): #1HlyAXVr (tutor)
文章代碼(AID): #1HlyAXVr (tutor)