[問題] ANOVA table 是否能降維? (晶片)
two-way ANOVA table
-----------------------------------------------------
控制組 控制組 控制組 實驗組 實驗組 實驗組
row1 15 15 15 400 400 400
row2 50 50 50 300 300 300
row3 10 10 10 200 200 200
-----------------------------------------------------
在 交互作用不顯著 時
能否進行以下的降維動作?
三條 rows 取平均 , 變成 rowPOOL
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
控制組 控制組 控制組 實驗組 實驗組 實驗組
rowPOOL 25 25 25 300 300 300
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
或是只有交互作用不顯著的條件仍然不夠
需要其它條件
還是跟本不能這樣做?
誠心請教
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.239.247
※ 編輯: gsuper 來自: 140.113.239.247 (03/08 23:32)
※ 編輯: gsuper 來自: 140.113.239.247 (03/08 23:32)
※ 編輯: gsuper 來自: 140.113.239.247 (03/08 23:34)
※ 編輯: gsuper 來自: 140.113.239.247 (03/08 23:35)
※ 編輯: gsuper 來自: 140.113.239.247 (03/08 23:36)
→
03/09 07:01,
03/09 07:01
→
03/09 08:12,
03/09 08:12
→
03/09 08:14,
03/09 08:14
→
03/09 08:16,
03/09 08:16
→
03/09 08:17,
03/09 08:17
有點一言難盡....
這個 case 實際上是這樣
-----------------------------------------------------
控制組 控制組 控制組 實驗組 實驗組 實驗組
row1 15 15 15 400 400 400 "Inpp5d"
row2 50 50 50 300 300 300 "Inpp5d"
row3 10 10 10 200 200 200 "Inpp5d"
-----------------------------------------------------
右邊綠色的是 基因名
上面的 table 可以視為 one gene region
Total 約 20000~30000 gene regions
Naive method :
3條rows 任意一條顯著 , 就說此基因顯著 (Most people used)
但這樣會造成 Data 的浪費
或是找出一堆 outlier rows
甚至是 兩條rows 的結果矛頓
(同時支持顯著大和顯著小!?)
--> 所以 rows 必需適當的整合
若是樣本夠大
確實只需要組合 one-way ANOVA 和 two-way ANOVA
就可以靠穩健性直接搞定問題
但因為在實務上樣本數都很小
(控制實驗各5片就要花 10萬 NT)
而且 PDF 為左偏
所以我覺的用 ANOVA 做檢定會有問題
(Table 內可能只有 16~40 個數字)
有人幫晶片分析設計了小樣本專用的無母數統計 (SAM)
套用 Permutation + Ordered statistic 的概念
可以搞定小樣本統計
但此統計方法是套用上述的 Naive method
所以我想是否能用 ANOVA 檢定交互作用不顯著後
直接變成 rowPool
然後就直接套用 SAM 搞定.....
避免 multiple testing 變成雞尾酒式的統計流程
所以回歸原本的問題
整合成 rowPool 是否會有什麼潛在問題
還是我跟本在亂做? 冏
※ 編輯: gsuper 來自: 140.113.239.247 (03/09 16:29)
※ 編輯: gsuper 來自: 140.113.239.247 (03/09 16:32)
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.239.247
※ 編輯: gsuper 來自: 140.113.239.247 (03/09 16:35)
※ 編輯: gsuper 來自: 140.113.239.247 (03/09 17:10)
推
03/12 21:46, , 1F
03/12 21:46, 1F
→
03/12 22:47, , 2F
03/12 22:47, 2F
→
03/13 00:16, , 3F
03/13 00:16, 3F
在 preprocessing 中
有 summarization 方法
比方說
十條 1007_at -> 一條 1007_at
十條 104898_at -> 一條 104898_at
而在做完 annotation 後 , 會發現
1007_at -> "Surf4"
1004898_at -> "Surf4"
不同的 probeSet
卻指向相同的 Symbol
稱為 sibling probe set , 或 redundent probe set
※ 編輯: gsuper 來自: 140.113.177.165 (03/13 00:51)
推
03/14 15:35, , 4F
03/14 15:35, 4F
→
03/14 15:35, , 5F
03/14 15:35, 5F
→
03/14 15:36, , 6F
03/14 15:36, 6F
→
03/14 15:51, , 7F
03/14 15:51, 7F
→
03/14 18:26, , 8F
03/14 18:26, 8F
→
03/14 18:26, , 9F
03/14 18:26, 9F
→
03/14 18:27, , 10F
03/14 18:27, 10F
推
03/15 10:30, , 11F
03/15 10:30, 11F
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):
BioMedInfo 近期熱門文章
PTT職涯區 即時熱門文章