[問題] 請教 SAM 的計算過程
自問自答好了
算是對板上的貢獻
有錯請鞭
-------------------------
Q1. So的計算 (就是那個 shrinkage 的 constant)
paper上說是用 "window slide" 的方式
讓 d(i) 的變異係數最小化
我是看到有個說法是
"variance of 90th percentage"
不知道對不對?
-----------------------------------------------------
A1 : 約 85~95th percentage 的 probeset 之變異數
R 的 package "siggenes" 有時候是定 0
然後把變異數太低的 probeset刪除
(in my case , 3千 / 5萬)
--------------------------------------------------------
2. permutation
假設是 control 3片 , 實驗組 3片
究竟是下列何者?
A. 整個資料矩陣隨機取6個數字 (可重覆取用)
B. 整個資料矩陣隨機取6個數字 (不可重覆)
C. 在特定的基因向量 i , 隨機取6個數字 (可重覆取用) #每個向量i內都有6個
D. 在特定的基因向量 i , 隨機取6個數字 (不可重覆) 數字
------------------------------------------------------
A2 : 假設實驗控制各4組
sample column 共 8 條
以 columns 為單位做 permutation
理想次數 , C8取4 , 定為 A 次
此處雖然已滿足做 permutation 檢定的基礎
但無法估計 est-FDR
所以
1. permutation 矩陣 , 每條 db(i) column 都 Rank
2. d(i) 本身 Rank
以上兩件事合稱為 ordered statistic
之後就是 d(i) - de(i) = delta
在滿足以上條件後
A 可下修為 B
B 我認為大約要取 0.75*A
原始 paper 用較精細的 balance permutation, 取36次 , 約為70的一半
所以正常的 permutation , 我認為取 0.75A 是比較可行
然而若電腦夠好 , 取 B = 10000次 無妨
-------------------------------------------------------------------
3. 還有 B (permutation次數)
SAM 的 paper
在 4片 V.S. 4片 的實驗
取 36 次
我猜是 C4取2 * C4取2
所以 6片 V.S. 6片
應該是 C6取3 * C6取3 嗎?
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.239.247
※ 編輯: gsuper 來自: 140.113.239.247 (01/05 21:18)
※ 編輯: gsuper 來自: 140.113.239.247 (01/05 21:18)
※ 編輯: gsuper 來自: 140.113.239.247 (01/05 21:18)
※ 編輯: gsuper 來自: 140.113.239.247 (01/05 21:20)
※ 編輯: gsuper 來自: 140.113.239.247 (01/16 20:05)
BioMedInfo 近期熱門文章
PTT職涯區 即時熱門文章