[問題] Microarray 的 Clustering
想請問一下
我手上有三組 datasets
計算 Fold change (Log ratio) 後
每一組 set都可粗分為 7 群
-3倍以下
-3倍 ~ -1.5倍
-1.5~0
0
0~1.5
1.5~3
3以上
我們認為 FC > 1.5 是顯著
而 FC > 3 是強顯著
當我把三組 ratio 排起來做各種 distance 的 clustering
發現結果都很難解釋
請問我能否將以上 7 群 ratio data 轉換成
-3 -2 -1 0 1 2 3 這 7 種數字
然後避開幾何距離的分類
用無母數的方式 clustering?
因為我覺的這樣比較直覺
可是我找不到 paper 來 support 這種做法....
誠心請教
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.239.247
推
07/16 21:18, , 1F
07/16 21:18, 1F
→
07/16 21:20, , 2F
07/16 21:20, 2F
→
07/17 13:36, , 3F
07/17 13:36, 3F
推
07/18 03:20, , 4F
07/18 03:20, 4F
我手上第一組 set , 是合作對象做的實驗 , 有 10 片 array --> FC_Ratio 1
另外兩組是 GEO 抓來的 , 跟我們類似的實驗 --> FC_Ratio 2
FC_Ratio 3
3 個 Ratio columns 合成一個矩陣
拿來比較相似度
本來我也覺得歐式距離是最佳選擇
但跑 HCL 後看起來還是很亂
Kmeans 更不合理
相關距離裡面跑最好的是 Kendall`s tao
但有點太粗糙 (大中小....XD)
這有點像是用 clustering 代替 Venn diagram 的感覺
※ 編輯: gsuper 來自: 140.113.239.247 (07/18 20:19)
※ 編輯: gsuper 來自: 140.113.239.247 (07/18 20:20)
→
07/19 09:54, , 5F
07/19 09:54, 5F
→
07/19 09:55, , 6F
07/19 09:55, 6F
→
07/19 09:56, , 7F
07/19 09:56, 7F
→
07/19 09:57, , 8F
07/19 09:57, 8F
→
07/19 10:01, , 9F
07/19 10:01, 9F
討論串 (同標題文章)
完整討論串 (本文為第 1 之 2 篇):
BioMedInfo 近期熱門文章
PTT職涯區 即時熱門文章