Re: [問題] Microarray 的 Clustering
※ 引述《gsuper (統計的巴比倫塔)》之銘言:
部分恕刪...
>我手上第一組 set , 是合作對象做的實驗 , 有 10 片 array --> FC_Ratio 1
>另外兩組是 GEO 抓來的 , 跟我們類似的實驗 --> FC_Ratio 2
FC_Ratio 3
>3 個 Ratio columns 合成一個矩陣
>拿來比較相似度
data-set的size如何? 如果夠大的話,會不會用non-parametric ranking test比較好?
>本來我也覺得歐式距離是最佳選擇
>但跑 HCL 後看起來還是很亂
>Kmeans 更不合理
如果你要看expression pattern 用gene的log2 value或是intesity會比較好吧??
distance可以用Pearson's dissimiarity來做
>相關距離裡面跑最好的是 Kendall`s tao
>但有點太粗糙 (大中小....XD)
>這有點像是用 clustering 代替 Venn diagram 的感覺
不同為什麼一定要放在一起看耶
光是實驗設計一樣,用的array平台一樣
不同lab出來的data我相信batch effect會相當大
不建議放一起比,即使是用ratio來畫也一樣
>※ 編輯: gsuper 來自: 140.113.239.247 (07/18 20:19)
>※ 編輯: gsuper 來自: 140.113.239.247 (07/18 20:20)
--
★ミ ζ
○_.
/(╯
【今晚的天空有一顆流星劃過 在預言著什麼】|>
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 111.250.209.209
討論串 (同標題文章)
完整討論串 (本文為第 2 之 2 篇):
BioMedInfo 近期熱門文章
PTT職涯區 即時熱門文章
-15
134