Re: [程式] 關於R-cluster的input file 所接受的格式

看板BioMedInfo (生醫資訊)作者 (evil)時間16年前 (2008/12/03 13:35), 編輯推噓2(208)
留言10則, 4人參與, 最新討論串3/4 (看更多)
我現在手上有一堆hexamer(6nt)序列,根據以下的步驟做cluster 1) 先用clustalw做Multiple Alignments得到每個序列alignment的結果 ex: AATCCA ------AATCCA- ATCCAA -------ATCCAA AAATCC -----AAATCC-- AATACG ------AATACG- 2) 根據1)的結果,2.1)將每一個hexamer與其他hexamer(包含自己)的mismatch和shift去計算他的dissmilarity distance,做出dissimilarity matrix ex: TCCGGA- -CCAGAT 的dissmilarity distanc是2(1 mismatch+1 shift) 3) 將將每一個dissimilarity matrix去做average linkage hierarchical clustering 抱歉,剛剛才把paper所說的東西串接起來 所以要給R-cluster的輸入檔案是dissimilarity matrix的數據資料,所以我要把他整理成csv格式? 但是之後的指令要如何下? ~"~不知道大家知道嗎? ps: 我對R很陌生,也不太懂,我先為之前不清楚的問題道歉,請大家耐心的指教 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.138.155.193

12/03 14:39, , 1F
clustalw不就有提供guide tree了嗎? 為什麼你還要用R再做一
12/03 14:39, 1F

12/03 14:40, , 2F
次了? 另外 如果你要用R做的話 那你還是要先懂一些R的基本
12/03 14:40, 2F

12/03 14:41, , 3F
操作 不然你無法把資料餵進去
12/03 14:41, 3F

12/03 16:39, , 4F
恩,我跟老師討論後,他也覺得我可以直接做,謝謝你
12/03 16:39, 4F

12/03 18:34, , 5F
不過講真的,對於R的指令,基本操作我真的不懂
12/03 18:34, 5F

12/03 19:27, , 6F
同意1F
12/03 19:27, 6F

12/11 11:08, , 7F
把你的matrix放在d
12/11 11:08, 7F

12/11 11:10, , 8F
fit <- hclust(d, method="average") 這行會幫你作完
12/11 11:10, 8F

12/11 11:10, , 9F
plot(fit) 畫圖.
12/11 11:10, 9F

12/11 11:11, , 10F
d <- read.csv(....) 可以讀檔
12/11 11:11, 10F
文章代碼(AID): #19DXgkzp (BioMedInfo)
文章代碼(AID): #19DXgkzp (BioMedInfo)