Re: [程式] 關於R-cluster的input file 所接受的格式
我現在手上有一堆hexamer(6nt)序列,根據以下的步驟做cluster
1)
先用clustalw做Multiple Alignments得到每個序列alignment的結果
ex:
AATCCA ------AATCCA-
ATCCAA -------ATCCAA
AAATCC -----AAATCC--
AATACG ------AATACG-
2)
根據1)的結果,2.1)將每一個hexamer與其他hexamer(包含自己)的mismatch和shift去計算他的dissmilarity distance,做出dissimilarity matrix
ex:
TCCGGA-
-CCAGAT
的dissmilarity distanc是2(1 mismatch+1 shift)
3)
將將每一個dissimilarity matrix去做average linkage hierarchical clustering
抱歉,剛剛才把paper所說的東西串接起來
所以要給R-cluster的輸入檔案是dissimilarity matrix的數據資料,所以我要把他整理成csv格式?
但是之後的指令要如何下? ~"~不知道大家知道嗎?
ps:
我對R很陌生,也不太懂,我先為之前不清楚的問題道歉,請大家耐心的指教
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.138.155.193
推
12/03 14:39, , 1F
12/03 14:39, 1F
→
12/03 14:40, , 2F
12/03 14:40, 2F
→
12/03 14:41, , 3F
12/03 14:41, 3F
→
12/03 16:39, , 4F
12/03 16:39, 4F
→
12/03 18:34, , 5F
12/03 18:34, 5F
推
12/03 19:27, , 6F
12/03 19:27, 6F
→
12/11 11:08, , 7F
12/11 11:08, 7F
→
12/11 11:10, , 8F
12/11 11:10, 8F
→
12/11 11:10, , 9F
12/11 11:10, 9F
→
12/11 11:11, , 10F
12/11 11:11, 10F
討論串 (同標題文章)
完整討論串 (本文為第 3 之 4 篇):
BioMedInfo 近期熱門文章
PTT職涯區 即時熱門文章