[討論] 序列比對
小的最近在做 Human DNA的序列比對
把許多條已定序的序列丟進NCBI 作 Blast
再針對 mismatch 出現的位置作統計,
結果發現了一些有趣的現象
1. mismatch 經常是連續的。舉例來說:
QuerySeq -AATTTTTTTAAA-
|| |||
RefSeq -AAGGGGGGGAAA-
上方的"QuerySeq" 是我丟進去比對的序列,
下方的"RefSeq"是NCBI的參考序列
(當然比對的序列不會這麼短啦,在這裏只是舉例 ^^")
其中的mismatch有7個,而且它們是連續的。
這種連續的mismatch發生的頻率相當地高。
2. mismatch 與 mismatch 之間的距離 = 3。舉例來說:
QuerySeq -AATAAGAATCCA-
|| || || ||
RefSeq -AAGAACAACCCT-
上面的比對結果共有4個mismatch,而且它們倆倆之間的距離都是3
這類情況雖不如上述第一種現象來得頻繁,但也頗常見。
綜合以上兩者,
第二種現象還可以解釋 (從 aa 和演化觀點切入)
但第一種現象就比較棘手了 @@
不曉得各位大大有什麼想法呢,
謝謝 ^^"
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.64.190.46
※ 編輯: juihhu 來自: 61.64.190.46 (04/11 10:12)
推
04/11 10:40, , 1F
04/11 10:40, 1F
→
04/11 10:41, , 2F
04/11 10:41, 2F
討論串 (同標題文章)
Biotech 近期熱門文章
PTT職涯區 即時熱門文章