[討論] 序列比對

看板Biotech (生命科學)作者 (...)時間17年前 (2009/04/11 10:10), 編輯推噓1(101)
留言2則, 1人參與, 最新討論串1/2 (看更多)
小的最近在做 Human DNA的序列比對 把許多條已定序的序列丟進NCBI 作 Blast 再針對 mismatch 出現的位置作統計, 結果發現了一些有趣的現象 1. mismatch 經常是連續的。舉例來說: QuerySeq -AATTTTTTTAAA- || ||| RefSeq -AAGGGGGGGAAA- 上方的"QuerySeq" 是我丟進去比對的序列, 下方的"RefSeq"是NCBI的參考序列 (當然比對的序列不會這麼短啦,在這裏只是舉例 ^^") 其中的mismatch有7個,而且它們是連續的。 這種連續的mismatch發生的頻率相當地高。 2. mismatch 與 mismatch 之間的距離 = 3。舉例來說: QuerySeq -AATAAGAATCCA- || || || || RefSeq -AAGAACAACCCT- 上面的比對結果共有4個mismatch,而且它們倆倆之間的距離都是3 這類情況雖不如上述第一種現象來得頻繁,但也頗常見。 綜合以上兩者, 第二種現象還可以解釋 (從 aa 和演化觀點切入) 但第一種現象就比較棘手了 @@ 不曉得各位大大有什麼想法呢, 謝謝 ^^" -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.64.190.46 ※ 編輯: juihhu 來自: 61.64.190.46 (04/11 10:12)

04/11 10:40, , 1F
或許是連續mismatch扣分下來,還不足以讓match的加分部
04/11 10:40, 1F

04/11 10:41, , 2F
份分數太低,而與其他序列相比之下也相對高分吧
04/11 10:41, 2F
文章代碼(AID): #19t_mkSu (Biotech)
討論串 (同標題文章)
文章代碼(AID): #19t_mkSu (Biotech)