Re: [討論] 預測ESEs的方式

看板BioMedInfo (生醫資訊)作者 (evil)時間16年前 (2008/06/03 17:59), 編輯推噓4(402)
留言6則, 3人參與, 最新討論串3/7 (看更多)
※ 引述《realism ()》之銘言: : 發現大家可能不懂我的意思 跟我朋友要了paper給大家參考: : http://www.biomedcentral.com/1471-2105/8/159 : ※ 引述《realism ()》之銘言: : : 前幾天有個朋友問我關於預測ESEs(Exonic Splicing Enhancer)的問題 : : 他說他使用統計的方法來預測 我查了ㄧ下文獻 似乎是因為ESE通常很短 : : 要用pattern來預測不是很能夠取信於人 所以會加上統計的方式 : : 預測的方式大概是這樣: : : 找出某一個hexamer(已知的幾個ESEs)在水稻的exon的頻率明顯高於intron : : 並且在exon weak splice site的頻率高於在eoxn strong splice site的頻率 : : 找出來的hexamer即認定為新的ESEs : : 但是做出來的結果預測出相對於參考文獻 異常高量的ESE : : 我想了想可能跟物種不同 intron的長度 : : 與多寡有關係 因為這樣統計的基本條件就已經不同了 : : 請問該怎麼解決這種差異呢?? 大家好,這是我朋友幫我問的,我是做這個題目的人 問題在於預測出來的候選ESE序列數量多 我想要利用已知水稻序列資訊讓我了解問題所在 例如:我試著分析,exon,intron 序列核甘酸組成, 已經知道intron AT比率高(0.64),CG比率低(0.36),exon中AT=0.53 cg=0.46 大家可以提供給我一下日本水稻exon,intron明顯不一樣的資訊嗎? 我需要的是這方面的建議,可以幫助我釐清問題所在 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.138.155.220

06/03 18:23, , 1F
我不懂的是你要去找exon與intron sequence content的差異
06/03 18:23, 1F

06/03 18:23, , 2F
然後來推翻說你這個方法不可行嗎??
06/03 18:23, 2F

06/03 18:30, , 3F
你在本身在做預測方法?然後想知道如何預測更準?
06/03 18:30, 3F

06/03 23:15, , 4F
回一樓 我想他只是要一個參數模版,好套進像HMM之類的
06/03 23:15, 4F

06/03 23:16, , 5F
演算法去training,再拿去預測他真正要做的東西
06/03 23:16, 5F

06/03 23:43, , 6F
看完paper發現是LSVM不是HMM, 不過概念類似都是ML相關
06/03 23:43, 6F
文章代碼(AID): #18HHOIHP (BioMedInfo)
文章代碼(AID): #18HHOIHP (BioMedInfo)