Re: [問題] 請問版上高手 蛋白質預測的問題

看板BioMedInfo (生醫資訊)作者 (雲淡風輕)時間16年前 (2008/06/16 19:12), 編輯推噓6(6016)
留言22則, 5人參與, 最新討論串5/5 (看更多)
※ 引述《liturtle (超屌師大附友會)》之銘言: : 原文恕刪~~~ : 我想我的疑問沒有被解答 : 就直接回文來討論一下吧 : 我這邊認為的蛋白質預測 : 是指 丟入蛋白質的胺基酸序列給軟體 : "預測"出他的"三級"結構 : 那麼如果是一開始就有PDB檔 就代表他的結構已經被解出 : 打開裡面就可以看到坐標 : 丟到類似PYMOL 或是 CHIME 之類的軟體 即可以"秀出"結構立體圖 : 但這些都不是"預測"吧 因為結構都已經解出來 座標都被標定了 怎樣能算是預測? : 另外DSSP我知道 : 我們做的結構比對軟體基本上就是利用他來做training : 不過這個程式也是需要PDB檔 這樣也不算是預測吧 : 最後 : 我當然了解二級結構需要被預測 : 但我指的是 現在要算出二級的軟體很多 : 但是要"預測"出"三級結構"的其實幾乎沒有 : PS.以上問題 都要在我們認為的"預測"定義相同 才可以成立 嗯~ 我可能講的不夠清楚 其實這邊預測的的確確是可以做到給定一未知protein 然後預測出其二級結構 我所提的方法只是所謂建立一個model 而model的建立當然是由一個已知的資訊才能建立 所謂用machine learing的方式是說 我提供屬性及答案給機器讓他像人一樣去學習 當學習後機器會根據他所學到的知識建立一個model 然後就可以將你想要得知protein "二級結構"的樣子預測出來 這邊要特別要說的是因為屬性給的不一樣(可能會有物化屬性等等) 所以剛剛有回文提到homology modeling 我想可能會有些許的差異才對 不過基本上還是建立model然後根據model再來預測 再來L大所提到三級結構預測 這目前真的很難用電腦計算去得知 所以要是L大將預測定義是預測出給定一條未知protein序列得到其三級結構 那就比較沒法 但是要是要是forcus在二級結構則是可以的 -- 通常我們稱"預測"時都會說明是預測是啥問題 所以看到預測蛋白質結構時我會直覺是預測蛋白質二結構(上課被荼毒太久的直覺反應) 這邊要跟L大說聲不好意思 -- 最近有看到所謂預測 β-barrel protein 的問題 因為β-barrel protein樣子比較固定 http://www.biologie.uni-konstanz.de/folding/Structure%20gallery%201.html 所以有人也會提高β-strain的預測甚至預測出其是anti-parallel或是parallel 這樣可以畫出預測的β-barrel protein三級結構 不知這樣可以算預測出三級結構嗎? XD -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.138.155.216

06/16 19:57, , 1F
收到 我了解了 XD 話說後來丟的那個網址好有趣 感謝啦~
06/16 19:57, 1F

06/16 20:13, , 2F
你現在用的machine learning是哪一種呢? 據我所知目前
06/16 20:13, 2F

06/16 20:13, , 3F
結構上好像是以rule-based比較多
06/16 20:13, 3F

06/16 20:14, , 4F
不過我很久沒碰這塊了 也許資訊不夠新
06/16 20:14, 4F

06/16 21:03, , 5F
其實,也是有軟體,可以根據序列資訊去預測二級結構
06/16 21:03, 5F

06/16 21:05, , 6F
但是,如果考慮到實驗驗證性,pdb是一個不錯選擇
06/16 21:05, 6F

06/16 21:06, , 7F
目前,要預測三級結構,通常還是利用預測軟體去預測
06/16 21:06, 7F

06/16 21:07, , 8F
三級結構的答案,之後,再用二級結構當屬性去預測
06/16 21:07, 8F

06/16 22:37, , 9F
ML似乎有點被過份利用了~ 畢竟他還是只能學習到已知
06/16 22:37, 9F

06/16 22:38, , 10F
的資訊,當一個未知的資訊進入後,這個model效果
06/16 22:38, 10F

06/16 22:38, , 11F
就會沒有預測已知的好~
06/16 22:38, 11F

06/16 23:01, , 12F
因此,也造成很多生物學家不相信ML預測出來的結果
06/16 23:01, 12F

06/17 00:56, , 13F
其實很多資訊學家也不相信ML的結果 :p
06/17 00:56, 13F

06/17 01:42, , 14F
不相信+1 以前越做越心虛,最後受不了就跳離這領域
06/17 01:42, 14F

06/17 16:10, , 15F
其實也沒啥心不心虛的問題 只是屬性怎加怎玩 讓人匪夷
06/17 16:10, 15F

06/17 16:11, , 16F
所思 不過基本上原理還是基於統計理論 不至於全不可信
06/17 16:11, 16F

06/17 18:24, , 17F
嗯嗯,ML還是有其理論,只是謹慎使用才能達到目的
06/17 18:24, 17F

06/17 18:24, , 18F
而不是什麼都要靠ML~
06/17 18:24, 18F

06/17 19:05, , 19F
回到一個重點,生物背景要充實,會導致一堆人不信任ML
06/17 19:05, 19F

06/17 19:07, , 20F
不是它不好,而是大部分ML的人,幾乎是沒有依據的
06/17 19:07, 20F

06/17 19:08, , 21F
加上屬性,導致可信度很低,最初使用ML的人,考慮很詳細
06/17 19:08, 21F

06/17 19:09, , 22F
因此,幾乎每篇評價不低,但是後來,一堆人亂搞,結果就...
06/17 19:09, 22F
文章代碼(AID): #18Lagrg8 (BioMedInfo)
文章代碼(AID): #18Lagrg8 (BioMedInfo)