Re: [問題] 資料庫中要用哪一股是怎麼定義?

看板BioMedInfo (生醫資訊)作者 (雲淡風輕)時間15年前 (2009/06/17 21:14), 編輯推噓1(102)
留言3則, 2人參與, 最新討論串4/4 (看更多)
※ 引述《adu (^_^)》之銘言: : ※ 引述《windincloud (雲淡風輕)》之銘言: : : ^^^^^^^^^^^^ : : 哪樣的資料? 從哪邊取得? : NCBI 人類的genome : : ^^^^^^^^^^^^^^^^^ : : 這邊你指的是? 要將序列轉互補嘛? : : 那這樣應該是 A <-> T C <-> G吧~ : : 若不是的話 那請不要寫 <-> 會讓人起誤會地~ : 對~是只互補的意思:) : : ^^^^^^^^^^^^^^^^ : : 這邊要看特性吧~ 通常是編碼區GC高 非編碼區不一定 : : 所有資料都是5'寫至3' : : 所以當你要丟資料請先確定序列是由5'寫至3' : : 至於互補不互補 BLAST 會幫忙判定的~ : 還是沒有很了解 : 即便都是5'寫到3' DNA以雙股的方式存在,那究竟會挑哪一股出來表示? : 如 http://bioinfo.cs.ccu.edu.tw/wiki/doku.php?id=transcription : 是挑識別股還是模板股? : 又以genome的資料來說,不同基因,被轉錄的可能會是雙股中其中一股? : 那在這樣的情況下,又會挑哪一股上傳到資料庫呢? 由你文中~ 我沒有辦法知道你想做啥大事~ 不過基本上 序列寫法都是由5'寫至3' 也就是說你今天不管到哪個地方下載序列下來~ 最左邊永遠是5'不會變的 至於挑出哪股來表示 我想你應該是想說方向性問題吧~ 在所有的ncbi中的資料都會標上方向性及啟始與終止位置 這樣你就可以了解這條序列來源是正向或反向股 舉例來說~ 我有條阿拉伯芥序列 APG2 http://0rz.tw/ifODr 由Genomic context中可以看到這條是反義股序列 若切換成xml來看 <Seq-interval_from>83259</Seq-interval_from> <Seq-interval_to>85228</Seq-interval_to> <Seq-interval_strand> <Na-strand value="minus"/> </Seq-interval_strand> 一定有以上資訊 在序列部份是在同義股上83259 ~ 85228 方向性為負向 而在提供出來的fasta format的話 那ncbi會很好心的幫你轉成5'~ 3' 表示 假定83259 ~ 83268正向股是 atccgtcaat 那fasta給你的不會是正向股序列(因為他寫法這樣變成3'~5' 不合規定) 所以你看到的fasta >APG2 83268~ 83259 attgacggat 不知以上說明可以讓你了解嘛? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.138.155.196

06/17 21:29, , 1F
補一下 若你想知道如何在NCBI註解新序列 可參考下面
06/17 21:29, 1F

06/17 21:29, , 2F

06/18 09:18, , 3F
謝謝w大!我的一些觀念錯了,現在以改正....:)
06/18 09:18, 3F
文章代碼(AID): #1AEEmb2o (BioMedInfo)
文章代碼(AID): #1AEEmb2o (BioMedInfo)