Re: [問題] 資料庫中要用哪一股是怎麼定義?

看板BioMedInfo (生醫資訊)作者windincloud (雲淡風輕)時間16年前 (2009/06/17 21:14)推噓1(1推 0噓 2→)

留言3則, 2人參與討論串4/4 (看更多)

※ 引述《adu (^_^)》之銘言： : ※ 引述《windincloud (雲淡風輕)》之銘言： : : ^^^^^^^^^^^^ : : 哪樣的資料? 從哪邊取得? : NCBI 人類的genome : : ^^^^^^^^^^^^^^^^^ : : 這邊你指的是? 要將序列轉互補嘛? : : 那這樣應該是 A <-> T C <-> G吧~ : : 若不是的話那請不要寫 <-> 會讓人起誤會地~ : 對～是只互補的意思:) : : ^^^^^^^^^^^^^^^^ : : 這邊要看特性吧~ 通常是編碼區GC高非編碼區不一定 : : 所有資料都是5'寫至3' : : 所以當你要丟資料請先確定序列是由5'寫至3' : : 至於互補不互補 BLAST 會幫忙判定的~ : 還是沒有很了解 : 即便都是5'寫到3' DNA以雙股的方式存在，那究竟會挑哪一股出來表示？ : 如 http://bioinfo.cs.ccu.edu.tw/wiki/doku.php?id=transcription : 是挑識別股還是模板股？ : 又以genome的資料來說，不同基因，被轉錄的可能會是雙股中其中一股？ : 那在這樣的情況下，又會挑哪一股上傳到資料庫呢？由你文中~ 我沒有辦法知道你想做啥大事~ 不過基本上序列寫法都是由5'寫至3' 也就是說你今天不管到哪個地方下載序列下來~ 最左邊永遠是5'不會變的至於挑出哪股來表示我想你應該是想說方向性問題吧~ 在所有的ncbi中的資料都會標上方向性及啟始與終止位置這樣你就可以了解這條序列來源是正向或反向股舉例來說~ 我有條阿拉伯芥序列 APG2 http://0rz.tw/ifODr 由Genomic context中可以看到這條是反義股序列若切換成xml來看 <Seq-interval_from>83259</Seq-interval_from> <Seq-interval_to>85228</Seq-interval_to> <Seq-interval_strand> <Na-strand value="minus"/> </Seq-interval_strand> 一定有以上資訊在序列部份是在同義股上83259 ~ 85228 方向性為負向而在提供出來的fasta format的話那ncbi會很好心的幫你轉成5'~ 3' 表示假定83259 ~ 83268正向股是 atccgtcaat 那fasta給你的不會是正向股序列(因為他寫法這樣變成3'~5' 不合規定) 所以你看到的fasta >APG2 83268~ 83259 attgacggat 不知以上說明可以讓你了解嘛? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.138.155.196