Re: [問題] 資料庫中要用哪一股是怎麼定義?
※ 引述《adu (^_^)》之銘言:
: ※ 引述《windincloud (雲淡風輕)》之銘言:
: : ^^^^^^^^^^^^
: : 哪樣的資料? 從哪邊取得?
: NCBI 人類的genome
: : ^^^^^^^^^^^^^^^^^
: : 這邊你指的是? 要將序列轉互補嘛?
: : 那這樣應該是 A <-> T C <-> G吧~
: : 若不是的話 那請不要寫 <-> 會讓人起誤會地~
: 對~是只互補的意思:)
: : ^^^^^^^^^^^^^^^^
: : 這邊要看特性吧~ 通常是編碼區GC高 非編碼區不一定
: : 所有資料都是5'寫至3'
: : 所以當你要丟資料請先確定序列是由5'寫至3'
: : 至於互補不互補 BLAST 會幫忙判定的~
: 還是沒有很了解
: 即便都是5'寫到3' DNA以雙股的方式存在,那究竟會挑哪一股出來表示?
: 如 http://bioinfo.cs.ccu.edu.tw/wiki/doku.php?id=transcription
: 是挑識別股還是模板股?
: 又以genome的資料來說,不同基因,被轉錄的可能會是雙股中其中一股?
: 那在這樣的情況下,又會挑哪一股上傳到資料庫呢?
由你文中~ 我沒有辦法知道你想做啥大事~
不過基本上 序列寫法都是由5'寫至3'
也就是說你今天不管到哪個地方下載序列下來~
最左邊永遠是5'不會變的
至於挑出哪股來表示
我想你應該是想說方向性問題吧~
在所有的ncbi中的資料都會標上方向性及啟始與終止位置
這樣你就可以了解這條序列來源是正向或反向股
舉例來說~
我有條阿拉伯芥序列 APG2
http://0rz.tw/ifODr
由Genomic context中可以看到這條是反義股序列
若切換成xml來看
<Seq-interval_from>83259</Seq-interval_from>
<Seq-interval_to>85228</Seq-interval_to>
<Seq-interval_strand>
<Na-strand value="minus"/>
</Seq-interval_strand>
一定有以上資訊
在序列部份是在同義股上83259 ~ 85228
方向性為負向
而在提供出來的fasta format的話 那ncbi會很好心的幫你轉成5'~ 3' 表示
假定83259 ~ 83268正向股是
atccgtcaat
那fasta給你的不會是正向股序列(因為他寫法這樣變成3'~5' 不合規定)
所以你看到的fasta
>APG2 83268~ 83259
attgacggat
不知以上說明可以讓你了解嘛?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.138.155.196
→
06/17 21:29, , 1F
06/17 21:29, 1F
→
06/17 21:29, , 2F
06/17 21:29, 2F
推
06/18 09:18, , 3F
06/18 09:18, 3F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 4 之 4 篇):
BioMedInfo 近期熱門文章
PTT職涯區 即時熱門文章