Re: GWAS,GO(Gene Ontology)
先說一般怎麼做,初步分析的部分
一般如果是case/control的,會排除那些有多重位置或如A/T/C三種type的
當然考慮HWE, callrate....一些東西我就不熟了,只能從專業的paper參考
我只知道GWAS先畫張manhattan plot
這樣不懂的人都可以清楚瞭解你的結果
接著這筆data有幾種利用方式
1.根據plot上的cluster歸納出幾個最關鍵的chr位點
從中進行fine-mapping, re-sequencing等,找出causal SNP/mutation
2.找另一群case/control(找合作單位)
進行同一平台或不同平台replicate study
3.從big data中進行傳統的candidate gene association study
包括haplotype, G-G間的joint effect,或G-E分層分析等
4.把最感興趣的SNP拿去做functional assay
1-3是相關的,再發paper之前,錢/人力夠多的話可以都做
對GWAS研究者來說,4是最不熟也最不會想做,
但對生物/分生的研究者則是相反,以為真的是挖到寶藏
幾年前,我們lab來一位老師覺得我們有這麼多significant SNP
拜訪後想談合作,說或許可以讓他做些recombinant protein跟in vitro assay
很可惜,多數實驗背景的研究者都以為SNP在cds上
(如果這麼好康,我早就留著自己做了)
事實上,這些SNP能落在intron已經不錯了
有些跟基因的TSS都數k~十數k的距離,functional assay都不知從何著手
GWAS快速進展以來更是如此(不易實驗分析)
原因是既然GWAS,廠商出的chip就至少該滿足兩個條件才會好賣
一是點的密度要均勻,不能客製化哪些loci要密集一些
二是上面SNP的MAF要夠,case/control都沒variant怎麼辦?
顧及密度及MAF,可用的那些點就不太會座落在cds了
因此你的本文提到後續"驗證"其實有兩種解讀
除了是直接地認為探討該SNP的功能影響
或者看到你的回應後,覺得是上述2這個replication
你現在應該很困擾,除了慢慢拖到畢業時間到老闆放人外(誤)
畫張上述彩色的manhattan plot是能有起碼交代
(前提是抓出這些SNP要是比照一般paper的篩選流程找出來的才能信服別人)
接著藉用中研院Genepipe等網站功能,這些SNP丟到variowatch等去做annotation
用FANS評估SNP對gene影響的可能性與程度
又或1000genome (1KG)網站也能計算z score評估functional significance
透過這些量化的數值,就可以讓"真的想做functional assay的人"退縮了
假使你從中做出興趣,以下的不妨考慮看看
因為你的兩群都是case
利用1KG可以選定接近的族群當作reference healthy control
此外台灣Biobank也有釋出local based control,也能申請個別資料
彌補你沒有control的困擾
如果SNP落在功能未知或太大(e.g.>500kda)的基因附近,建議直接放棄
非關該phenotype的已知基因,可以用si/shRNA看cell based assay
若有幸找到有相關的基因,上述(1-3)等replicated或fine-mapping不妨試試
也能用1KG或hapmap等找LD region上有沒有exonic SNP
z score夠顯著就可以試試site-direct看enzyme activity或protein interaction
次之則是找proximal promoter region至intron 1範圍
滿足LD, MAF又有一定比例的SNP
這樣可以試reporter assay後,回去再做該點的SNP應該也會顯著
對了這裡提到的"顯著"都指p值,但是有時候往往odd ratio都不高
這也是限制投入細胞實驗的衝動
最後想提一下,別太相信這是"中研院那邊提供"的研究這單純的理由
我覺得可能是某醫師念碩博班,於是對方切出一筆小小的data玩玩用途
或者醫師提供檢體供對方lab研究
但覺得一陣子沒發表所以急了
於是要求拿自己sample做的data回來另覓合作單位進行分析
看起來後面這個比較合理
但儘管如此也太隨便了
我們是個別有生統、分生的助理,才對GWAS的後續用途更順利銜接
※ 引述《sinclairJ (Jun)》之銘言:
: 作者: sinclairJ (Jun) 看板: Biology
: 標題: GWAS,GO(Gene Ontology)
: 時間: Mon Apr 20 23:05:59 2015
: 大家好,想在這邊請教有分析過Genome-wide association studys(GWAS)的前輩,因為
: 本身非生物或統計背景,所以對這種分析較缺乏sense
: 小弟手上的GWAS data, 其Phenotype有1及2,SNP(rs number)則約有60萬個(已genotype
: 為0,1,2)
: 小弟目前已經用資料探勘的手法找出與Phenotype顯著的SNP,共有50幾個
: 小弟想請教的是
: 1.該如何驗證我找出的這些SNP確實是這疾病的致病基因(小弟有閱讀過paper,似乎可以
: 用模擬的方式來驗證?)
: 2.若我找出這些SNP所對應的gene name,是否可以做Geno Ontology,藉此建立一個pathway
: 來證明我所找的那些SNP確實會影響該疾病
: 3.還是有其他驗證方法,也請各位前輩提點我一下,甚至直接個paper叫我閱讀也可以,
: 因為又非生物背景,每當辛苦看完一篇超難懂的paper時,之後發現又對研究沒幫助,那
: 種感覺真是。。。
: 以上,謝謝各位前輩幫忙,如果問題有說明不清楚的再跟我說,我會再進行補充
※ 編輯: blence (180.218.165.124), 04/22/2015 01:03:52
推
04/22 01:44, , 1F
04/22 01:44, 1F
※ 編輯: blence (180.218.165.124), 04/22/2015 01:59:29
推
04/22 03:02, , 2F
04/22 03:02, 2F
推
04/22 20:09, , 3F
04/22 20:09, 3F
推
02/26 11:45, , 4F
02/26 11:45, 4F
Biotech 近期熱門文章
PTT職涯區 即時熱門文章
20
35