Re: GWAS,GO(Gene Ontology)

看板Biotech (生命科學)作者 ( )時間10年前 (2015/04/22 01:01), 10年前編輯推噓4(400)
留言4則, 4人參與, 最新討論串1/1
先說一般怎麼做,初步分析的部分 一般如果是case/control的,會排除那些有多重位置或如A/T/C三種type的 當然考慮HWE, callrate....一些東西我就不熟了,只能從專業的paper參考 我只知道GWAS先畫張manhattan plot 這樣不懂的人都可以清楚瞭解你的結果 接著這筆data有幾種利用方式 1.根據plot上的cluster歸納出幾個最關鍵的chr位點 從中進行fine-mapping, re-sequencing等,找出causal SNP/mutation 2.找另一群case/control(找合作單位) 進行同一平台或不同平台replicate study 3.從big data中進行傳統的candidate gene association study 包括haplotype, G-G間的joint effect,或G-E分層分析等 4.把最感興趣的SNP拿去做functional assay 1-3是相關的,再發paper之前,錢/人力夠多的話可以都做 對GWAS研究者來說,4是最不熟也最不會想做, 但對生物/分生的研究者則是相反,以為真的是挖到寶藏 幾年前,我們lab來一位老師覺得我們有這麼多significant SNP 拜訪後想談合作,說或許可以讓他做些recombinant protein跟in vitro assay 很可惜,多數實驗背景的研究者都以為SNP在cds上 (如果這麼好康,我早就留著自己做了) 事實上,這些SNP能落在intron已經不錯了 有些跟基因的TSS都數k~十數k的距離,functional assay都不知從何著手 GWAS快速進展以來更是如此(不易實驗分析) 原因是既然GWAS,廠商出的chip就至少該滿足兩個條件才會好賣 一是點的密度要均勻,不能客製化哪些loci要密集一些 二是上面SNP的MAF要夠,case/control都沒variant怎麼辦? 顧及密度及MAF,可用的那些點就不太會座落在cds了 因此你的本文提到後續"驗證"其實有兩種解讀 除了是直接地認為探討該SNP的功能影響 或者看到你的回應後,覺得是上述2這個replication 你現在應該很困擾,除了慢慢拖到畢業時間到老闆放人外(誤) 畫張上述彩色的manhattan plot是能有起碼交代 (前提是抓出這些SNP要是比照一般paper的篩選流程找出來的才能信服別人) 接著藉用中研院Genepipe等網站功能,這些SNP丟到variowatch等去做annotation 用FANS評估SNP對gene影響的可能性與程度 又或1000genome (1KG)網站也能計算z score評估functional significance 透過這些量化的數值,就可以讓"真的想做functional assay的人"退縮了 假使你從中做出興趣,以下的不妨考慮看看 因為你的兩群都是case 利用1KG可以選定接近的族群當作reference healthy control 此外台灣Biobank也有釋出local based control,也能申請個別資料 彌補你沒有control的困擾 如果SNP落在功能未知或太大(e.g.>500kda)的基因附近,建議直接放棄 非關該phenotype的已知基因,可以用si/shRNA看cell based assay 若有幸找到有相關的基因,上述(1-3)等replicated或fine-mapping不妨試試 也能用1KG或hapmap等找LD region上有沒有exonic SNP z score夠顯著就可以試試site-direct看enzyme activity或protein interaction 次之則是找proximal promoter region至intron 1範圍 滿足LD, MAF又有一定比例的SNP 這樣可以試reporter assay後,回去再做該點的SNP應該也會顯著 對了這裡提到的"顯著"都指p值,但是有時候往往odd ratio都不高 這也是限制投入細胞實驗的衝動 最後想提一下,別太相信這是"中研院那邊提供"的研究這單純的理由 我覺得可能是某醫師念碩博班,於是對方切出一筆小小的data玩玩用途 或者醫師提供檢體供對方lab研究 但覺得一陣子沒發表所以急了 於是要求拿自己sample做的data回來另覓合作單位進行分析 看起來後面這個比較合理 但儘管如此也太隨便了 我們是個別有生統、分生的助理,才對GWAS的後續用途更順利銜接 ※ 引述《sinclairJ (Jun)》之銘言: : 作者: sinclairJ (Jun) 看板: Biology : 標題: GWAS,GO(Gene Ontology) : 時間: Mon Apr 20 23:05:59 2015 : 大家好,想在這邊請教有分析過Genome-wide association studys(GWAS)的前輩,因為 : 本身非生物或統計背景,所以對這種分析較缺乏sense : 小弟手上的GWAS data, 其Phenotype有1及2,SNP(rs number)則約有60萬個(已genotype : 為0,1,2) : 小弟目前已經用資料探勘的手法找出與Phenotype顯著的SNP,共有50幾個 : 小弟想請教的是 : 1.該如何驗證我找出的這些SNP確實是這疾病的致病基因(小弟有閱讀過paper,似乎可以 : 用模擬的方式來驗證?) : 2.若我找出這些SNP所對應的gene name,是否可以做Geno Ontology,藉此建立一個pathway : 來證明我所找的那些SNP確實會影響該疾病 : 3.還是有其他驗證方法,也請各位前輩提點我一下,甚至直接個paper叫我閱讀也可以, : 因為又非生物背景,每當辛苦看完一篇超難懂的paper時,之後發現又對研究沒幫助,那 : 種感覺真是。。。 : 以上,謝謝各位前輩幫忙,如果問題有說明不清楚的再跟我說,我會再進行補充 ※ 編輯: blence (180.218.165.124), 04/22/2015 01:03:52

04/22 01:44, , 1F
4. 淚推...看看我家滿坑滿谷的ko B6...QwQ
04/22 01:44, 1F
※ 編輯: blence (180.218.165.124), 04/22/2015 01:59:29

04/22 03:02, , 2F
謝謝專業的文章,我會再試著做做看的
04/22 03:02, 2F

04/22 20:09, , 3F
04/22 20:09, 3F

02/26 11:45, , 4F
02/26 11:45, 4F
文章代碼(AID): #1LDe9gPH (Biotech)
文章代碼(AID): #1LDe9gPH (Biotech)