Re: [問題] 基因marker篩選軟體-Haploview criteri …

看板BioMedInfo (生醫資訊)作者 ( )時間14年前 (2010/07/07 09:21), 編輯推噓1(100)
留言1則, 1人參與, 最新討論串2/3 (看更多)
嘗試回答一下 如有錯誤還請各位先進指正 ※ 引述《holybeetle (聖甲蟲)》之銘言: : ※ [本文轉錄自 Biology 看板 #1CCgPZ1Y ] : 作者: holybeetle (聖甲蟲) 看板: Biology : 標題: [問題] 基因marker篩選軟體-Haploview criteria 設定 : 時間: Tue Jul 6 11:43:21 2010 : 【問題】: : 實驗室所使用的初步gene marke篩選軟體-Haploview : 1.check marker中 : 將minimum minor allele freq.改成0.1(排除< 0.1的基因點) : 這個設定為0.1, 0.5 或0.8..的差別在於? 差別在於若設為0.1,則所選出的SNP的MAF都會高於0.1. 由於SNP(通常)只有兩個allele, MAF的範圍為0到0.5,major allele frequency 則為1-MAF. 若是一個SNP的MAF是0.01, 則表示平均來說,100個人中只會有1個人帶有minor allele. 若是一個SNP的MAF是0.5, 則表示平均來說,100個人中會有50個人帶有minor allele. 在樣本數不大的情況之下,選擇MAF太小的SNP可能會導致全部的樣本都帶有major allele. 沒有variation的話,這個SNP就算是白做了. 因此一般會設定一個限制,讓MAF不要太小. MAF>0.05的SNP,一般稱為common variation. : 2.Tagger的視窗下 : 設定aggressive tagging : (pairwise tagging only, use 2-marker haplotypes, use 2- and 3-marker : haplotypes) : 各有什麼意義? tagging是用一個SNP的allele去tag另一個SNP的allele. 舉例來說, SNP1 的A allele 和SNP2 的T allele必定同時出現的話, 那我們只需要genotype SNP1就可以獲得SNP1 和SNP2的所有資訊. 在這個例子中, SNP1 和SNP2 就是pairwise tagging. 再舉一個例子, 若SNP3-T allele 和 SNP4-A allele 所形成的haplotype, 必定和SNP5的G allele同時出現, 則我們可以用SNP3加SNP4來tag SNP5, 這可以稱為2-marker haplotype tagging. multiple marker tagging (相較pairwise tagging)的問題是: 1. 要多genotype 一些marker 2. 帶有特定haplotype的樣本可能不多,tagging的效果可能不好 : 3.r square threshold : 設定在0.8有什麼統計上的意義? 表示所選到的tagging SNP和被tag的SNP之間的r square最小是0.8. 簡單的來說, 如果tagging SNP和tagged SNP之間的r square越小, 就需要愈大的樣本數來達到相同的統計檢定力. 舉例來說, 在直接genotype tagged SNP的情況下,如果需要100個樣本才能達到想要的統計檢定力. 如果tagging SNP 和tagged SNP之間的 r square 是0.8, 在genotype tagging SNP的情況下,我們需要125個樣本才能達到相同的統計檢定力. 當然r square 愈高,可以選擇的tagging SNP 愈少,但是tagging的效果愈好. 0.8是一個常用的threshold. : 4.LOD threshold for multi-marker test : 軟體本身設定為3.0是依據什麼原理? 因為LOD score > 3.0 會對應到統計上常用的significance level... : 【問題起因】: : 指導教授希望我去了解這些設定有何依據, 原理為何? : 【個人看法】: : 自己有先看過Help的部分, 但是軟體說明大多是有看沒有懂 : 網路上有一些關於r square的部分, 但是不知道有什麼意義 : 如下: : The lowest r2 set at 0.1. : The square colors in the LD triangle vary between blue (cold for LD, r2 = : 0.1) to red (hot for LD, r2 = 1.0) with white squares indicating no LD (r2 : <0.1). : However, r2 of 0.1 is not very useful, and many of the sites in this gene : are not in LD (more white and blue squares than red or other colors). : 因為自己是半路出家的, 沒有任何基因或統計上的背景... : 也很不巧的...沒有學長姐可以請教 : 因此希望好心人是可以提供解答或方向 : 非常感謝!! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 24.62.24.169

07/08 13:51, , 1F
謝謝您提供的解答~~非常清楚~~!!感謝!
07/08 13:51, 1F
文章代碼(AID): #1CCzQmwx (BioMedInfo)
文章代碼(AID): #1CCzQmwx (BioMedInfo)