Re: [問題] 基因marker篩選軟體-Haploview criteri …
嘗試回答一下
如有錯誤還請各位先進指正
※ 引述《holybeetle (聖甲蟲)》之銘言:
: ※ [本文轉錄自 Biology 看板 #1CCgPZ1Y ]
: 作者: holybeetle (聖甲蟲) 看板: Biology
: 標題: [問題] 基因marker篩選軟體-Haploview criteria 設定
: 時間: Tue Jul 6 11:43:21 2010
: 【問題】:
: 實驗室所使用的初步gene marke篩選軟體-Haploview
: 1.check marker中
: 將minimum minor allele freq.改成0.1(排除< 0.1的基因點)
: 這個設定為0.1, 0.5 或0.8..的差別在於?
差別在於若設為0.1,則所選出的SNP的MAF都會高於0.1.
由於SNP(通常)只有兩個allele,
MAF的範圍為0到0.5,major allele frequency 則為1-MAF.
若是一個SNP的MAF是0.01,
則表示平均來說,100個人中只會有1個人帶有minor allele.
若是一個SNP的MAF是0.5,
則表示平均來說,100個人中會有50個人帶有minor allele.
在樣本數不大的情況之下,選擇MAF太小的SNP可能會導致全部的樣本都帶有major allele.
沒有variation的話,這個SNP就算是白做了.
因此一般會設定一個限制,讓MAF不要太小.
MAF>0.05的SNP,一般稱為common variation.
: 2.Tagger的視窗下
: 設定aggressive tagging
: (pairwise tagging only, use 2-marker haplotypes, use 2- and 3-marker
: haplotypes)
: 各有什麼意義?
tagging是用一個SNP的allele去tag另一個SNP的allele.
舉例來說,
SNP1 的A allele 和SNP2 的T allele必定同時出現的話,
那我們只需要genotype SNP1就可以獲得SNP1 和SNP2的所有資訊.
在這個例子中, SNP1 和SNP2 就是pairwise tagging.
再舉一個例子,
若SNP3-T allele 和 SNP4-A allele 所形成的haplotype,
必定和SNP5的G allele同時出現,
則我們可以用SNP3加SNP4來tag SNP5,
這可以稱為2-marker haplotype tagging.
multiple marker tagging (相較pairwise tagging)的問題是:
1. 要多genotype 一些marker
2. 帶有特定haplotype的樣本可能不多,tagging的效果可能不好
: 3.r square threshold
: 設定在0.8有什麼統計上的意義?
表示所選到的tagging SNP和被tag的SNP之間的r square最小是0.8.
簡單的來說,
如果tagging SNP和tagged SNP之間的r square越小,
就需要愈大的樣本數來達到相同的統計檢定力.
舉例來說,
在直接genotype tagged SNP的情況下,如果需要100個樣本才能達到想要的統計檢定力.
如果tagging SNP 和tagged SNP之間的 r square 是0.8,
在genotype tagging SNP的情況下,我們需要125個樣本才能達到相同的統計檢定力.
當然r square 愈高,可以選擇的tagging SNP 愈少,但是tagging的效果愈好.
0.8是一個常用的threshold.
: 4.LOD threshold for multi-marker test
: 軟體本身設定為3.0是依據什麼原理?
因為LOD score > 3.0 會對應到統計上常用的significance level...
: 【問題起因】:
: 指導教授希望我去了解這些設定有何依據, 原理為何?
: 【個人看法】:
: 自己有先看過Help的部分, 但是軟體說明大多是有看沒有懂
: 網路上有一些關於r square的部分, 但是不知道有什麼意義
: 如下:
: The lowest r2 set at 0.1.
: The square colors in the LD triangle vary between blue (cold for LD, r2 =
: 0.1) to red (hot for LD, r2 = 1.0) with white squares indicating no LD (r2
: <0.1).
: However, r2 of 0.1 is not very useful, and many of the sites in this gene
: are not in LD (more white and blue squares than red or other colors).
: 因為自己是半路出家的, 沒有任何基因或統計上的背景...
: 也很不巧的...沒有學長姐可以請教
: 因此希望好心人是可以提供解答或方向
: 非常感謝!!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 24.62.24.169
推
07/08 13:51, , 1F
07/08 13:51, 1F
討論串 (同標題文章)
BioMedInfo 近期熱門文章
PTT職涯區 即時熱門文章