2015年5月31日日曜日

RAD-Seqを用いて、ヘテロの遺伝子型を解析

RAD-Seqを用いて、ヘテロの遺伝子型を解析した論文に関して調べてみました。

Hoffman JI, Simpson F, David P, Rijks JM, Kuiken T, Thorne MA, Lacy RC,
Dasmahapatra KK. High-throughput sequencing reveals inbreeding depression in a
natural population. Proc Natl Acad Sci U S A. 2014 Mar 11;111(10):3775-80. doi:
10.1073/pnas.1318945111. Epub 2014 Feb 28. PubMed PMID: 24586051; PubMed Central 
PMCID: PMC3956162.
http://www.ncbi.nlm.nih.gov/pubmed/?term=24586051

Davey JW, Cezard T, Fuentes-Utrilla P, Eland C, Gharbi K, Blaxter ML. Special 
features of RAD Sequencing data: implications for genotyping. Mol Ecol. 2013
Jun;22(11):3151-64. doi: 10.1111/mec.12084. Epub 2012 Oct 30. PubMed PMID:
23110438; PubMed Central PMCID: PMC3712469.
http://www.ncbi.nlm.nih.gov/pubmed/?term=23110438

どちらの論文でもヘテロの遺伝子型を解析する場合にはstacksよりもGATKが良いという結論でした。

もう一つ気になる点。

GATKとSAMtoolは、どちらもbayesian approach を用いていますが、結果が少し異なっています。
その点に関しては以下のまとめを参考にしました。

https://www.biostars.org/p/57149/
https://www.biostars.org/p/12500/#12526

上記サイトには
The samtools model tends to be conservative - it tends to call fewer heterozygotes than the independent model (←GATK). 
と書かれています。

自分のデータで調べてみましたが、やはりsamtoolsの方がヘテロの遺伝子型の数が少ないです。

あくまでも今回私が調べた範囲の結論です。
参考にして頂ければ幸いですし、もし情報があれば教えてください。