大きいサイズのファイルをftpサイトからダウンロードする機会が増えてきました。
IDとパスワードを指定する時
例えば
http://example.ac.jp/test.txt
から
id:hkanekane
password:123456
でダウンロードする場合は
wget ftp://hkanekane:123456@http://example.ac.jp/test.txt
でダウンロード可能です。
2017年3月13日月曜日
2017年3月8日水曜日
GATKのエラー(2)
GATKでいつも問題になってしまうのが、read group fieldsです。
詳しい説明は以下のページを参照していただければと思います。
https://software.broadinstitute.org/gatk/guide/article?id=6472
BAM fileからのread groupの確認方法は
samtools view -H sample.bam | grep '@RG'
GATKでの解析に必要なread group field は
ID = Read group identifier
この情報はuniqueである必要があります。
IDが同じの場合、多サンプルでSNP callしても、GATKでは1サンプル分の結果しか出ないという問題が生じます。
詳しい説明は以下のページを参照していただければと思います。
https://software.broadinstitute.org/gatk/guide/article?id=6472
BAM fileからのread groupの確認方法は
samtools view -H sample.bam | grep '@RG'
GATKでの解析に必要なread group field は
ID = Read group identifier
この情報はuniqueである必要があります。
IDが同じの場合、多サンプルでSNP callしても、GATKでは1サンプル分の結果しか出ないという問題が生じます。
PU = Platform Unit
{FLOWCELL_BARCODE}.{LANE}.{SAMPLE_BARCODE}.
SM = Sample
PL = Platform/technology used to produce the read
PL=illumina
と入力しています。
LB = DNA preparation library identifier
これらの情報はPicardのAddOrReplaceReadGroups を使って記載します。
http://broadinstitute.github.io/picard/command-line-overview.html#AddOrReplaceReadGroups
登録:
投稿 (Atom)