2015年6月1日月曜日

ggplot2でSNP数のヒストグラムを作成

Rのggplot2を用いて染色体ごとに分けて、position ごとのSNP数のヒストグラムを作成

#R version 3.1.2 (2014-10-31) -- "Pumpkin Helmet"

# ggplot2を読み込み
library(ggplot2)

#snpデータの読み込み
snp<-read.csv("~/hkane/typed_SNP.csv",header=T)

#データはこんな形式です
head(snp)

    chr position
1 Chr01    52854
2 Chr01    52891
3 Chr01   207031
4 Chr01   395474
5 Chr01   395956
6 Chr01   912099

chrの列に染色体番号、positionの列に位置情報

qplot(position,  #positionごとに
data = snp,   #snpのデータを使って
geom = "histogram",  #ヒストグラムを作成
binwidth = 1000,  #幅を設定 
facets = chr~.) #chrごとに分けて

一部しか表示していませんが、こんな感じです