BAM文件转BED文件

有多种方法可以实现从BAM文件到BED文件的转换,比较简单的一种,是使用bedtools bamtobed,语法如下:

1
bedtools bamtobed -i ***.bam > ***.bed

实例如下:

准备一个BAM文件,targetc.bam

1
2
3
4
5
6
7
8
> samtools view targetc.bam | head

HWI-ST1113:280:H7KE6ADXX:1:1116:8464:18014 16 chr19 3100027 31 36M * 0 0 AGGGCAATGGGCCACTGCCTCAGCCAGCTTTTTAGG JJIJJJIJIJJJGGIJJJJJJJJHHHHHFFFFFCCC AS:i:0 XS:i:-5 XN:i:0 XM:i:0 XO:i:0 XG:i:0 NM:i:0 MD:Z:36 YT:Z:UU
HWI-ST1113:280:H7KE6ADXX:1:1205:1404:46284 0 chr19 3100235 23 36M * 0 0 ACATATGTCTTGTGAGTGACTCTCTTTCCTTCCCTT CCCFFFFFHHHHHIJJHG?<CEFFEHHCEHHIHJIJ AS:i:-10 XN:i:0 XM:i:2 XO:i:0 XG:i:0 NM:i:2 MD:Z:2G5G27 YT:Z:UU
HWI-ST1113:280:H7KE6ADXX:1:2216:8268:81593 16 chr19 3100237 23 36M * 0 0 ATATGTCTTGTGAGTGACTCTCTTTCCTTCCCTTTG JJIJIIGJJIIIGIIHHIJJIHHFHDBHFFDDFC@@ AS:i:-11 XN:i:0 XM:i:2 XO:i:0 XG:i:0 NM:i:2 MD:Z:0G5G29 YT:Z:UU
HWI-ST1113:280:H7KE6ADXX:2:1210:11323:25283 16 chr19 3100240 23 36M * 0 0 TGTCTTGTGAGTGACTCTCTTTCCTTCCCTTTGCCC IJJJJJJIJIJJJIJIGIJJJJJHHHHHFFFFFCCC AS:i:-11 XN:i:0 XM:i:2 XO:i:0 XG:i:0 NM:i:2 MD:Z:3G29T2 YT:Z:UU
HWI-ST1113:280:H7KE6ADXX:1:1206:10953:35815 16 chr19 3100246 40 36M * 0 0 GTGAGTGACTCTCTTTCCTTCCCTTTGCCCTTCCAT JJJIJIHHJJIJJJJJJJJJJJJHHHHHFFFFFCCC AS:i:-5 XN:i:0 XM:i:1 XO:i:0 XG:i:0 NM:i:1 MD:Z:27T8 YT:Z:UU
HWI-ST1113:280:H7KE6ADXX:2:2216:12650:100608 16 chr19 3100250 40 36M * 0 0 GTGACTCTCTTTCCTTCCCTTTGCCCTTCCATCTTT JJIHJIJJJJJJJJJJJJJJJJJHHHHHFFFFFCCC AS:i:-5 XN:i:0 XM:i:1 XO:i:0 XG:i:0 NM:i:1 MD:Z:23T12 YT:Z:UU

转换为bed文件,targetc.bed

1
2
3
4
5
6
7
8
9
> bedtools bamtobed -i targetc.bam > targetc.bed
> less targetc.bed

chr19 3100026 3100062 HWI-ST1113:280:H7KE6ADXX:1:1116:8464:18014 31 -
chr19 3100234 3100270 HWI-ST1113:280:H7KE6ADXX:1:1205:1404:46284 23 +
chr19 3100236 3100272 HWI-ST1113:280:H7KE6ADXX:1:2216:8268:81593 23 -
chr19 3100239 3100275 HWI-ST1113:280:H7KE6ADXX:2:1210:11323:25283 23 -
chr19 3100245 3100281 HWI-ST1113:280:H7KE6ADXX:1:1206:10953:35815 40 -
chr19 3100249 3100285 HWI-ST1113:280:H7KE6ADXX:2:2216:12650:100608 40 -

两两比较,就会发现BAM文件与BED文件的区别,BED文件有6列:

第一列:染色体位置
第二列:start
第三列:end
第四列:对应BAM文件的QNAME,包含测序平台,read name等信息
第五列:对应BAM文件的MAPQ,即比对质量
第六列:正负链

  • 本文作者:括囊无誉
  • 本文链接: CHIPSEQ/bamtobed/
  • 版权声明: 本博客所有文章均为原创作品,转载请注明出处!
------ 本文结束 ------
坚持原创文章分享,您的支持将鼓励我继续创作!