诸子百家


  • 首页

  • 归档

  • 分类

  • 标签

  • 关于

  • 搜索

R设置坐标轴原点

发表于 2020-05-30 | 分类于 编程语言 |
使用R绘图时,默认的坐标轴交点并不是X和Y的最小值,我们可以通过xaxs=”i”和yaxs=”i”来进行设置。 使用默认设置,生成图形如下: 1plot(data$V1,data$V2,pch=20,xlab="",ylab="",xlim=c(0,1),ylim=c(0,1)) 设置之后,图形如下: 1plot(data$V1,data$V2,pch=20,xlab="",ylab="",xlim=c(0,1),ylim=c(0,1),xaxs="i",yaxs="i")
阅读全文 »

从BAM文件中提取指定区域的READS数

发表于 2020-05-28 | 分类于 生物信息 |
通过序列比对得到BAM文件后,常常需要对READS数进行统计,以便进行下游分析与作图,可以说,这是对BAM数据可视化的关键步骤。 一、全局统计 12> samtools view -c targetc.bam6 二、指定区域统计 对于指定区域进行统计,需要用到bedtools multicov,BAM文件可以是一个或多个,语法如下: 12345678910111213> bedtools multicov -bams targetc.bam -bed chr19d.bed chr19 ...
阅读全文 »

BAM文件转BED文件

发表于 2020-05-28 | 分类于 生物信息 |
有多种方法可以实现从BAM文件到BED文件的转换,比较简单的一种,是使用bedtools bamtobed,语法如下: 1bedtools bamtobed -i ***.bam > ***.bed 实例如下: 准备一个BAM文件,targetc.bam 12345678> samtools view targetc.bam | headHWI-ST1113:280:H7KE6ADXX:1:1116:8464:18014 16 chr19 3100027 31 ...
阅读全文 »

从BAM文件中提取指定区域

发表于 2020-05-28 | 分类于 生物信息 |
首先,看一下BAM文件的内容,BAM文件名为heart.bam 1234567891011> samtools view heart.bam | headHWI-ST1113:280:H7KE6ADXX:2:1201:2203:75105 16 chr19 3079081 35 36M * 0 0 AGTCCATTTATTCTTTGTGTAGAGAAAGACTACTGA JIIJJJJJJJJJIIGJJ ...
阅读全文 »

在R中做T.TEST检验

发表于 2020-05-25 | 分类于 编程语言 |
t.test是统计学中最常用的检验方法,用来检验两种数据的均值是否相等,用于对正态分布的整体估值,通常应用于小样本(n < 30)。 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081> x = rnorm(100,mean=20, ...
阅读全文 »

配色网站COLORBREWER

发表于 2020-05-25 | 分类于 编程语言 |
COLORBREWER,是一个配色网站,其配色方案简约大方,是作图配色的首选。 常用的配色方案如下: 五种蓝色的配色方案:”#eff3ff”,”#bdd7e7”,”#6baed6”,”#3182bd”,”#08519c” 五种绿色的配色方案:”#edf8e9”,”#bae4b3”,”#74c476”,”#31a354”,”#006d2c” 五种灰色的配色方案:”#f7f7f7”,”#cccccc”,”#969696”,”#636363”,”#252525”
阅读全文 »

Data Frame常用操作

发表于 2020-05-24 | 分类于 编程语言 |
subset可以用来筛选data.frame的子集,语法如下: 一、创建数据 12345678910111213> name <- c("Layton","Ben","Paul","Peter","Haley","Jump")> age <- c(25,18,45,60,24,35)> sex <- c("M","M","M","M","F","M")> weight <- c(120,150,125,140,115,110)> data & ...
阅读全文 »

定义并提取基因间区域-INTERGENIC REGION

发表于 2020-05-24 | 分类于 生物信息 |
一、定义intergenic 基因间区域,即intergenic region,可以简单定义为两个相邻基因A和B之间的区域;对于某个基因而言,TSS和TES可以看作是基因的上下边界,但是,由于promoter往往在TSS上游,而TES附近可能有调控元件存在,因此,我们也需要把promoter区域和TES下游也考虑在内。如果我们定义,promoter区域为“TSS-2Kb至TSS+0.5Kb”,下游调控区域为“TES-0.5Kb至TES+0.5Kb”,那么,intergenic region就可 ...
阅读全文 »

未命名

发表于 2020-05-23 |
1.Load Packageslibrary(GenomicRanges)library(rtracklayer)library(IRanges)library(DiffBind)library(tidyverse)library(chipseq)library(Gviz)library(VennDiagram)library(BSgenome.Mmusculus.UCSC.mm10)library(biomaRt)library(ggplot2)setwd(“D:/CHIP/promoter” ...
阅读全文 »

用DiffBind自带数据包做ChIP SEQ差异分析

发表于 2020-05-21 |
在做完peak calling之后,我们就可以做样品间的差异分析了,常用的包是DiffBind,现在,先用自带的数据包做一个差异分析。 一、加载软件12library(DiffBind)library(tidyverse) 二、工作路径 1234567setwd(system.file("extra", package="DiffBind")) # 设置工作路径,在软件包DiffBind下的extra文件夹;list.files() # 这是工作目录,其中,peaks和testdata是文件夹; ...
阅读全文 »
1…101112…25
括囊无誉

括囊无誉

248 日志
11 分类
228 标签
RSS
简书
© 2017 - 2023 括囊无誉
由 Hexo 强力驱动
主题 - NexT.Mist
访问人数 总访问量 次