诸子百家


  • 首页

  • 归档

  • 分类

  • 标签

  • 关于

  • 搜索

高通量测序NGS

发表于 2020-06-12 | 分类于 生物信息 |
第一代测序技术称作sanger sequencing,第二代测序技术(Second-generation sequencing),或下一代测序技术(Next-generation sequencing,NGS),或称作高通量测序,是诸多第二代测序技术的统称,主要技术有三种,即Illumina(Solexa),Roche 454,Ion Torrent。 一、Illumina(Solexa) sequencingIllumina测序,是一种边合成边测序的技术,使用荧光信号来标记不同的碱基,因此,可 ...
阅读全文 »

在R中使用listOrganisms()查询物种名称

发表于 2020-06-06 | 分类于 生物信息 |
listOrganisms()是GenomeInfoDb中的函数,用于查询物种的common name和学名。 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010 ...
阅读全文 »

查询给定物种的可用基因组

发表于 2020-06-05 | 分类于 生物信息 |
genomeBuilds()是GenomeInfoDb中的函数,可以列出给定物种的可用基因组。 123456789101112131415161718192021222324252627282930313233343536373839> genomeBuilds("mouse", style = "UCSC") commonName organism ucscID1 mouse Mus musculus mm92 mouse Mus musculus ...
阅读全文 »

seqinfo()基本操作

发表于 2020-06-05 | 分类于 生物信息 |
seqinfo()是GenomeInfoDb程序的一个函数,用于获取基因组序列的基本信息,这个函数在运行时需要调用fetchExtendedChromInfoFromUCSC(),因此,需要保持网络连接。基本用法是 1Seqinfo(genome="") 以获取hg38的基因组信息为例 123456789101112131415161718192021> x <- Seqinfo(genome="hg38")> xSeqinfo object with 455 sequence ...
阅读全文 »

在R中使用GenomeInfoDb获取染色体信息

发表于 2020-06-05 | 分类于 生物信息 |
在生物信息分析中,经常需要用到染色体的信息,可以使用GenomeInfoDb来获取,如下: 一、获取human的染色体信息 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989 ...
阅读全文 »

在R中使用dnorm()作正态分布曲线

发表于 2020-06-04 | 分类于 编程语言 |
在R中,dnorm()是正态分布的概率密度函数,d代表density,norm代表正态分布,返回给定x在标准正态分布下的概率密度。 对于一个给定的正态分布,X ∼ N(μ,σ2),μ代表均值,σ2代表方差,dnorm()可以计算给定x下的概率密度,即P(X<=x|μ=a,σ=b),比如,对于标准正态分布 X ∼ N(0,1),要计算x=1时的概率密度,即dnorm(1)=P(X<=1|μ=0,σ=1) 1234> dnorm(1) # 默认为标准正态分布,故亦可以写作下面这种形 ...
阅读全文 »

在R中绘制正态分布曲线

发表于 2020-06-02 | 分类于 编程语言 |
在R中,绘制正态分布曲线方法如下: 12345x <- rnorm(1000000,mean=0,sd=1)plot(density(x),xaxs="i",yaxs="i",col="blue",lwd=2,main="",bty="n",yaxt="n",xaxt="n",ylim=c(0,0.42),xlim=c(-5,5))axis(2,at=c(0.0,0.1,0.2,0.3,0.4))axis(1,at=c(-4,-2,0,2,4))abline(v=0,lty=2)
阅读全文 »

在R中使用runif()生成随机数

发表于 2020-06-02 | 分类于 编程语言 |
在R中,可以使用runif()来生成随机数,并且,可以通过使用set.seed()设置随机数种子来生成相同的随机数。 12345678910111213141516> runif(10) [1] 0.88128755 0.05515884 0.49174723 0.58947710 0.26055370 0.42419775 0.91291115 0.53224161 0.59857483[10] 0.45912772> runif(10) [1] 0.11450970 0.4374 ...
阅读全文 »

在R中计算四分位数

发表于 2020-06-02 | 分类于 编程语言 |
在统计中,方差或标准差是最常使用的衡量数据离散程度的指标,但是方差或标准差有其固有缺陷,当数据中存在离群值(outlier)时,即使outlier数量极少,也会使方差或标准差极度偏移,因此,我们需要一种统计工具来反映大部分数据分布在哪里,最常用的方法是计算75%与25%之间的差别,这称为四分位间距(interquartile range)。在R中,可以使用IQR()计算四分位间距,使用quantile()来计算向量的所有分位数。 123456789101112131415161718192021 ...
阅读全文 »

在R中使用wilcox.test做非正态分布检验

发表于 2020-05-31 | 分类于 编程语言 |
对于符合正态分布的两个样本进行显著性检验时,可以使用t.test();若是不确定两个样本是否符合正态分布假设时,可以执行Mann-Whitney-Wilcoxon Test,函数为 1wilcox.test(x,y,paired = TRUE, alternative = "two.sided") 例如: 1234567> wilcox.test(mtcars$gear,mtcars$carb,paired = TRUE, alternative = "two.sided") Wilcox ...
阅读全文 »
1…8910…25
括囊无誉

括囊无誉

248 日志
11 分类
228 标签
RSS
简书
© 2017 - 2023 括囊无誉
由 Hexo 强力驱动
主题 - NexT.Mist
访问人数 总访问量 次