诸子百家


  • 首页

  • 归档

  • 分类

  • 标签

  • 关于

  • 搜索

肿瘤基因组分析教程:一、基础命令行操作

发表于 2020-11-20 | 分类于 编程语言 |
肿瘤基因组测序的结果存储在VCF格式中,我们先对VCF进行一些基本的操作,以获得对其直观的印象,下载一个VCF文件,来看一下。参考教程Introduction to Command Line 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818 ...
阅读全文 »

去除数据框中多余的LEVEL

发表于 2020-11-19 | 分类于 编程语言 |
在操作数据框时,当取子集时,不论使用subset()或者对行名进行筛选,得到的结果中都会包含无值但存在的LEVEL,需要去除多余的LEVEL,否则在进行某些操作时会出错。 12Y <- droplevels(X)# 此命令会去掉数据框中多余的LEVEL,只保留有值的LEVEL
阅读全文 »

使用CIRCLIZE对VCF文件作图

发表于 2020-11-19 | 分类于 编程语言 |
R package circlize:可惜这个文档写得太枯燥。下面作图主要参考这个教程Variant Visualisation 我们的目的是使用CIRCLIZE这个程序来对VCF文件作图,即对VCF进行简单的可视化,显示SNP或INDEL在染色体上的位置。 123456789101112131415161718192021222324252627282930> library(circlize)# SNV> snp=read.table("./snp.vcf")> snv=c ...
阅读全文 »

BCFTOOLS VIEW 命令查看VCF文件

发表于 2020-11-18 | 分类于 编程语言 |
BCFTOOLS VIEW 可以用于查看VCF或BCF文件,VCF/BCF互相转换,提取子集,或进行过滤,用法如下: 123456bcftools view [options] <in.vcf.gz> [region1 [...]]# 只针对压缩的VCF文件,即vcf.gz,若不是压缩格式,先转换成压缩格式,比如现在有一个文件,xxx.vcf,使用bgzip进行压缩,> bgzip xxx.vcf# 得到xxx.vcf.gz,生成索引> bcftools index -t ...
阅读全文 »

理解VCF文件

发表于 2020-11-18 | 分类于 编程语言 |
VCF(Variant Call Format),是存储变异信息的文件格式,包括SNP(单核苷酸多态性,指单碱基变异)、INDEL(插入或缺失,指短片段变异)、SV(结构变异,指长片段变异)、CNV(拷贝数变异)。 一、VCF文件内容VCF文件包含两个部分,注释与主体。注释部分以##开头,如下: 1234567891011121314151617181920212223242526272829303132333435363738394041424344##fileformat=VCFv4.2# ...
阅读全文 »

R中去除某列中重复的值

发表于 2020-11-17 | 分类于 编程语言 |
在R中,如果要将data.frame的某一列转化为行名,则不能有重复,否则会报错,简单的办法就是对要操作的列进行去重,比如 12345678910111213141516171819# 现在,data是data.frame,35976行> dim(data)[1] 35976 39> head(data$X)[1] Adora1 Sntg1 Adgrb3 Prim2 Cflar Obsl1 35974 Levels: 0610005C13Rik 0610006L08Rik ...
阅读全文 »

clusterProfiler富集分析将ID转换为SYMBOL

发表于 2020-11-17 | 分类于 编程语言 |
123456789101112131415161718192021222324252627library(clusterProfiler)library(org.Mm.eg.db)> X <- bitr(gene, fromType='SYMBOL', toType='ENTREZID', OrgDb='org.Mm.eg.db')> EGG <- enrichKEGG(gene= X$ENTREZID, organism = ' ...
阅读全文 »

在IGV中可视化VCF文件

发表于 2020-11-17 | 分类于 编程语言 |
VCF是Variant Call Format的首字母缩写,是存储变异信息的文件格式,在进行下游分析之前,我们先在IGV中对VCF进行简单的可视化,以有直观的印象,当然,也可检查特定位点是否存在突变,这可以帮助判断某单基因疾病是否由某基因的突变所致。 首先,启动IGV,安装教程见前面的文章。 检查VCF文件是否有对应的索引文件(vcf.idx),如有索引,可以直接载入IGV,如无索引,使用tabix命令生成索引,并载入IGV中,如下图 从上图中可以看出,对于样本,分为深蓝与青色,深蓝代表杂合突 ...
阅读全文 »

绘制VENN图

发表于 2020-11-16 | 分类于 编程语言 |
这个教程是使用VennDiagram程序绘制简洁美观的VENN(韦恩图),最多支持五组数据 12345678910111213141516171819202122> library(VennDiagram)# 准备3组数据> x <- c(1:35)> y <- c(27:80)> z <- c(22:50,90:100)> x [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 ...
阅读全文 »

在R中将向量转换成表格

发表于 2020-11-16 | 分类于 编程语言 |
在R中,对于长向量,如果需要展示,直接打印不够美观,可以将其转换为表格,美观而且直白,可以使用ggtexttable这个函数,比如,我们现在有一个向量,有许多基因名称, 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687 ...
阅读全文 »
1…345…25
括囊无誉

括囊无誉

248 日志
11 分类
228 标签
RSS
简书
© 2017 - 2023 括囊无誉
由 Hexo 强力驱动
主题 - NexT.Mist
访问人数 总访问量 次