诸子百家


  • 首页

  • 归档

  • 分类

  • 标签

  • 关于

  • 搜索

TCGA学习笔记7-绘制热图

发表于 2020-07-04 | 分类于 生物信息 |
上面,我们根据差异表达提取出来的4913个基因在611个样品中的表达数据进行了主成份分析,根据主成份成分的结果,正常与肿瘤样本能很好地分成两类,这对样本的预测是很好的辅助。下面,我们将根据差异表达的结果来绘制热图,看能否找出预示肿瘤组织的标志分子。 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667 ...
阅读全文 »

TCGA学习笔记6-主成份分析PCA

发表于 2020-06-30 | 分类于 生物信息 |
上面,我们对RNA表达数据进行了差异分析,下面,我们将进行主成份分析(PCA),用于对数据进行区分和归类。 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192939495969798991001011 ...
阅读全文 »

TCGA学习笔记5-差异表达分析

发表于 2020-06-28 | 分类于 生物信息 |
前面,我们已经对KIRC的611个CASE的表达数据进行了预处理,现在,我们可以开始进行基因的差异表达分析了。 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091> library(DESeq2)& ...
阅读全文 »

TCGA学习笔记4-样品分类

发表于 2020-06-27 | 分类于 生物信息 |
前面,我们从metadata中提取了样品的信息,并替换了表达数据中的列名,我们还需要根据列名来将样品分类,并且要对基因的编号进行处理 首先,处理基因的编号 123456789101112131415161718192021222324252627282930> genename <- rownames(data) # 提取data中的60482个基因名,赋值给genename> head(genename)[1] "ENSG00000000005.5" "ENSG000000 ...
阅读全文 »

TCGA学习笔记3-处理样品信息

发表于 2020-06-27 | 分类于 生物信息 |
1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192939495969798991001011021031041051061071081091101111121131141151161171181191 ...
阅读全文 »

TCGA学习教程2-数据批量预处理与整合

发表于 2020-06-27 | 分类于 生物信息 |
在TCGA学习教程1中,我们从TCGA上下载了KIRC的RNAseq数据,共包含611个目录,下面我们要在R中将这些目录下的压缩文件移动到同一个文件夹中,并对数据作预处理。 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586 ...
阅读全文 »

TCGA学习教程1-如何从TCGA下载数据

发表于 2020-06-22 | 分类于 生物信息 |
TCGA是由National Cancer Institute创建的肿瘤基因组数据库,截至目前(2020年6月),共收录65个PROJECTS,67个PRIMARY SITES,84031个CASES,涉及22872个基因。 TCGA数据库的大部分数据可以下载,在网站上直接下载方法如下: 以肾癌中占比最高的ccRCC为例,点击[REPOSITORY],左侧有[FILES]和[CASES],点击[CASES],选择[PRIMARY SITE]下的[KIDNEY],再选择[PROGRAM]下的[T ...
阅读全文 »

R语言中RTCGA包的基本用法

发表于 2020-06-14 | 分类于 生物信息 |
R语言中的RTCGA包用于下载并分析TCGA上的数据,如要查看RTCGA的示例用法,可以使用如下命令打开”RTCGA package workflow” 1234> browseVignettes("RTCGA")# 运行之后打开下面这个页面:[RTCGA package workflow](http://127.0.0.1:14929/session/Rvig.2eb41b5b1ec3.html)# 如果要查看RTCGA.rnaseq的示例,则使用如下命令:> browseVign ...
阅读全文 »

TCGA数据库中的癌症全称

发表于 2020-06-13 |
TCGA数据库中的癌症全称 Cohort 英文名称 中文名称 ACC Adrenocortical carcinoma 肾上腺皮质癌 BLCA Bladder Urothelial Carcinoma 膀胱尿路上皮癌 BRCA Breast invasive carcinoma 乳腺浸润癌 CESC Cervical squamous cell carcinoma and endocervical adenocarcinoma 宫颈鳞癌和腺癌 CHOL Cholan ...
阅读全文 »

TCGA学习笔记-使用R语言中的RTCGAToolbox分析TCGA数据

发表于 2020-06-13 | 分类于 生物信息 |
Firehose是由Broad institute开发的,提供经过预处理后的TCGA数据,在R语言中,RTCGAToolbox可用于查询、下载和分析Firehose的数据。 12345if (!requireNamespace("BiocManager")) install.packages("BiocManager")BiocManager::install("RTCGAToolbox")library(RTCGAToolbox) 在通过Firehose获取数据之前,需要检查有效的数据集 ...
阅读全文 »
1…789…25
括囊无誉

括囊无誉

248 日志
11 分类
228 标签
RSS
简书
© 2017 - 2023 括囊无誉
由 Hexo 强力驱动
主题 - NexT.Mist
访问人数 总访问量 次