美文网首页
样本相关性分析,样本聚类分析

样本相关性分析,样本聚类分析

作者: 嗒嘀嗒嗒嘀嗒嘀嘀 | 来源:发表于2020-07-23 23:56 被阅读0次

基因课FTP地址:ftp://http://gsx.genek.tv/2020-3-10%E7%9B%B4%E6%92%AD%E4%B8%80%E4%B8%AA%E5%AE%8C%E6%95%B4%E7%9A%84%E8%BD%AC%E5%BD%95%E7%BB%84%E9%A1%B9%E7%9B%AE/
听张旭东老师的课

加载tidyverse

library(tidyverse)

导入数据 三张表

  • 表达矩阵
    gene_exp <- read.table('genes.TMM.EXPR.matrix', header = T, row.names = 1)

  • 样本信息表

samples strain stage 指标1 指标2 指标3
BLO_S1_LD1 BLO S1 3.5 3.0 40
BLO_S1_LD2 BLO S1 3.8 3.2 48
BLO_S1_LD3 BLO S1 3.0 3.0 50
BLO_S2_LD1 BLO S2 9.5 13.0 90
BLO_S2_LD2 BLO S2 9.8 13.2 88
BLO_S2_LD3 BLO S2 10.0 13.0 90
  • 基因信息表
    • Rstudio中导入数据时用 Comment选项跳过开头是 # 的行
    • 信息数据不标准,需要进一步加工,所有建议导tibble的数据格式(Rstudio的Dataimport中第二项),用readr R包
      不要行名 —— 因为tibble格式没有行名
    • 需要更换列名
      %>%
      select(Gene_Id = X1,
      Gene_Symbol = X6,
      GO = X7,
      Ko = X9,
      Pathway = X10,
      COG = X21,
      Gene_name = X22)

第一件事——样本相关性分析

cor(gene_exp) # 相关性计算

  • 相关系数分类
    • 皮尔森相关系数 pearson
      线性相关
    • 斯皮尔曼相关系数 spearman
      等级相关
    • 肯德尔相关系数 kendall
      适用于离散变量、分类型变量的相关系数
  • 举例
    • 计算两个基因之间的相关系数,用皮尔森相关系数
    • 肿瘤分期相关基因,分期之间是等级相关,用斯皮尔曼相关系数
    • 哪些基因与性别相关,用肯德尔相关系数
  • 计算样本相关系数,直接用皮尔森相关系数即可
  • command
    sample_cor <- round(cor(gene_exp) , digits = 2) # round保留两位小数
    sample_cor <- round(cor(gene_exp, method = 'spearman') , digits = 2) # 可以指定相关系数算法
    library(pheatmap)
    pheatmap(sample_cor)

样本聚类分析

  • 第一步:计算距离矩阵
    样本两两之间,谁与谁的距离要算出来

    • sample_dist <- dist(t(gene_exp)) # dist算的是行之间的距离矩阵,所以需要将表达矩阵转置,t()表示转置
    • "euclidean", 欧几里得距离矩阵,最常用
    • "maximum",
  • 第二步:聚类
    层次聚类法
    sample_hc <- hclust(sample_dist)
    plot(sample_hc)

聚类方法简述 ?hclust可查看
single 最短聚类法; comlpete 最长聚类法(默认); median 平均距离法; 进化树构建使用类似方法 = UPGMA

相关文章

  • 样本相关性分析,样本聚类分析

    基因课FTP地址:ftp://http://gsx.genek.tv/2020-3-10%E7%9B%B4%E6%...

  • 模式识别——聚类分析 学习笔记

    聚类分析相关概念 聚类分析——对一批没有标出类别的模式样本集,按照样本之间的相似程度分类,相似的归为一类,不相似的...

  • 模式识别——聚类分析 学习笔记

    聚类分析相关概念 聚类分析——对一批没有标出类别的模式样本集,按照样本之间的相似程度分类,相似的归为一类,不相似的...

  • 层次聚类Q型聚类应用

    层次聚类分析中的 Q型聚类可使得具有共同特点的样本聚齐在一起,以便对不同类的样本进行分析。样本数据间的亲疏程度主要...

  • 聚类分析思路分享,如何完成用户细分?

    聚类分析广泛用于市场研究、管理研究中,用于对个体细分,或对比聚类后不同样本差异。本文给大家简单梳理下聚类分析的分析...

  • 七、数据标准化和差异表达分析

    1.数据标准化 (1)标准化 (2)样本总体分布 (3)样本之间的相关性 2.差异表达分析 (1)limma包分析...

  • K-means聚类分析案例(一)

    之前的笔记:聚类介绍:点这里层次聚类分析案例(一):世界银行样本数据集层次聚类分析案例(二):亚马逊雨林烧毁情况层...

  • K-means聚类分析案例(二)

    之前的笔记:聚类介绍:点这里层次聚类分析案例(一):世界银行样本数据集层次聚类分析案例(二):亚马逊雨林烧毁情况层...

  • [R]混合型数据聚类

    利用聚类分析,我们可以很容易地看清数据集中样本的分布情况。以往介绍聚类分析的文章中通常只介绍如何处理连续型变量,这...

  • SPSS实操4:聚类分析

    我们有时需要对一波总体样本进行分群,从而更好地了解群体之间的差异,通过聚类分析可以帮助我们解决这个问题。聚类分析在...

网友评论

      本文标题:样本相关性分析,样本聚类分析

      本文链接:https://www.haomeiwen.com/subject/iolklktx.html