美文网首页群体遗传学
4.2 基因型数据描述性统计

4.2 基因型数据描述性统计

作者: Wei_Sun | 来源:发表于2022-08-16 12:20 被阅读0次

完成标记开发后,会得到基因型数据,首先要对基因型数据进行统计,用到的工具是plink,安装及基础用法见链接:
plink安装及基础用法 - 简书 (jianshu.com)

统计主要包括标记水平和个体水平两部分:

  • 标记水平:缺失率、杂合率、等位基因频率;
  • 个体水平:缺失率、杂合率。

输入

$ ./plink --allow-extra-chr --freq --hardy --missing --het --vcf genotype.vcf

--allow-extra-chr:允许额外染色体编号
--freq:最小等位基因频率
--hardy:标记杂合度
--missing :标记与个体水平缺失率
--het :个体纯合基因型数目
--vcf :指定 VCF 文件为.vcf,也可以是压缩格式.vcf.gz

输出

plink.frq:标记最小等位基因频率 MAF


plink.hwe:标记杂合度 O(HET)



plink.lmiss: 标记缺失率 F_MISS



plink.imiss:个体缺失率 F_MISS

plink.het:个体纯合度 O(HOM) / N(NM)


引用转载请注明出处,如有错误敬请指出。

相关文章

  • 4.2 基因型数据描述性统计

    完成标记开发后,会得到基因型数据,首先要对基因型数据进行统计,用到的工具是plink,安装及基础用法见链接:pli...

  • 小数据| 描述性统计(Python/R 实现)

    描述性统计 描述性统计是借助图表或者总结性的数值来描述数据的统计手段。数据挖掘工作的数据分析阶段,可以借助描述性统...

  • 【数据分析师必备】九大常用数据分析方法汇总(上)

    一、描述性统计 定义:描述性统计是一类统计方法的汇总,揭示了调查总体的数据分布特性。描述性统计分析要对调查总体所有...

  • R语言学习(六)基本统计分析--上

    整体数据计算描述性统计量 summary()函数 可以使用summary()函数来获取描述性统计量 可以看出sum...

  • 三、数据探索方法及函数汇总(Python描述)

    1 描述性统计 四个方面:数据的中心趋势、相对位置、离散度、相关性; 两种方式:统计量和统计图![描述性统计内容大...

  • SPSS基本统计分析

    描述性统计分析 描述性统计分析可以对数据进行基本描述,例如:平均值、众数、中位数、方差、总数。 频数分析,对数据进...

  • 数理统计

    描述性统计:平均值/标准差/中位数描述性统计是指运用制表和分类,图形以及计算概括性数据来描述数据特征的各项活动。描...

  • 数据探索之参数估计

    统计学有两大主要分支,分别是描述性统计学和推断统计学。描述性统计学用于描述和概括数据的特征以及绘制各类统计图表。总...

  • 数据描述性统计

    一、集中趋势 1、众数,样本中出现次数(频数)最多的数值。 2、中位数,一组样本数据按升序或降序排列后,如果样本容...

  • 面试工程体系篇

    1、数据简单查看参考 1.1、 查看数据描述性统计:describe() 1.2、 查看数据字段名:columns...

网友评论

    本文标题:4.2 基因型数据描述性统计

    本文链接:https://www.haomeiwen.com/subject/nebrgrtx.html