美文网首页生信星球培训第七期
学习小组Day6笔记--大羽

学习小组Day6笔记--大羽

作者: 海岛眠 | 来源:发表于2018-10-13 21:58 被阅读11次

一、教程思维导图

生信星球公众号教程

二、知识点

1️⃣准备工作
1.安装并加载tidyr包

install.packages("tidyr")
library(tidyr)
会有一些小细节需要注意

2.数据框常识
3.tidyr data格式

这是一种组织表格数据的方式,提供了一种能够跨包使用的“统一”的数据格式。
什么叫“统一”?
每个变量(variable)占一列,每个情况(case,姑且这么翻译)和观测值(observation)占一行。

生信星球公众号例子

2️⃣处理数据格式实操
1.reshape data
几种方式:

gather(a,X1999,X2000,key = "year",value = "cases")
数据框名,需合并的列名(两个),合并后的key列名,value列名。
==================================================
gather(a,"year","cases",X1999,X2000) #推荐的偷懒做法
ather(a,year,cases,-country)  #-country的意思就是合并除country外剩下的列。

2.handle missing values
处理丢失的数据。就是某些单元格有空值的情况。

三种处理方式:
(1).删除整行
(2).根据上下文(瞎)蒙一个
(3).同一列的空值填上同一个数。

对应代码(公众号):

drop_na():有空值的,整行删除掉
括号里填数据框名,依据的列名(有空值那一列的列名)
drop_na(X,X2)

fill(),根据上一行的数值填充上(好应付的感觉)
fill(X,X2)

replace_na(),空值填进去特定的一个数值(还是在应付)
括号里填数据框名,要填的列名=要填的值
replace_na(X,list(X2=2))

3.expand tables
①complete(把空值的位置补全)

complete(X,nesting(X1),fill = list(X2=5))
公众号例子

②expand(列出每列值所有可能的组合)
需要多练习
4.split cells

separate:按列分割
separate_rows:按行分割
把一列拆成两列,原列必须要有分隔符。

unite:分割完了再合并回去

相关文章

  • 学习小组Day6笔记--大羽

    一、教程思维导图 二、知识点 1️⃣准备工作1.安装并加载tidyr包 2.数据框常识3.tidyr data格式...

  • 2020-06-20

    学习小组Day6笔记--马小林 1、如何配置RStudio的下载镜像 基础 在RStudio中,选择Tools——...

  • 学习小组Day7笔记--Robin

    学习笔记 继续学习Day6的R

  • 学习小组Day6笔记--kan

    笔记来自生信星球学习小组资料 Day6 学习内容-R包安装使用 1.思维导图镇楼 2.R包基本情况 由社区开发(d...

  • 学习小组Day7笔记--大羽

    一、教程思维导图 二、知识点 1.三种测序方法的区别及特点 2.三种测序方法的过程和原理根据原理的方法名,记忆三种...

  • 学习小组Day3笔记--大羽

    一、第三天教程思维导图 二、需要了解的知识点 1.教程内容大纲(from 生信星球公众号) linux如何安装软件...

  • 学习小组Day2笔记--大羽

    一、教程思维导图 二、需要掌握的新知识点 1.win7系统中可以使用butty登录云服务器2.PC与服务器(生信星...

  • 学习小组Day4笔记--大羽

    一、教程思维导图 大纲(生信星球公众号): 1.安装R(基础)和Rstudio(人性化一些的界面)2.粗略了解R语...

  • 学习小组Day5笔记--大羽

    一、第五天教程思维导图 二、知识点 1.向量 标量:一个元素组成的变量向量:多个元素组成的变量元素指的是数字或者字...

  • 学习小组Day1笔记--大羽

    一、思维导图 二、知识点总结 知识点1:解决学习中遇到的问题 (1)可以通过引擎搜索或者利用星球学习的资源,即小组...

网友评论

    本文标题:学习小组Day6笔记--大羽

    本文链接:https://www.haomeiwen.com/subject/lajaaftx.html