dplyr

作者: Thinkando | 来源:发表于2019-07-30 21:37 被阅读33次

tidyverse学习
R：数据处理常用包
《学习小组DAY6笔记-喵》
R_Datacamp3(2018-07-20——2018-07-
R数据科学（三）dplyr
Day - 6 噜噜
R成精-用dplyr高效变换数据和处理数据
R成精-用dplyr高效变换数据和处理数据
《学习小组Day6笔记--寒鹤》
学习小组Day6笔记-番茄

1. filter 函数

data<-iris 

根据给定的逻辑判断，筛选符合条件的子集。
data1<-filter(data,Sepal.Length>7)  #筛选Sepal.Length（花萼长度）大于7的数据

data2<-filter(data,Species=="versicolor")  #筛选物种为“versicolor”的数据

data3<-filter(data,Species!="versicolor" & Petal.Length>4.5)  #筛选物种不为“versicolor”且Petal.Length（花瓣长度）大于4.5的数据

2. arrange() 函数

按给定的列名对行进行排序。
data4<-arrange(data,Sepal.Length)  #按Sepal.Length进行排序，默认为升序

data5<-arrange(data,desc(Sepal.Length))  #加desc参数，按Sepal.Length进行降序排序

3. select 函数

用列名做参数选择子数据集。
data6<-select(data,Sepal.Width:Petal.Width)  #选择Sepal.Width（花萼宽度）到Petal.Width（花瓣宽度）的列

data7<-select(data,starts_with("P"))  #结合starts_with函数，选择变量名以P开头的列

4. mutate() 函数

对现有的列进行运算，并作为新列添加。
data8<-mutate(data,S.L=10*Sepal.Length)  #增加S.L列为Sepal.Length列的10倍

data9<-mutate(data,L.W=Sepal.Length/Sepal.Width)  #增加L.W列为Sepal.Length除以Sepal.Width的数值

5. summarise() 函数

对数据框调用其它函数进行汇总操作，返回一维的结果。
data10<-summarise(data,mean(Sepal.Length))  #求Sepal.Length的平均值

6. group_by() 分组函数

添加了group_by()分组信息后就可对数据执行分组操作，常与summarise() 结合使用。

data11<-summarise(group_by(data,Species),mean(Sepal.Length))  #对数据按Species分组，计算Sepal.Length平均值

image.png

网友评论

本文标题：dplyr

本文链接：https://www.haomeiwen.com/subject/kfborctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

dplyr

1. filter 函数

2. arrange() 函数

3. select 函数

4. mutate() 函数

5. summarise() 函数

6. group_by() 分组函数

相关文章

tidyverse学习

R：数据处理常用包

《学习小组DAY6笔记-喵》

R_Datacamp3(2018-07-20——2018-07-

R数据科学（三）dplyr

Day - 6 噜噜

R成精-用dplyr高效变换数据和处理数据

R成精-用dplyr高效变换数据和处理数据

《学习小组Day6笔记--寒鹤》

学习小组Day6笔记-番茄

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

R语言生信

科研信息学