1. filter 函数
data<-iris
根据给定的逻辑判断,筛选符合条件的子集。
data1<-filter(data,Sepal.Length>7) #筛选Sepal.Length(花萼长度)大于7的数据
data2<-filter(data,Species=="versicolor") #筛选物种为“versicolor”的数据
data3<-filter(data,Species!="versicolor" & Petal.Length>4.5) #筛选物种不为“versicolor”且Petal.Length(花瓣长度)大于4.5的数据
2. arrange() 函数
按给定的列名对行进行排序。
data4<-arrange(data,Sepal.Length) #按Sepal.Length进行排序,默认为升序
data5<-arrange(data,desc(Sepal.Length)) #加desc参数,按Sepal.Length进行降序排序
3. select 函数
用列名做参数选择子数据集。
data6<-select(data,Sepal.Width:Petal.Width) #选择Sepal.Width(花萼宽度)到Petal.Width(花瓣宽度)的列
data7<-select(data,starts_with("P")) #结合starts_with函数,选择变量名以P开头的列
4. mutate() 函数
对现有的列进行运算,并作为新列添加。
data8<-mutate(data,S.L=10*Sepal.Length) #增加S.L列为Sepal.Length列的10倍
data9<-mutate(data,L.W=Sepal.Length/Sepal.Width) #增加L.W列为Sepal.Length除以Sepal.Width的数值
5. summarise() 函数
对数据框调用其它函数进行汇总操作,返回一维的结果。
data10<-summarise(data,mean(Sepal.Length)) #求Sepal.Length的平均值
6. group_by() 分组函数
添加了group_by()分组信息后就可对数据执行分组操作,常与summarise() 结合使用。
data11<-summarise(group_by(data,Species),mean(Sepal.Length)) #对数据按Species分组,计算Sepal.Length平均值

image.png
网友评论