dplyr包

作者: 801ca16edefa | 来源:发表于2022-03-07 15:14 被阅读0次

1. dplyr简介

dplyr是R语言的数据分析包,能对dataframe类型的数据做很方便的数据处理和分析操作。d代表dataframe - plyr是英文钳子plier的谐音.

dplyr如同R的大多数包,都是函数式编程。有点类似于流水线,每个函数就是一个车间,多个车间共同完成一个生产(数据分析)任务。

而在dplyr中,就有一个管道符 %>% ,符号左侧表示数据的输入,右侧表示下游数据处理环节。

dplyr是R中专门用于数据处理的包。更具体功能包括:

•select() 从数据中选择列

•filter() 数据行的子集

•group_by()汇总数据

•summarise()汇总数据(计算汇总统计信息)

•arrange() 排序数据

mutate() 创建新变量

2. dplyr常用函数

2.1 arrange


也可以写成下面的形式: aapl %>% arrange(-Volume)

2.2 Select

排除3列 aapl %>% select(-c("Open", "High", "Low"))

2.3 Filter

aapl %>% filter((Close>=150) & (Close>Open))

2.4 Mutate(重点)

aapl %>% mutate(n=row_number())

注:转自知乎(HiDadeng)

相关文章

网友评论

      本文标题:dplyr包

      本文链接:https://www.haomeiwen.com/subject/lbcadctx.html