学习小组day6笔记--思亮

作者: 思亮笔记 | 来源:发表于2020-03-07 16:53 被阅读0次

学习R包

1.镜像设置

file.edit('~/.Rprofile')
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))#清华镜像
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")#中科大镜像
options()$repos
options()$BioC_mirror
  1. Rstudio有两个重要的配置文件:(Rstudio开启运行时先会查看配置文件)
  • .Renviron 设置R的环境变量
  • .Rprofile 一种代码文件
  1. options函数用于设置R运行过程中的一些选项设置

2.安装

  1. make sure the reliability of your Internet
  2. install.packages(" packagesName") 安装的包来自CRAN网站
  3. BiocManager::install("packages") 安装的包来自Bioconductor

3. 加载

library(packagename)require(packagename

#安装加载三部曲
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
install.packages("dplyr")
library(dplyr)
test <- iris[c(1:2,51:52,101:102),]

4.dplyr五个基本函数

  1. mutate(),新增列
mutate(test, New = c(1,2,3,4,5,6))
  1. select(),按列筛选
select(test,1) #根据索引筛选
select(test,Sepal.Length) #根据列名筛选
select(test,c(1,5)) #借用向量,按多个索引筛选
  1. filter(),按行筛选
filter(test, Species == "setosa")
filter(test, Species == "setosa"&Sepal.Length > 5)
filter(test, Species %in% c("Setosa","versicolor"))
  1. arrange(),按某一列或某几列对整个表格进行排序
arrange(test, Sepal.Length)
arrange(test, desc(Sepal.Length))
  1. summarise(),汇总
summarise(test,mean(Sepal.Length),sd(Sepal.Length))
group_by(test,Species)
summarise(group_by(test,Species),mean(Sepal.Length),sd(Sepal.Length))

5.dplyr两个实用功能

  1. 管道操作%>%(cmd/ctr + shift +M)
test %>% group_by(Species) %>% summarise(mean(Sepal.Length),sd(Sepal.Length))
  1. count统计某列的unique值
count(test,Species)

6.dplyr处理关系数据

  1. 内连inner_join()
inner_join(test1, test2, by = "x") #取交集
  1. 左连left_join()
left_join(test2, test1, by = 'x') #以左侧第一个数据集的x为标准
left_join(test1, test2, by = 'x') #注意两者结果并不相同
  1. 全连full_join()
full_join(test1, test2, by = 'x') #取并集
  1. 半连接semi_join():
semi_join(test1, test2, by = 'x')
# 返回test1中有,test2中有,的test1中的元素
  1. 反链接(anti_join):
anti_join(test1, test2, by = 'x')
# 返回test1中有,test2中没有没有,的test1中的元素
  1. 简单合并
bind_rows(test1, test2) #合并行要求列数相同
bind_cols(test1, test2)#合并列要求行数相同

7. 备注

  1. iris是内置数据集
  2. 加载任意一个tidyverse包即可用管道函数
  3. base包中有简单合并函数cbind() rbind()

相关文章

  • 学习小组day6笔记--思亮

    学习R包 1.镜像设置 Rstudio有两个重要的配置文件:(Rstudio开启运行时先会查看配置文件) .Ren...

  • 2020-06-20

    学习小组Day6笔记--马小林 1、如何配置RStudio的下载镜像 基础 在RStudio中,选择Tools——...

  • 学习小组Day6笔记——思

    安装R包 镜像设置 安装 install.packages(“包”) 或者BiocManager::install...

  • 学习小组Day7笔记--Robin

    学习笔记 继续学习Day6的R

  • 学习小组Day6笔记--kan

    笔记来自生信星球学习小组资料 Day6 学习内容-R包安装使用 1.思维导图镇楼 2.R包基本情况 由社区开发(d...

  • 学习小组day5笔记--思亮

    学习目标:数据结构 在Console控制台输入命令,相当于Linux命令行 R语言中的数据框相当于列表 1. 向量...

  • 学习小组day1笔记--思亮

    1. 学会搜索,培养搜索思维。谷歌、必应、虫部落搜索。专业教程推荐使用:搜狗微信、搜狗知乎、简书、github。2...

  • 学习小组day2笔记--思亮

    初识Linux 主流的Linux有CentOS和Ubuntu 主流的云服务器有腾讯云和阿里云 登陆方式有Windo...

  • 学习小组day4笔记--思亮

    R语言基础 1. R 以及 R studio的安装 安装出现问题,用搜狗微信搜索:“果子学生信 给自己一个全新的...

  • 学习小组day3笔记--思亮

    Linux环境下的软件安装 不同的生信实战项目,需要定制conda的分身。 conda相当于Linux的应用商店,...

网友评论

    本文标题:学习小组day6笔记--思亮

    本文链接:https://www.haomeiwen.com/subject/gcscdhtx.html