R way -- P5
Tips
-
读取文件时,
read.table(file = "filename" , sep = "\t" , header = T ),- 其中
sep是形式参数,用来指定字符的分隔符号。csv 文件是用逗号分隔的,所以sep = ",",tsv和txt文件是以 制表符 分隔的,所以sep = "\t",如果有文件的是以空格分隔的,则sep = " " - 其中
header = T指的是导入数据时,第一行作为 列的名称,具体数据从第二行开始 ,如果header = F指的是,第一行视为具体数据。
- 其中
-
colnames(a)#查看 a 的列名;rownames(a)#查看 a 的行名-
colnames(a)[1] <- "newname"#如果左上角第一个为空,R会自动补为x,用这个命令来修改成自己想要的名字
-
-
b <- read.csv(file = "filename", sep = ",", header = T, row.names = 1)#这行代码中最后的row.names = 1的意思是 第一列为行名。 -
write.table(a, file = "filename2", sep = ",", quote = F)#导出数据框。quote = F意思是 字符串不加双引号 (默认格式带有双引号,不影响读入) -
这次没有处理完的数据下次想接着用怎么办?--学会保存和重新加载。保存的格式是
.RData。
save.image(file="bioinfoplanet.RData")#保存镜像文件
save(X,file="test.RData")#保存其中一个变量
load("test.RData")#再次使用 RData 时的加载命令 -
X$列名#可以提取列(优秀写法,而且这个命令还优秀到不用写括号的地步,并且支持Tab自动补全哦,不过只能提取一列) -
a <-data.frame(case=paste("S",1:50),values=runif(50))# case和values 是列名。
plot(a$case,a$values)#根据这两列的数据作图
为了避免多次输入变量a,可有更高效的方式-
attach(a) plot(case,values)#attach(a),就是将数据框名添加到搜索环境中,作图时就只需输入列名(连$都不用了)。detach(a)#做完之后,将a删除出搜索环境。
局限性:两个以上数据框的列名有冲突时,同时attach会报错。
-
课后作业
原因可能是前文代码中的x与保存文件是的x的大小写不统一,造成找不到对象。
所以在命名变量时,尽量使用大小写不同的英文字母。








网友评论