美文网首页
R基础四(因子)

R基础四(因子)

作者: 多啦A梦的时光机_648d | 来源:发表于2020-02-19 14:16 被阅读0次

因子

因子最大的作用就是用来分类,计算频数和频率。

变量分类

  1. 名义型变量(例如广东,深圳等,彼此独立,没有顺序)
  2. 有序型变量 (例如病情状况good,better,best)
  3. 连续型变量(例如1,5,7,8等数值为连续的数量变化)

名义型变量和连续型变量在R中为因子(factor),这些分类变量的可能值称为一个水平(level),例如good,better,best都称为一个level。
由这些水平值构成的向量称为因子。

  • 因子作用
计算频数
独立性检验
相关性检验
方差分析
主成分分析
因子分析

在许多绘图函数中,输入的数据也必须是因子。
table()统计频数
例如mtcars

> mtcars
> mtcars$cyl    ##去除cyl这一列作为因子数据
 [1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4
> table(mtcars$cyl)  ##统计频数
 4  6  8 
11  7 14   ##cyl这一列可以作为因子类型,其中4,6,8为因子的level。
  • 可以利用factor()函数将向量转换为因子,或者说用factor()函数来定义因子。
> f <- factor(c('red','blue','yellow','grey','red'))
> f
[1] red    blue   yellow grey   red   
Levels: blue grey red yellow

这样的level是没有顺序的,可以自己手动添加顺序。

> f <- factor(c('mon','sat','fri','mon','thu','sun'), ordered = T, levels= c('mon','tue','wen','thu','fri','sat','sun'))
> f
[1] mon sat fri mon thu sun
Levels: mon < tue < wen < thu < fri < sat < sun  ##次数levels就有顺序了

> fcyl <- factor(mtcars$cyl)  ##将向量转换为因子
> fcyl
 [1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4
Levels: 4 6 8

此时可以分别对mtcarscyl和factor(mtcarscyl)绘图。

> mtcars$cyl
 [1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4
> fcyl <- factor(mtcars$cyl)
> fcyl
 [1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4
Levels: 4 6 8
plot(mtcars$cyl)
plot(factor(mtcars$cyl))
mtcars$cyl factor(mtcars$cyl)

相关文章

  • R基础四(因子)

    因子 因子最大的作用就是用来分类,计算频数和频率。 变量分类 名义型变量(例如广东,深圳等,彼此独立,没有顺序) ...

  • R语言基础--数据类型-总结

    R语言基础--数据类型-总结 1、R语言基础--数据类型之向量 2、R语言基础--数据类型之因子 3、R语言基础-...

  • R 学习笔记(5) -- 因子和表

    因子 因子 (factor) 是 R 语言中许多强大运算的基础,包括许多针对表格数据的运算。因子的设计思想来源于统...

  • 理论:因子分析原理剖析

    因子分析概述: 因子分析分为Q型和R型,我们对R型进行如下研究: 一.因子分析步骤: 1.确认是是否适合做因子分析...

  • R 语言-因子

    1、变量分类: (1)连续型变量(2)名义型变量(3)有序型变量在 R 中,名义型变量和有序型变量称为因子(fac...

  • R语言 因子

    因子是用于对数据进行分类并将其存储为级别的数据对象。 它们可以存储字符串和整数。 它们在具有有限数量的唯一值的列中...

  • R | factor 因子

    factor 因子 在R中数据的分类是用因子数据类型(factor)来表示的。如性别。 我们想按照status对患...

  • R语言——因子

    变量课归结为名义型、有序型或连续型变量。 名义型变量是美哟顺序之分的类别变量。有序型变量表示一种顺序关系,而非数量...

  • R语言入门2:数据结构-3

    6. 因子(farcor) 在R语言中,因子是用来处理分类数据的,分类数据又可以分为有序和无序。我们可以把因子简单...

  • R语言主成分和因子分析篇

    转载自 R语言主成分和因子分析篇另可参考 R in action读书笔记(19)第十四章 主成分和因子分析 主成分...

网友评论

      本文标题:R基础四(因子)

      本文链接:https://www.haomeiwen.com/subject/bpanfhtx.html