美文网首页
34.关于parse系列函数之解析因子

34.关于parse系列函数之解析因子

作者: 心惊梦醒 | 来源:发表于2021-08-18 21:54 被阅读0次

【上一篇:33.关于parse系列函数之解析字符串】
【下一篇:35.关于parse系列函数之解析日期和时间】

    R用因子表示包含已知可能值集合的分类变量。parse_factor()函数和factor()函数相似,但如果向量x的元素没有出现在levels中,则会出现警告。两个函数的Usage分别如下:

parse_factor(
  x,
  levels = NULL,
  ordered = FALSE,
  na = c("", "NA"),
  locale = default_locale(),
  include_na = TRUE,
  trim_ws = TRUE
)

factor(x = character(), levels, labels = levels,
       exclude = NA, ordered = is.ordered(x), nmax = NA)

    parse_factor()参数详细解析:
    x:要解析的字符向量
    levels:提供包含允许值的集合的字符向量,如果为NULL,将基于x的unique 值生成levels,以在x中出现的顺序进行排序。
    ordered:生成的因子是一个有序因子吗?
    na:将na指定的值解析为缺失值。na=character()表示没有缺失值。
    locale:见本篇末尾。
    include_na:如果NA出现,是否作为一个明确的因子去level?
    trim_ws:在解析之前,每个field前后的空白符是否要去掉,默认为TRUE。


    factor()函数用于将向量编码成因子。
    x是字符向量。
    levels:包含唯一值的向量,可选。默认是x的所有唯一值,按x升序排列。这个向量可以比sort(unique(x))小。
    labels:要么是与levels相同顺序的字符向量,要么是长度为1的字符向量。labels的重复值可以用来将x的不同值映射到相同的因子级别。
    exclude:形成levels集时要排除的值的集合
    ordered:指定levels是否是有序的。默认与x是否为有序有关。
    nmax:levels个数的上限。
    locale()函数的Usage:

locale(
  date_names = "en",
  date_format = "%AD",
  time_format = "%AT",
  decimal_mark = ".",
  grouping_mark = ",",
  tz = "UTC",
  encoding = "UTF-8",
  asciify = FALSE
)
default_locale()

【上一篇:33.关于parse系列函数之解析字符串】
【下一篇:35.关于parse系列函数之解析日期和时间】

相关文章

网友评论

      本文标题:34.关于parse系列函数之解析因子

      本文链接:https://www.haomeiwen.com/subject/chyvbltx.html