【上一篇:33.关于parse系列函数之解析字符串】
【下一篇:35.关于parse系列函数之解析日期和时间】
R用因子表示包含已知可能值集合的分类变量。parse_factor()函数和factor()函数相似,但如果向量x的元素没有出现在levels中,则会出现警告。两个函数的Usage分别如下:
parse_factor(
x,
levels = NULL,
ordered = FALSE,
na = c("", "NA"),
locale = default_locale(),
include_na = TRUE,
trim_ws = TRUE
)
factor(x = character(), levels, labels = levels,
exclude = NA, ordered = is.ordered(x), nmax = NA)
parse_factor()参数详细解析:
x:要解析的字符向量
levels:提供包含允许值的集合的字符向量,如果为NULL,将基于x的unique 值生成levels,以在x中出现的顺序进行排序。
ordered:生成的因子是一个有序因子吗?
na:将na指定的值解析为缺失值。na=character()表示没有缺失值。
locale:见本篇末尾。
include_na:如果NA出现,是否作为一个明确的因子去level?
trim_ws:在解析之前,每个field前后的空白符是否要去掉,默认为TRUE。
factor()函数用于将向量编码成因子。
x是字符向量。
levels:包含唯一值的向量,可选。默认是x的所有唯一值,按x升序排列。这个向量可以比sort(unique(x))小。
labels:要么是与levels相同顺序的字符向量,要么是长度为1的字符向量。labels的重复值可以用来将x的不同值映射到相同的因子级别。
exclude:形成levels集时要排除的值的集合
ordered:指定levels是否是有序的。默认与x是否为有序有关。
nmax:levels个数的上限。
locale()函数的Usage:
locale(
date_names = "en",
date_format = "%AD",
time_format = "%AT",
decimal_mark = ".",
grouping_mark = ",",
tz = "UTC",
encoding = "UTF-8",
asciify = FALSE
)
default_locale()
网友评论