美文网首页R可视化和ggplot2
《R数据可视化手册》学习笔记3---条形图(2)频数条形图

《R数据可视化手册》学习笔记3---条形图(2)频数条形图

作者: RSP小白之路 | 来源:发表于2023-09-11 08:37 被阅读0次

写在前面。

条形图一般用来展示不同分类下(x轴)某个数值型变量的取值(y轴)。注意,条形的高度,有时是变量的频数,有时是变量的取值本身,需要注意区分。

条形图

我没有按照书中的章节顺序,而是根据条形高度映射数据类型图形位置图形元素进行了分类整合,使脉络更清晰,知识点更集中

同时随着ggplot2包的更新,书中的一些用法也已经不适用了,因此会做一些更正。

所使用的一些示例数据需要安装加载包gcookbook,同时也需要加载ggplot2

if(!require(gcookbook) ) install.packages("gcookbook")
library(gcookbook)
library(ggplot2)

另外,ggplot2绘图的常用基本语句需要知道:

ggplot(data = , aes(x= , y = ) ) + geom_xxxx() + ...

1. 条形高度

如上文所说,条形的高度有时映射的是变量的取值本身,有时是变量的频数统计值。

1.2 频数条形图

如果数据中每一行观测对应的就是一个样本,如何绘制样本频数分布条形图呢?

使用示例数据diamonds数据集,它记录了钻石的品质数据

> str(diamonds)
tibble [53,940 × 10] (S3: tbl_df/tbl/data.frame)
 $ carat  : num [1:53940] 0.23 0.21 0.23 0.29 0.31 0.24 0.24 0.26 0.22 0.23 ...
 $ cut    : Ord.factor w/ 5 levels "Fair"<"Good"<..: 5 4 2 4 2 3 3 3 1 3 ...
 $ color  : Ord.factor w/ 7 levels "D"<"E"<"F"<"G"<..: 2 2 2 6 7 7 6 5 2 5 ...
 $ clarity: Ord.factor w/ 8 levels "I1"<"SI2"<"SI1"<..: 2 3 5 4 2 6 7 3 4 5 ...
 $ depth  : num [1:53940] 61.5 59.8 56.9 62.4 63.3 62.8 62.3 61.9 65.1 59.4 ...
 $ table  : num [1:53940] 55 61 65 58 58 57 57 55 61 61 ...
 $ price  : int [1:53940] 326 326 327 334 335 336 336 337 337 338 ...
 $ x      : num [1:53940] 3.95 3.89 4.05 4.2 4.34 3.94 3.95 4.07 3.87 4 ...
 $ y      : num [1:53940] 3.98 3.84 4.07 4.23 4.35 3.96 3.98 4.11 3.78 4.05 ...
 $ z      : num [1:53940] 2.43 2.31 2.31 2.63 2.75 2.48 2.47 2.53 2.49 2.39 ...

使用geom_bar(),同时y不映射变量,那么geom_bar()会默认统计x映射变量的频数。本例中x离散型变量

ggplot(data = diamonds, aes(x= cut )) + geom_bar()

[图片上传失败...(image-b99147-1694479057080)]


可以看到,有20000颗以上的钻石切割得最佳。

如果x映射的变量是连续型,我们会得到一张每个x值对应的频数分布直方图

ggplot(data = diamonds, aes(x= carat )) + geom_bar()

[图片上传失败...(image-fa3b48-1694479057080)]

注意,和书中说的不同,现在默认情况下,<font color=red>geom_bar()和geom_histogram()绘制连续型变量的图形还是不同的。</font>

ggplot(data = diamonds, aes(x= carat )) + geom_histogram()

[图片上传失败...(image-685200-1694479057080)]


不过,上述geom_histogram()和下面的语句是等价的:

ggplot(data = diamonds, aes(x= carat )) + stat_bin()

以上,条形的高度x轴映射变量的关系就讲这么多。


相关文章

  • R语言可视化手册学习笔记

    写在前面 本文基于《R语言可视化手册》来进行练习以及重复其中的代码。 条形图 绘制频数条形图 在绘制条形图的时候如...

  • 第二章 条形图

    二、条形图 1,简单的条形图 2,绘制簇状条形图 3,绘制频数分布条形图 4,条形图着色 5,对正负条形图分别着色...

  • ggplot2学习day1

    使用书籍:R数据可视化手册快速索引 1.散点图 推荐使用后者 2.折线图 图分别为一下所示 3.条形图 barpl...

  • 举个栗子!Tableau 技巧(122):创新条形图之 圆角条形

    之前,我们分享过探索条形图创新可视化。很多数据粉对第2个圆角条形图(如下图)很感兴趣。 今天,我们分享圆角条形图的...

  • R语言绘制条形图

    数据 简单条形图 最基本用法:barplot() 水平条形图 数据 堆砌条形图 棘状图 分组条形图 数据 均值条形图

  • 【tableau数据分析可视化-专题(4)】-Tableau制作

    一、学习背景 (1)条形图是最常用的一种将数据可视化的统计图表之一。(2)通过条形图可以快速地对比各信息值的高低,...

  • R语言之可视化(30)扫地僧easystats(1)

    R语言之可视化(29)如何更改ggplot2中堆积条形图中的堆积顺序 R语言之可视化(30)扫地僧easystat...

  • Matplotlib基础用法

    绘制条形图 pyplot.bar(x轴数据,y轴数据) 绘制频数/频率分布直方图 pyplot.hist(原始数据...

  • R语言 条形图

    条形图表示矩形条中的数据,条的长度与变量的值成比例。 R语言使用函数barplot()创建条形图。 R语言可以在条...

  • 生物统计-数据可视化

    可视化工具:R包,ggplot,ggplot2,两种可视化变量:类别型、定量型。饼图、柱状图。条形图、散点图、箱线...

网友评论

    本文标题:《R数据可视化手册》学习笔记3---条形图(2)频数条形图

    本文链接:https://www.haomeiwen.com/subject/viximdtx.html