美文网首页
数据结构与算法(第一季):B树

数据结构与算法(第一季):B树

作者: 萧1帅 | 来源:发表于2021-11-29 09:41 被阅读0次

一、B树性质

1、初识B树

image
  • B树是一种平衡的多路搜索树,多用于文件系统,数据库的实现。
  • B树特点:
    • 一个节点可以存储超过2个元素,可以拥有超过2个子节点。
    • 拥有二叉树的一些性质。
    • 平衡,每个节点的所有子树高度一致。
    • 比较矮。

2、m阶B树的性质(m >= 2)

  • 假设一个节点存储的元素个数为x
    • 根节点个数:1 <= x <= m-1,三阶B树根节点数大于等于1并且小于等于2
    • 非根节点:(m / 2)(向下取整) - 1 <= x <= m - 1
    • 如果有子节点,子节点个数 y = x + 1
      • 根节点:2 <= y <= m
      • 非根节点:(m / 2)(向下取整) <= y <= m
image

3、B树 VS 二叉搜索树

  • 二叉搜索树的节点合并,可以成为B树
  • 多代(父和子)节点合并,可以获得一个超级节点(类似3阶B树中的1833节点,2330节点)。
    • 2代合并的超级节点,最多拥有4个子节点(至少是4阶B树)。
    • 3代合并的超级节点,最多拥有8个子节点(至少是8阶B树)。
    • n代合并的超级节点,最多拥有2^n个子节点(至少是2^n阶B树)。
image
  • 1833合并,2330合并,2021合并,4547合并,5052合并。即将一个B树变为二叉搜索树
image

二、B树的操作

1、搜索

  • 先在节点内部从小到大搜索元素。
  • 如果命中,搜索结束。
  • 如果未命中,再去对应的子节点中搜索元素,重复步骤1
image
  • 假设搜索72,首先在根节点做比较,72大于40,所以接着在根节点右子树搜索,72大于60小于80,继续在6080之间的子树寻找,因为72大于70,所以需要继续往70右子树寻找,但是右子树为空,所以得出结论72不在该B树上。

2、添加

  • 新添加的元素必定是添加到叶子节点
image
  • 假设插入55,首先在根节点做比较,55大于40,所以接着在根节点右子树搜索,55小于60,继续在60左子树寻找,55大于50,所以将55插入在节点50的右侧。
image
  • 假设插入95,首先在根节点做比较,95大于40,所以接着在根节点右子树搜索,95大于80,继续在80右子树寻找,95大于90小于100,所以将95插入在节点90100的中间。

3、上溢

image
  • 假设再插入98呢?(假设这是一颗4阶B树
    • 最右下角的叶子节点的元素个数将超过限制。
    • 这种现象可以称之为:上溢(overflow)

4、上溢的解决

  • 假设5阶B树
image
  • 上溢节点的元素个数必然等于m(5)
  • 假设上溢节点最中间元素的位置为k(3)
  • k位置的元素向上与父节点合并
  • [0,k-1][k+1,m-1]位置的元素分裂成2子节点,这2个子节点的元素个数,必然都不会低于最低限制(m / 2(向下取整) - 1)
image
  • 一次分裂完毕后,有可能导致父节点上溢,依然按照上述方法解决。
image
  • 最极端的情况,有可能一致分裂到根节点
  • 添加元素导致的上溢,是唯一一种可能导致B树长高的操作。

5、添加导致上溢的例子

image
  • 插入98
image
  • 98大于根节点,继续往根节点右子树比较,98大于6080,继续往80右子树比较,98大于9095,小于100,所以将98插入在95100中间。
  • 插入98之后,90 95 98 100节点溢出,需要上溢,将中间元素95或98向上与父节点合并,将90,98,100节点分裂成2个子节点。
  • 插入52
image
  • 插入54
image

6、删除

  • 假如需要删除的元素在叶子节点中,那么直接删除即可。
image
  • 删除30
image
  • 假如需要删除的元素在非叶子节点中。
    • 先找到前驱或后继元素,覆盖所需删除元素的值。
    • 再把前驱或后继元素删除。
  • 删除60
image
  • 60的前驱为55,将5554和55节点中删除,并将55覆盖60
image
  • 非叶子节点的前驱或后继元素,必定在叶子节点中。
    • 所以这里的删除前驱或后继元素,就是最开始提到的情况:删除的元素在叶子节点中。
    • 真正的删除元素都发生在叶子节点中。

7、下溢

image
  • 假设一颗5阶B树,删除22
  • 叶子节点被删除一个元素后,元素个数可能会低于最低限制(>= m/2(向下取整) - 1)
  • 这种现象称为:下溢(underflow)

8、下溢的解决

  • 下溢节点的元素数量必然等于(m/2(向下取整) - 2)
  • 如果下溢节点临近的兄弟节点,有至少m/2(向下取整)个元素,可以向其借一个元素。
image
  • 绿色节点在删除一个元素后,节点元素个数低于最低限制(>= m/2(向下取整) - 1)
    • 为了使树继续满足B树的要求,需要对绿色节点进行下溢操作。
    • 将父节点的元素b插入到下溢节点的0位置(最小位置)。
    • 用兄弟节点的元素a(最大的元素)替代父节点的元素b
    • 这种操作其实就是:旋转
    • 注意子节点d也需要调整。
image
  • 如果下溢节点临近的兄弟节点,只有(>= m/2(向下取整) - 1)个元素。
    • 将父节点的元素b挪下来跟左右子节点进行合并
    • 合并后的节点元素个数等于m/2(向下取整) + m/2(向下取整) - 2,不超过m-1
    • 这个操作可能会导致父节点下溢,依然按照上述方法解决,下溢现象可能会一直往上传播。
  • 添加元素导致的下溢,是唯一一种可能导致B树变矮的操作。

相关文章

  • B-树和B+树

    参考链接:MySQL索引背后的数据结构及算法原理B树、B-树、B+树、B*树 1.B-Tree 为了描述B-Tre...

  • mysql索引

    从数据结构角度 1、B+树索引(O(log(n))):关于B+树索引,可以参考MySQL索引背后的数据结构及算法原...

  • PHP面试知识梳理

    算法与数据结构 BTree和B+tree BTree B树是为了磁盘或者其他存储设备而设计的一种多叉平衡查找树,相...

  • 数据结构与算法(第一季):B树

    一、B树性质 1、初识B树 B树是一种平衡的多路搜索树,多用于文件系统,数据库的实现。 B树特点:一个节点可以存储...

  • 收藏夹

    平衡二叉树、B树、B+树、B*树 MySQL索引背后的数据结构及算法原理 Redis集群方案应该怎么做? 分布式开...

  • 初始算法

    数据结构与算法 数据结构和算法是一名程序开发人员的必备基本功 >算法引入 如果a+b+c=1000,且a^2+b^...

  • 数据结构与算法B树和B+树

    1.B树又称多路平衡查找树,B树中所有结点的孩子个数的最大值称为B树的阶,通常用m表示 2.B+树的基本概念每个分...

  • 数据结构与算法--数据结构与算法--B+树

    B+树:MySQL数据库索引的数据结构 1.理清需求 对于数据库两个最基本的查询需求: 根据某个值查找数据,比如s...

  • 数据结构与算法 - 查找

    数据结构与算法系列文章数据结构与算法 - 时间复杂度数据结构与算法 - 线性表数据结构与算法 - 树形结构数据结构...

  • 数据结构与算法学习开篇

    数据结构与算法知识图谱 20个最常用的、最基础数据结构与算法 10个数据结构:数组、链表、栈、队列、散列表、二叉树...

网友评论

      本文标题:数据结构与算法(第一季):B树

      本文链接:https://www.haomeiwen.com/subject/mvikxrtx.html