二叉搜索树
二叉搜索树(Binary Search Tree,BST)是一种特殊的二叉树,它具有以下性质:
有序性:对于树中的任意节点,其左子树上所有节点的值都小于该节点的值,其右子树上所有节点的值都大于该节点的值。
二叉树结构:每个节点最多有两个子节点,即左子节点和右子节点。
没有键值重复:树中不存在两个节点具有相同的键值。
二叉搜索树的基本操作包括:
- 查找(Search):给定一个值,查找树中是否存在该值。
- 插入(Insert):插入一个新的值。
- 删除(Delete):删除树中的一个节点。
- 遍历(Walk):二叉搜索树可以通过中序遍历得到一个有序的元素序列。
二叉搜索树上的基本操作所花费的时间与这棵树的高度 h 成正比。
遍历操作
二叉搜索树性质允许我们通过一个简单的递归算法来按序输出二叉搜索树中的所有关键字,这种算法称为中序遍历(inorder tree walk)算法。
这样命名的原因是输出的子树根的关键字位于其左子树的关键字值和右子树的关键字值之间。(前序遍历、后序遍历类似。)
伪代码如下:
1 | INORDER-TREE-WALK(x) |
显然,遍历一个二叉搜索树的时间代价是 **Θ(n)**。
查询操作
在一棵高度为h 的二叉搜索树上,查询操作
SEARCH
、MINIMUM
、MAXIMUM
、SUCCESSOR
和PREDECESSOR
均可以在 O(h) 时间内完成。
查找
我们通过 TREE-SEARCH(x, k)
,查找以x
为根的树中是否包含关键字 k
。
1 | TREE-SEARCH(x, k) |
不难证明,查找操作的时间代价是 **O(h)**。
最小值和最大值
TREE-MINIMUM(x)
寻找以x为根的树中的最小值(就是子树的最左节点)。
1 | TREE-MINIMUM(x) |
TREE-MAXIMUM(x)
寻找以x为根的树中的最大值(就是子树的最右节点)。
1 | TREE-MAXIMUM(x) |
这两个过程在一棵高度为 h 的树上均能在 O(h) 时间内执行完。
后继和前驱
所谓后继,就是当前节点在中序遍历过程中的下一个节点。这也是从小到大排序中,大于当前节点的最小节点。
前驱同理。
1 | # python 实现 |
1 | # python 实现 |
该过程或者遵从一条简单路径沿树向上或者遵从简单路径沿树向下。所以,SUCCESSOR
操作可以在 O(h) 时间内完成。
插入操作
插入操作,与查找操作类似,只不过是在二叉搜索树中没能找到对应元素。此时,我们就在查找路径的尽头,插入新元素。
所以,TREE-INSERT
操作可以在 O(h) 时间内完成。
伪代码如下:
1 | TREE-INSERT(T, z) |
删除操作
删除的过程如下:
- 如果被删除节点 z 没有孩子,则直接删除 z。
- 如果 z 只有一个孩子,那么 z 孩子替代 z 的位置。
- 如果 z 有两个孩子:
- z 的后继 y(一定在 z 的右子树中)替代 z 的位置。
- y 的孩子代替 y 的位置。(y 是子树中的最左节点,只有一个孩子。)
不难证明,TREE-DELETE
能在 O(h) 时间内完成。
随机构建
随机构建二叉搜索树是指:按随机次序插入关键字到一棵初始的空树中而生成的树,且输入的关键字排列等可能的出现。
一棵有 n 个不同关键字的随机构建二叉搜索树的期望高度为 **O(lgn)**。
证明: