排序算法相必大家都见过很多种,例如快速排序、归并排序、冒泡排序等等。今天,我们就来简单讲讲堆排序。
假如给你一个二叉堆,根据二叉堆的特性,你会怎么使用二叉堆来实现堆排序呢?
我们都知道,二叉堆有一个很特殊的节点 --- 堆顶,堆顶要嘛是所有节点的最大元素,要嘛是最小元素,这主要取决于这个二叉堆是最小堆还是最大堆。
今天,我们暂且选择以最小堆来作为例子。
基于堆顶这个特点,我们就可以来实现我们的堆排序了。
大家看下面一个例子:
对于一个如图有10个节点元素的二叉堆:
我们把堆顶这个节点删除,然后把删除的节点放在一个辅助数组help里。
显然,这个被删除的节点,是堆中最小的节点。接下来,我们继续删除二叉堆的堆顶,然后把删除的元素还是存放在help数组里。
显然,第二次删除的节点,是原始二叉堆中的第二小节点。
继续删除
继续连续6次删除堆顶,把删除的节点一次放入help数组。
二叉堆中只剩最后一个节点了,这个节点同时也是原始二叉堆中的最大节点,把这个节点继续删除了,还是放入help数组里。
此时,二叉堆的元素被删除光了,观察一下help数组。这是一个有序的数组,实际上,通过从二叉堆的堆顶逐个取出最小值,存放在另一个辅助的数组里,当二叉堆被取光之时,我们就完成了一次堆排序了。
在上面的堆排序过程中,我们使用了一个辅助数组help。可事实上,我们真的需要辅助数组吗?
上篇讲二叉堆的时候,我们说过。二叉堆在实现的时候,是采取数组的形式来存储的。
从二叉堆中删除一个元素,为了充分利用空间,其实我们是可以把删除的元素直接存放在二叉堆的最后一个元素那里的。例如:
删除堆顶,把删除的元素放在最后一个元素。
继续删除,把删除的元素放在最后第二个位置
继续删除,把删除的元素放在最后第三个位置
以此类推....
这样,对于一个含有n个元素的二叉堆,经过n-1(不用删除n次)次删除之后,这个数组就是一个有序数组了。
所以,给你一个无序的数组,我们需要把这个数组构建成二叉堆,然后在通过堆顶逐个删除的方式来实现堆排序。
其实,也不算是删除了,相当于是把堆顶的元素与堆尾部在交换位置,然后在通过下沉的方式,把二叉树恢复成二叉堆。
代码如下:
public class HeapSort {
/**
* 下沉操作,执行删除操作相当于把最后
* * 一个元素赋给根元素之后,然后对根元素执行下沉操作
* @param arr
* @param parent 要下沉元素的下标
* @param length 数组长度
*/
public static int[] downAdjust(int[] arr, int parent, int length) {
//临时保证要下沉的元素
int temp = arr[parent];
//定位左孩子节点位置
int child = 2 * parent + 1;
//开始下沉
while (child < length) {
//如果右孩子节点比左孩子小,则定位到右孩子
if (child + 1 < length && arr[child] > arr[child + 1]) {
child++;
}
//如果父节点比孩子节点小或等于,则下沉结束
if (temp <= arr[child])
break;
//单向赋值
arr[parent] = arr[child];
parent = child;
child = 2 * parent + 1;
}
arr[parent] = temp;
return arr;
}
//堆排序
public static int[] heapSort(int[] arr, int length) {
//构建二叉堆
for (int i = (length - 2) / 2; i >= 0; i--) {
arr = downAdjust(arr, i, length);
}
//进行堆排序
for (int i = length - 1; i >= 1; i--) {
//把堆顶的元素与最后一个元素交换
int temp = arr[i];
arr[i] = arr[0];
arr[0] = temp;
//下沉调整
arr = downAdjust(arr, 0, i);
}
return arr;
}
//测试
public static void main(String[] args) {
int[] arr = new int[]{1, 3, 5,2, 0,10,6};
System.out.println(Arrays.toString(arr));
arr = heapSort(arr, arr.length);
System.out.println(Arrays.toString(arr));
}
}
对于堆的时间复杂度,我就直接给出了,有兴趣的可以自己推理下,还是不难的。堆的时间复杂度是 O (nlogn)。空间复杂度是 O(1)。
这里可能大家会问,堆排序的时间复杂度是O (nlogn),像快速排序,归并排序的时间复杂度也是 O(nlogn),那我在使用的时候该如何选择呢?
这里说明一下:快速排序是平均复杂度 O(logn),实际上,快速排序的最坏时间复杂度是O(n^2。),而像归并排序,堆排序,都稳定在O(nlogn)
我给出一个问题,例如给你一个拥有n个元素的无序数组,要你找出第 k 个大的数,那么你会选择哪种排序呢?
显然在这个问题中,选用堆排序是最好的,我们不用把数组全部排序,只需要排序到前k个数就可以了。至于代码如何实现,这个我就不给代码了,大家可以动手敲一敲。
学习更多算法 + 计算机基础知识,欢迎关注我的微信公众号,每天准时推送技术干货