经典算法实现之堆排序

算法

堆排序是比较基础的排序算法,它的流程比较多,理解起来不会像冒泡排序和选择排序那样直观。

二叉树是每个节点最多有两个子树的树结构。通常子树被称作“左子树”(left subtree)和“右子树”(right subtree)

二叉堆是一棵被完全填满的二叉树,有例外的可能是底层元素,底层元素从左到右填入,这样的树被称为完全二叉树。

仔细观察可以发现,其实一个数组可以被表示成一个二叉树:

2177145-84d4b8f4d1b121b2

观察上图可以发现,任意一位置i上元素,其左儿子为2i+1上,右儿子在2i+2上。

我们现在的需求是对数组元素进行从小到大排序,那么我们需要根据既定的数据构建堆,这也是堆排序必要的一步。在构建堆的时候,我们需要满足堆序性质。

堆序性质:任意一个节点小于(大于)它的后裔,这取决于你测排序方式。

这里以从小到大排序为例。我们可以建立一个大根堆,每一轮构建完成后,取出根节点(即最大节点)放在最后,所以最小节点在根上,然后重新构建大根堆。

堆排序主要分三步:

  1. 构建堆
  2. 调整堆
  3. 堆排序

每次排序结束,将根节点取出,放在最后,即每一轮可以将一个当前最大值排在正确的位置上

举一个例子:

dui6

此时9和4交换,然后4为根的子树又不是大根堆了,继续递归构建:

dui6

这样就得到了9是最大值,将他取出来,放在数组最后,2在根上,不是大根堆,重新构建。

dui7

实现

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
#include <algorithm>
#include <cassert>
#include <iostream>

/**
*
* Utility function to print the array after
* sorting.
*
* @param arr array to be printed
* @param sz size of array
*
*/
template <typename T>
void printArray(T *arr, int sz) {
for (int i = 0; i < sz; i++) std::cout << arr[i] << " ";
std::cout << "\n";
}

/**
*
* \addtogroup sorting Sorting Algorithm
* @{
*
* The heapify procedure can be thought of as building a heap from
* the bottom up by successively sifting downward to establish the
* heap property.
*
* @param arr array to be sorted
* @param n size of array
* @param i node position in Binary Tress or element position in
* Array to be compared with it's childern
*
*/
template <typename T>
void heapify(T *arr, int n, int i) {
int largest = i;
int l = 2 * i + 1;
int r = 2 * i + 2;

if (l < n && arr[l] > arr[largest])
largest = l;

if (r < n && arr[r] > arr[largest])
largest = r;

if (largest != i) {
std::swap(arr[i], arr[largest]);
heapify(arr, n, largest);
}
}

/**
* Utilizes heapify procedure to sort
* the array
*
* @param arr array to be sorted
* @param n size of array
*
*/
template <typename T>
void heapSort(T *arr, int n) {
for (int i = n - 1; i >= 0; i--) heapify(arr, n, i);

for (int i = n - 1; i >= 0; i--) {
std::swap(arr[0], arr[i]);
heapify(arr, i, 0);
}
}

/**
*
* @}
* Test cases to test the program
*
*/
void test() {
std::cout << "Test 1\n";
int arr[] = {-10, 78, -1, -6, 7, 4, 94, 5, 99, 0};
int sz = sizeof(arr) / sizeof(arr[0]); // sz - size of array
printArray(arr, sz); // displaying the array before sorting
heapSort(arr, sz); // calling heapsort to sort the array
printArray(arr, sz); // display array after sorting
assert(std::is_sorted(arr, arr + sz));
std::cout << "Test 1 Passed\n========================\n";

std::cout << "Test 2\n";
double arr2[] = {4.5, -3.6, 7.6, 0, 12.9};
sz = sizeof(arr2) / sizeof(arr2[0]);
printArray(arr2, sz);
heapSort(arr2, sz);
printArray(arr2, sz);
assert(std::is_sorted(arr2, arr2 + sz));
std::cout << "Test 2 passed\n";
}

/** Main function */
int main() {
test();
return 0;
}

image-20231104224151999