Алгоритм основан на промежуточном упорядочивании массива входных данных {A1 ,…, AN }. Мы докажем, что промежуточно-упорядоченный массив (мы будем его называть пирамидально-упорядоченным) обладает свойством максимальности своего первого элемента. Тогда мы отрезаем от массива первый элемент и восстанавливаем утраченное свойство пирамидально-упорядоченности у оставшегося куска. Так, отрезая по одному (максимальному из оставшихся) элементу, мы можем `набрать’ полный упорядоченный массив.
Определение.
Массив {A1
,…, AN } называется пирамидально-упорядоченным,
если для всех допустимых i: A[i/2]
³
Ai
.
Иначе данное соотношение можно выписать следующим образом:
Ai ³
A2i и Ai ³
A2i+1
(*)
Легко видеть, что данные соотношения задают древообразную структуру, в вершине которой находится первый элемент дерева. Его потомками являются элементы с номерами 2 и 3, и т.д. В получившемся дереве все слои заполнены, кроме, быть может, последнего. Поэтому глубина дерева равна [log N]+1, где N – количество элементов в множестве.
Пусть для некоторого поддерева пирамиды, начинающегося с элемента с индексом i и заканчивающегося элементом с индексом N, выполнено свойство (*) для всех элементов поддерева, кроме вершины поддерева. Т.е. свойство выполняется для всех элементов, имеющих индексы больше i (здесь имеется в виду возможное невыполнения условий Ak ³ A2k и Ak ³ A2k+1 для k=i и его выполнение при k>i).
Определим процедуру Heapify(A,i,N), которая в данном случае подправляет элементы поддерева до полной пирамидально-упорядоченности элементов с индексами от i до N. Здесь A – рассматриваемый массив, i – индекс массива с которого начинается рассматриваемое поддерево, N – количество элементов во всем дереве.
Процедура
Heapify(A,i,N) осуществляет следующие
действия. Она проверяет условия
Ai ³ A2i в случае 2i£N
Ai ³ A2i+1 в случае 2i+1£N.
Если
они выполняются (случаи 2i³N, 2i+1³N легко
рассмотреть отдельно), то дальше ничего делать не надо, происходит выход из
процедуры. Иначе, выбирается максимальный из элементов Ai , A2i,
A2i+1
и выбранный элемент меняется местами с Ai .
Не ограничивая общности рассуждений, допустим, что максимальным оказался
элемент A2i , тогда после перестановки имеем Ai ³
A2i+1 , при этом элемент A2i+1
не изменился, поэтому свойство
пирамидально-упорядоченности будет выполняться и дальше в данном (правом)
поддереве. Далее рекурсивно вызываем процедуру Heapify(A,2i,N).
Исходя из построения процедуры Heapify, имеем следующее утверждение
Утверждение
1. Процедура Heapify(A,i,N) выполняется за
время O( h(i,N) ), где h(i,N) – глубина
поддерева в пирамиде из N элементов, начинающегося с
элемента с индексом i.
Алгоритм Heapsort(A,N) выглядит следующим образом
Heapsort(A,N)
Для
всех i от N-1 до 1 с
шагом –1 выполнить: Heapify(A,i,N)
Для
всех i от 1
до N-1 с шагом 1 выполнить
Поменять местами элементы A1 и AN-i+1
Heapify(A,1,N-i)
Первый цикл в алгоритме создает пирамиду, а второй, используя ее свойство максимальности первого элемента, создает упорядоченный массив. Согласно Утверждению 1, каждый цикл состоит из N процедур, каждая из которых выполняется за время O(log 2 N), из чего вытекает теорема
Теорема.
Время работы алгоритма Heapsort(A,N)
равно O(N log
2 N).
На самом деле, оказывается, что время работы первого из двух циклов алгоритма равно O(N). Действительно, процедура Heapify(A,i) для каждого i из последнего уровня дерева выполняется за время O(1) (а в этом уровне содержится половина всех элементов!). Для следующего уровня время выполнения процедуры равно уже O(2). И т.д.
Т.о. суммарное время работы алгоритма вычисляется по формуле
T(N) = O(Si=0i£h (h-i+1) 2i)
где высота дерева равна h+1 (т.е. дерево имеет уровни с номерами от 0 до h).
Докажем
соотношение T(N)/2h = Q (1).
Отсюда и из того, что количество элементов в дереве высотой h+1 находится между 2h-1 и 2h, мы сразу
получим, что время работы алгоритма равно O(N).
Рассмотрим
следующие равенства для некоторого x¹1
1 + x + x2 + … + xN = ( 1- xN+1 )/(1-x), тогда, взяв производную по x, получим
1 +2x + 3x2 + … + NxN-1 = (- (N+1)xN(1-x) + ( 1- xN+1 ) )/(1-x)2=Q (1), если x =1/2.
C другой стороны, положим j=h-i+1, тогда
T(N)/2h= O(Si=0 i £ h (h-i+1) 2i-h)= O(Sj=1 j £ h+1 j 2 - j+1)=
O(Sj=1 j £ h+1 j 2 - j) =Q (1).
¢
Из вышесказанного вытекает, что мы имеем возможность получить упорядоченный подмассив, состоящий из довольно большого количества самых больших элементов исходного массива, за время O(N), где N – количество элементов в массиве. Более строго, верна теорема
Теорема.
Получить упорядоченный массив из N / log 2
N
самых больших элементов массива можно за время O(N).