Алгоритм на псевдокоде

Добавление в ДБ-дерево(D: Данные, p: pVertex)

Обозначим

VR, HR — логические переменные, определяющие вертикальный или горизонтальный рост дерева (в начале VR, HR равны ИСТИНА)

IF (p=NIL)

new(p); p→Date =D, p®Left= NIL; p→Right = NIL;

p→Balance=0; VR= ИСТИНА;

ELSE

IF (p→Date> D) Добавление в ДБ-дерево(D, p→Left)

IF (VR = ИСТИНА)

IF (p→Balance = 0) q:= p→Left; p→Left:= q→Right;

q→Right := p; p:=q; q→Balance :=1

VR := ЛОЖЬ; HR =ИСТИНА;

ELSE p→Balance:= 0; HR:=ИСТИНА;

ELSE HR := ЛОЖЬ;

ELSE IF (p→Date< D)

Добавление в ДБ-дерево (D, p→Right),

IF (VR = ИСТИНА) p→Balance:= 1; VR: = ЛОЖЬ;

HR := ИСТИНА;

ELSE IF (HR = ИСТИНА)

IF(p→Balancе > 0) q := p→Right;

p→Right := q→Left;

p→Balance := 0; q→Balance := 0;

p→Left := p; p :=q

VR:= ИСТИНА; HR:= ЛОЖЬ;

ELSE HR:= ЛОЖЬ;

Примерпостроения двоичного Б-дерева приведен на следующем рисунке.

Рисунок 56 Построение двоичного Б-дерева

При построении двоичного Б-дерева реже приходится переставлять вершины, поэтому АВЛ-деревья предпочтительней в тех случаях, когда поиск ключей происходит значительно чаще, чем добавление новых элементов. Кроме того, существует зависимость от особенностей реализации, поэтому вопрос о применение того или иного тапа деревьев следует решать индивидуально для каждого конкретного случая.

13.6 Варианты заданий

1. Написать процедуру поиска элемента с заданным ключом в Б-дереве порядка m.

2. Определить трудоемкость поиска в Б-дереве порядка m.

3. Написать процедуру определения высоты Б-дерева порядка m.

4. Запрограммировать процедуру добавления нового элемента в Б-дерева порядка m.

5. Графически изобразить Б-дерево порядка 2.

6. Запрограммировать процедуру добавления новой вершины в двоичное Б-дерево. Определить количество необходимых операций для добавления вершины.

7. Написать процедуру определения высоты двоичного Б-дерева.

8. Экспериментально сравнить двоичное Б-дерево и ИСДП по высоте как двоичные деревья.

9. Экспериментально сравнить высоты двоичного Б-дерева и случайного дерева поиска как двоичные деревья.

10. Экспериментально сравнить двоичное Б-дерево и АВЛ-дерево по высоте как двоичные деревья.

11. Графически изобразить двоичное Б-дерево.

14. Деревья оптимального поиска (ДОП)

14.1 Определение дерева оптимального поиска

До сих пор предполагалось, что частота обращения ко всем вершинам дерева поиска одинакова. Однако встречаются ситуации, когда известна информация о вероятностях обращения к отдельным ключам. Обычно для таких ситуаций характерно постоянство ключей, т.е. в дерево не включаются новые вершины и не исключаются старые и структура дерева остается неизменной. Эту ситуацию иллюстрирует сканер транслятора, который определяет, является ли каждое слово программы (идентификатор) служебным. Статистические измерения на сотнях транслируемых программ могут в этом случае дать точную информацию об относительных частотах появления в тексте отдельных ключей.

Припишем каждой вершине дерева V_i вес w_i, пропорциональный частоте поиска этой вершины (например, если из каждых 100 операций поиска 15 операций приходятся на вершину V₁, то w₁=15). Сумма весов всех вершин дает вес дерева W. Каждая вершина V_i расположена на высоте h_i, корень расположен на высоте 1. Высота вершины равна количеству операций сравнения, необходимых для поиска этой вершины. Определим средневзвешенную высоту дерева с n вершинами следующим образом: h_ср=(w₁h₁+w₂h₂+…+w_nh_n)/W. Дерево поиска, имеющее минимальную средневзвешенную высоту, называется деревом оптимального поиска (ДОП).

Пример. Рассмотрим множество из трех ключей V₁=1, V₂=2, V₃=3 со следующими весами: w₁=60, w₂=30, w₃=10, W=100. Эти три ключа можно расставить в дереве поиска пятью различными способами.

Рисунок 57 Различные деревья поиска с вершинами V₁=1, V₂=2, V₃=3

Легко видеть, что минимальной средневзвешенной высотой обладает дерево 1 на рисунке 57, которое представляет собой список или вырожденное дерево. Дерево 3 не является деревом оптимального поиска, хотя представляет собой идеально сбалансированное дерево. Очевидно, для минимизации средней длины пути поиска нужно стремится располагать наиболее часто используемые вершины ближе к корню дерева.

Задача построения ДОП может ставится в двух вариантах:

· Известны вершины и их веса.

· Вес вершины определяется в процессе работы. Например, после каждого поиска вершины ее вес увеличивается на 1. В этом случае необходимо перестраивать структуру дерева при изменении весов.

Далее будем рассматривать задачупостроения ДОП с фиксированным набором ключей и их весов.

14.2 Точный алгоритм построения ДОП

Поскольку число возможных конфигураций из n вершин растет экспоненциально с ростом n, то решение задачи построения ДОП при больших n методом перебора нерационально. Однако деревья оптимального поиска обладают свойствами, которые позволяют получить алгоритм построения ДОП, начиная с отдельных вершин с последовательным включением новых вершин в дерево. Далее будем считать, что множество вершин, входящих в дерево, упорядочено. Поскольку вес дерева остается неизменным, то вместо средневзвешенной высоты будем рассматривать взвешенную высоту дерева: P=h₁w₁+h₂w₂+…+h_nw_n

Свойство 1. Для дерева поиска с весом W справедливо соотношение P=P_L+W+P_R, где P_L, P_R – взвешенные высоты левого и правого поддеревьев корня.

Доказательство. Пусть вершина V_i с весом w_i является корневой для некоторого i=1, …n. Поскольку левое и правое поддеревья являются деревьями поиска, то в левое поддерево входят вершины V₁, V₂, …, V_i_-1, а в правое – V_i₊₁, …, V_n. Взвешенные высоты этих поддеревьев вычисляются следующим образом.

P_L = (h₁-1)w₁+(h₂-1)w₂+…+(h_i_-1-1)w_i_-1

P_R = (h_i₊₁-1)w_i₊₁+ …+ (h_n-1)w_n

Рассмотрим выражение взвешенной высоты для всего дерева, замечая, что h_i=1

P=h₁w₁+h₂w₂+…+h_nw_n= (h₁-1)w₁+ w₁+(h₂-1)w₂+ w₂…+(h_i_-1-1)w_i_-1 + w_i_-1+

+ w_i+ (h_i+1-1)w_i+1+ w_i+1 …+ (h_n-1)w_n+ w_n= P_L+W+P_R

Свойство 2. Все поддеревья дерева оптимального поиска также являются деревьями оптимального поиска для соответствующих подмножеств вершин.

Доказательство. Предположим, что одно из поддеревьев, например, правое, не является ДОП, т.е. существует дерево поиска с тем же множеством вершин, но с меньшей взвешенной высотой. Тогда по свойству 1 взвешенная высота всего дерева также не является минимальной. Данное противоречие доказывает свойство 2.

На основе приведенных свойств можно разработать точный алгоритм построения ДОП. Обозначим T_ij – оптимальное поддерево, состоящее из вершин V_i₊₁, …, V_j. Введем матрицу АR=||Ar_ij||, 0≤i,j≤n элементы которой содержат номер корневой вершины поддерева T_ij, 0≤i<j≤n. Взвешенную высоту поддерева T_ij обозначим Ap_ij, а вес поддерева T_ij обозначим Aw_ij, 0≤i<j≤n. Очевидно, что P=Ap_o_,_n, W=Aw_o_,_n, Т_ii – пустые деревья (без вершин), Aw_ii=0, Ap_ii=0, i=1, …n.

Используя свойство 2, величины Aw_ij, Ap_ij можно вычислить рекуррентно по следующим соотношениям (для всех возможных поддеревьев):

Aw_ij=Aw_i,j-1+Aw_j, 0≤ i < j ≤ n (1)

Ap_ij=Aw_ij+min (Ap_i,k-1+Ap_k,j), 0≤ i < j ≤ n (2)

i<k≤j

Во время вычислений будем запоминать индекс k^*, при котором достигается минимум во втором соотношении. Значение k^* является индексом корневой вершины поддерева T_ij во всем множестве вершин. Занесем в матрицу АR k^* –индекс корня T_ij, т.е. Ar_ij = k^*, 0≤i<j≤n.

Идея построения дерева состоит в следующем. В матрице АR берем значение Ar_o_,_n (номер корневой вершины всего дерева в упорядоченном массиве вершин), пусть оно равно k. Добавляем вершину V_k в дерево, используя обычный алгоритм добавления вершин в дерево поиска. Затем из матрицы АR берем значения Ar_o_,_k_-1 и добавляем вершину с этим номером в левое поддерево. Далее берем Ar_k_,_n и добавляем вершину с этим номером в правое поддерево и т.д.

Пример. Построить дерево оптимального поиска с вершинами V₁=1, V₂=2, V₃=3 и весами w₁=60, w₂=30, w₃=10. Сначала вычислим Aw_ij, Ap_ij_, Ar_ij, 0≤i<j≤n. Легко видеть, что

T₀₀, T₁₁, T₂₂, T₃₃ – пустые поддеревья

T₀₁, T₁₂, T₂₃ – поддеревья из одной вершины (1), (2), (3)

T₀₂, T₁₃ – поддеревья из двух вершин (1,2) и (2,3)

T₀₃ – поддерево из трех вершин (1,2,3)

По формулам (1) и (2) вычислим элементы матрицы весов AW и элементы матрицы взвешенных высот AP, значения матрицы АR запишем в верхних уголках ячеек матрицы АP.

Аw_ij

Аp_ij
	60¹	120¹	150¹
		30²	50²
			10³

Аp₀₁=Аw₀₁+min(Аp₀₀+Аp₁₁) =60 (k*=1)

^0<^k^≤1

Аp₁₂=Аw₁₂+min(Аp₁₁+Аp₂₂) =30 (k*=2)

^1<^k^≤2

Аp₂₃=Аw₂₃+min(Аp₂₂+Аp₃₃) =10 (k*=3)

^2<^k^≤3

Аp₀₂=Аw₀₂+min(Аp₀₀+Аp₁₂, Аp₀₁+Аp₂₂)=90+30=120 (k*=1).

^0<^k^≤2^k⁼¹^k⁼²

Аp₁₃=Аw₁₃+min(Аp₁₁+Аp₂₃, Аp₁₂+Аp₃₃)=40+10=50 (k*=2).

^1<^k^≤3^k⁼²^k⁼³

Аp₀₃=Аw₀₃+min(Аp₀₀+Аp₁₃, Аp₀₁+Аp₂₃, Аp₀₂+Аp₃₃)=100+50=150 (k*=3).

^0<^k^≤3^k⁼¹^k⁼²^k⁼³

Корневой вершиной будет вершина V₁, поскольку Аr_0,3=1. Левое поддерево пустое, корень правого поддерева – вершина V₂(r_1,3=2) и т.д. Полученное дерево показано на рисунке.

Рисунок 58 ДОП для w₁=60, w₂=30, w₃=10

Поскольку существует около n²/2 значений Аp_ij , а вычисление (2) требует выбора одного из 0<i-j£ n значений, то весь процесс будет занимать О(n³) операций при n→∞. Д. Кнут отмечает, что можно избавиться от одного множителя n и тем самым сохранить практическую ценность алгоритма. Поиск Аr_ij можно ограничить, то есть сократить число вычислений до j-i (если найден корень оптимального поддерева T_ij, то ни добавление справа новой вершины, ни отбрасывание левой вершины не могут сдвинуть вправо этот оптимальный корень). Это свойство выражается соотношением Аr_i_,_j_-1≤ Аr_ij ≤ Аr_i_+1,_j , что и ограничивает поиск Аr_ij диапазоном Аr_i_,_j_-1…Аr_i_+1,_j. Это уменьшает трудоемкость алгоритма до О(n²) операций при n→∞.

<21 22 232425 26 27 >

Дата добавления: 2022-02-05; просмотров: 382;

Алгоритм на псевдокоде

Публикации по технике и механике

Публикации по биологии

Публикации по информатике

Публикации по строительству

Публикации по физике

Публикации по химии

Публикации по электронике

Публикации по искусству

Публикации по географии

Публикации по медицине

Публикации по педагогике