Лекция 14. Хеш-таблицы (окончание) (1107989)

Файл №1107989 Лекция 14. Хеш-таблицы (окончание) (Электронные лекции)Лекция 14. Хеш-таблицы (окончание) (1107989)2019-04-242019-04-24СтудИзба

Электронные лекции

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла

Лекции по курсу “Алгоритмы и алгоритмические языки”, 1 курс, 1 поток, 2010/2011 уч.годЛекция 14 Хеш-таблицы14.1. Программы (двусвязный список).#include <stdbool.h>#define MAX 2000/* размер хеш-таблицы */struct htype {int key;/* ключ */int val;/* значение элемента данных */struct htype *next; /* указатель на следующий элемент цепочки */struct htype *prvs; /* указатель на предыдущий элемент цепочки */} *p, *index[MAX];/* инициализация хеш-таблицы */void init(void) {int i;for(i = 0; i < MAX; i++) {index[i] = NULL; /* хеш-таблица (массив начал цепочек) */}}/* Вычисление хеш-адреса и поиск по ключу k: если элемент с ключом k *//* найден, возвращаем значение true и указатель на найденный элемент *//* если элемент не найден, возвращаем значение false и указатель на *//* предшествующий элемент (если таковой имеется), либо NULL, если *//* цепочка становится пустой */bool search(int k, struct htype **p) {int h;struct htype *q, *qp;/* вычисление хеш-адреса */h = k % 701; /* хеш-адрес *//* поиск цепочки ключа k */if(index[h] != NULL) {q = index[h];/* поиск ключа k в цепочке */do {/* ключ k найден: возвращаем true и указатель */if(q -> key == k) {*p = q; return true;}else {qp = q; q = q -> next;}} while (q != NULL);/* ключ k в цепочке не найден: возвращаем false и указатель на *//* последний элемент цепочки (через параметр **p) */*p = qp;}/* цепочки для ключа k в массиве index нет: возвращаем false и *//* указатель NULL */else *p = NULL;return false;с) Кафедра системного программирования ф-та ВМК МГУ, 20101Лекции по курсу “Алгоритмы и алгоритмические языки”, 1 курс, 1 поток, 2010/2011 уч.год}/* Порождение нового элемента цепочки и возврат указателя на него */struct htype *new() {struct htype *p;p = malloc(sizeof(struct htype)); //выделение памятиp -> key = -1;p -> val = 0;p -> next = NULL;p -> prvs = NULL;return p;}/* Добавление новой пары (key, value) */insert(int k, int v) {struct htype *p, *q;int h;/* Если элемент с ключом k уже имеется в цепочке, изменяем его *//* значение на v */if(search(k, &p)) p->val = v;else {/* Если элемента с ключом k в цепочке нет *//* порождение и инициализация нового элемента цепочки */q = new();q->key = k;q->val = v;/* Включение порожденного элемента в цепочку */if(p != NULL) {p->next = q;q->prvs = p;}else {h = k % 701;index[h] = q;}}}/* Исключение пары (key, value) */delete(int k, int v) {struct htype *p;if(search(k, &p)) {if(p->prvs != NULL) p->prvs->next = p->next;else {h = k % 701;index[h] = p->next;}if(p->next != NULL) p->next->prvs = ->prvs;free(p);}с) Кафедра системного программирования ф-та ВМК МГУ, 20102Лекции по курсу “Алгоритмы и алгоритмические языки”, 1 курс, 1 поток, 2010/2011 уч.год}14.2.

Хеширование с открытой адресацией.14.2.1. Все записи хранятся в самой хеш-таблице: каждая ячейка таблицы (массива длины m,ячейки имеют номера 0, 1, …, m – 1) содержит либо хранимый элемент, либо nil.Указатели вообще не используются, что приводит к сохранению места и ускорениюпоиска. Таким образом, коэффициент заполнения α = n/m не больше 1.14.2.2. Поиск (search): мы определенным образом просматриваем элементы таблицы покане найдем искомый или не убедимся, что искомый элемент отсутствует.Просматриваются не все элементы (иначе это был бы последовательный поиск), атолько некоторые согласно значению хеш-функции, которая в этом случае имеет двааргумента – ключ и «номер попытки»:hash: U × {0, 1, …, m – 1} → {0, 1, …, m – 1}.Функцию hash нужно выбрать такой, чтобы в последовательности проб〈hash(k, 0), hash(k, 1), …, hash(k, m – 1)〉каждый номер ячейки 0, 1, …, m – 1 встретился только один раз. Если при поиске мыдобираемся до ячейки, содержащей nil, можно быть уверенным, что элемент сданным ключом отсутствует (иначе он попал бы в эту ячейку).

Функция search:int search(struct trec *Table, int key) {int i, j;i = 0do {j = hash(key, i);if(Table[j] == key) return j;i++;}while(Table[j] == nil || i == m);return nil;}14.2.3. Добавление (insert): ищем первое свободное место (nil).int insert(struct trec *Table, int key) {int i, j;i = 0do {j = hash(key, i);if(Table[j] == nil) {Table[j] == key;return j;}else i++;}while(i == m);14.2.4. Удаление (delete). При удалении найти удаляемый ключ нетрудно (search), нозаменить его на nil нельзя, так как search перестанет работать (дойдет до этого nilи остановится).

Поэтому вводят nil′ (для insert он nil, для search – нет. Вообщеэто не здорово, так как время поиска из-за этих nil′ увеличивается.14.3. Хеш-функции для открытой адресации.14.3.1. Линейная последовательность проб. Пустьс) Кафедра системного программирования ф-та ВМК МГУ, 20103Лекции по курсу “Алгоритмы и алгоритмические языки”, 1 курс, 1 поток, 2010/2011 уч.годhash′: U → {0, 1, …, m – 1}обычная хеш-функция. Функцияhash(k, i) = (hash′(k) + i) mod mопределяет линейную последовательность проб.При линейной последовательности проб начинают с ячейки Table[h′(k)], а потомперебирают ячейки таблицы подряд: Table[h′(k) + 1], Table[h′(k) + 2], … (послеTable[m – 1] переходят к Table[0]).

Ясно, что последовательность проб полностьюопределяется первой ячейкой (Table[h′(k)]). Поэтому реально существует всего лишьm различных последовательностей проб.Серьезный недостаток – тенденция к образованию кластеров (длинныхпоследовательностей занятых ячеек, идущих подряд), что удлиняет поиск: если втаблице из ячеек все ячейки с четными номерами заняты, а ячейки с нечетныминомерами – свободны, то среднее число проб при поиске элемента отсутствующего втаблице равно 1,5. Если же те же m/2 занятых ячеек идут подряд, то согласно оценкедля последовательного поиска, среднее число проб равно (m/2)/2 = m/4 (гораздобольше). Тенденция к образованию кластеров объясняется тем, что если kзаполненных ячеек идут подряд, то вероятность того, что при очередной вставке втаблицу будет использована ячейка, непосредственно следующая за ними, есть (k+1)/m (она пропорциональна «толщине слоя»), а вероятность использования ячейки,предшественница которой тоже свободна, всего лишь 1/m.

Таким образом,хеширование с использованием линейной последовательности проб далеко неравномерное.14.3.2. Квадратичная последовательность проб:hash(k, i) = (hash′(k) + c1⋅i + c2⋅i2) mod mc1 и c2 ≠ 0 – константы. Пробы начинаются с ячейки Table[h′(k)], а потом ячейкипросматриваются не подряд, а по более сложному закону. Метод работаетзначительно лучше, чем линейный. Чтобы при просмотре таблицы Tableиспользовались все ее ячейки, значения m, c1 и c2 следует брать не произвольными, аподбирать специально. Следующий алгоритм обеспечивает хеширование сквадратичной последовательностью проб:1) находим i ← hash′(k); полагаем j ← 0;2) проверяем Table[i]; если она свободна, заносим в нее запись и выходим изалгоритма, если нет – переходим к шагу 3).3) полагаем j ← (j + 1) mod m, i ← (i + j) mod m и возвращаемся к 2).14.3.3.

Двойное хеширование – один из лучших методов открытой адресации.hash(k, i) = (h1(k) + i h2(k)) mod mгде h1(k) и h2(k) – обычные хеш-функции.14.4. Оценки.Среднее число проб для равномерного хеширования оценивается при успешном поиске как11ln.

При коэффициенте заполнения 50% среднее число проб для успешного поиска ≤α 1− α1,387, а при 90% – ≤ 2,559. При поиске отсутствующего элемента и при добавлении нового1элемента оценка среднего числа проб.1− αс) Кафедра системного программирования ф-та ВМК МГУ, 20104.

Характеристики

Тип файла

PDF-файл

Размер

134,7 Kb

Материал

Электронные лекции

Тип материала

Лекции

Предмет

Алгоритмы и алгоритмические языки

Высшее учебное заведение

МГУ им. Ломоносова

Тип файла PDF

PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.

Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.

Список файлов лекций

jelektronnye-lekcii.rar

Электронные лекции

Лекции 3—5. Формализация понятия алгоритма.pdf

Лекция 6. Базовые понятия языка Си.pdf

Лекция 7. Арифметические и логические выражения. Массивы.pdf

Лекция 8. Массивы и указатели.pdf

Лекция 9. Функции, структуры, перечисления.pdf

Лекция 10. Динамические структуры данных.pdf

Лекция 11. Сортировка.pdf

Лекция 12. Быстрая сортировка. Рекурсия.pdf

Лекция 13. Хеш-таблицы.pdf

Лекция 14. Хеш-таблицы (окончание).pdf

Лекция 15. Двоичные деревья поиска.pdf

Лекция 16. Двоичные деревья (окончание).pdf

Лекция 17. AVL-деревья.pdf

Лекция 18. AVL-деревья (окончание).pdf

Лекция 19. Цифровой поиск.pdf

Лекция 20. Поиск подстрок по образцу.pdf

Лекция 21. Обход двоичного дерева.pdf

Лекция 22. Топологическая сортировка.pdf

Лекция 23. Алгоритмы перебора множеств.pdf

Прочти меня!!!.txt

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.