Для студентов РАНХиГС по предмету ДругиеРазработать алгоритм поиска дубликатов файлов, и реализация данного алгоритма в программе на языке программирования C#Разработать алгоритм поиска дубликатов файлов, и реализация данного алгоритма в программе на языке программирования C#
2024-11-042024-11-04СтудИзба
Курсовая работа: Разработать алгоритм поиска дубликатов файлов, и реализация данного алгоритма в программе на языке программирования C#
Описание
ВВЕДЕНИЕ
Целью данной курсовой работы является разработать алгоритм поиска дубликатов файлов, и реализация данного алгоритма в программе на языке программирования C#.
Для достижения данной цели были поставлены следующие задачи:
- Определить особенности файловой системы Windows, влияющие на выполнение цели.
- На основе выявленных особенностей определить характеристики, которыми должен обладать алгоритм поиска дубликатов.
- Зная характеристики, которыми должен обладать алгоритм, выбрать алгоритм поиска дубликатов максимально эффективно решающий поставленную задачу.
- Реализовать выбранный алгоритм поиска дубликатов на языке программирования C#.
- Протестировать созданную программу на предмет наличия в ней ошибок.
В первой главе решаются первые 3 поставленные задачи. Рационализируется выбор конкретного алгоритма, и объясняются причины его эффективности.
Вторая глава объясняет принцип работы программы реализующей составленный алгоритм и проводит пошаговый анализ алгоритма, объясняя для чего необходим каждый шаг. После подробного разбора реализованного алгоритма проводится тестирования программы на корректных и некорректных данных, с целью выявления ошибок допущенных в ходе составления или реализации алгоритма.
ГЛАВА 1. АЛГОРИТМ ПОИСКА ДУБЛИКАТОВ
Метод индексирования файлов
Для поиска дубликатов файлов необходимо вначале провести индексацию всех файлов, среди которых будут искаться дубликаты. Любая функция индексирования выглядит следующим образом: на вход поступает путь к папке, в которой необходимо проиндексировать файлы, а результатом функции является множество всех метаданных файлов найденных в исходной папке и во всех подпапках рекурсивно. Данное множество метаданных о файлах называется индексом.
Индекс может отличаться двумя характеристиками:
- Алгоритм поиска новых файлов для добавления в индекс.
- Набором метаданных о файлах, которые необходимо сохранить в индексе.
Поскольку структура директорий в операционной системе Windows иерархическая, то каждую папку можно представить как дерево. Пусть текущая папка является корнем дерева, а все подпапки текущей папки являются детьми корневой вершины дерева.
Характеристики курсовой работы
Предмет
Учебное заведение
Семестр
Просмотров
1
Размер
94,98 Kb
Список файлов
разработать алгоритм поиска дубликатов файлов, и реализация данного алгоритма в программе на языке программирования C#.docx