Для студентов МГТУ им. Н.Э.Баумана по предмету Оптимизация баз данных систем машинного обученияИндексация векторных БДИндексация векторных БД
5,00530
2026-01-202026-01-20СтудИзба
ДЗ 3: Индексация векторных БД вариант 15
Новинка
Описание
Для вашего варианта нужно будет лишь поменять пару условий в коде, задания типовые
📋 Что сделано в работе:
1. Установка и настройка окружения
- Установка Ubuntu Server 22.04
- Настройка PostgreSQL 16
- Установка расширения pgvector для работы с векторными данными
- Настройка Python-окружения с необходимыми библиотеками
2. Освоение pgvector на практике
- Работа с векторными операциями: хранение, запросы, вычисление расстояний
- Создание и тестирование индексов HNSW и IVFFlat
- Сравнение различных метрик расстояния (L2, косинусная, скалярное произведение)
3. Создание базы данных ноутбуков
- Разработана структура БД с 15 характеристиками ноутбуков
- Реализована генерация 6000 уникальных конфигураций ноутбуков
- Автоматическое создание векторных представлений (эмбеддингов) с помощью модели all-MiniLM-L6-v2
4. Поиск похожих ноутбуков
- Реализован поиск 3 самых похожих ноутбуков по заданным характеристикам
- Проведено сравнение производительности поиска с индексом и без
- Результат: ускорение поиска в 62 раза при использовании HNSW-индекса
Файлы условия, демо
archive
Методические указания к ДЗ3 2025.docx
Описание ДЗ3 2025.docx
Установка виртуальнои_ машины 2025.docx
Характеристики домашнего задания
Учебное заведение
Номер задания
Вариант
Просмотров
0
Размер
2,15 Mb
Преподаватели
Список файлов
f.py
find_similar.py
main.py
Дз3.docx
Книга1.xlsx
Комментарии
Нет комментариев
Стань первым, кто что-нибудь напишет!
📋 Что сделано в работе:
МГТУ им. Н.Э.Баумана
Kaveri















