Для студентов МФПУ «Синергия» по предмету Проектирование систем обработки больших данных (Big Data)Проектирование систем обработки больших данных (Big Data)Проектирование систем обработки больших данных (Big Data)
4,995289
2025-10-062025-10-09СтудИзба
Ответы к экзамену: Проектирование систем обработки больших данных (Big Data)
Новинка
Описание
Проектирование систем обработки больших данных (Big Data).ои(dor_БАК_230607)
- Введение
- Тема 1. Большие данные: термины, проблемы
- Тема 2. Обработка структурированной информации
- Тема 3. Обработка слабоструктурированной информации
- Тема 4. Обработка визуальной информации
- Тема 5. Неструктурированная информация на примере корпуса текстов
- Заключение
Список вопросов
… таблица – это специальный тип таблицы, суммирующий информацию из конкретных полей списка или базы данных; допускает после построения настройку на различные разрезы данных
… данные – это данные текстовых файлов с определенными паттернами для их обработки
Совокупность методов и средств извлечения их организованных данных для принятия решений – это … данных
Такой метод обработки изображения, как …, заключается в преобразовании изображения в серых тонах в белые и черные пиксели; значения каждого пикселя условно кодируются как 0 и 1
Комплексный набор методов, подходов и инструментов обработки структурированных и неструктурированных данных колоссальных объемов –это …
Установите хронологическую последовательность исторических прорывов в машинном зрении:
После того как первая версия поискового словаря создана, дальнейшие операции …
Текстовые данные с неустойчивым форматом, которые для обработки инструментами требуют больших временных затрат на преобразование, – это … данные
Компонентом системы машинного зрения является датчик для … частей обнаружения (часто оптический или магнитный датчик), который служит для захвата и обработки изображений
Услуга эвристического поиска, основанного на использовании систем искусственного интеллекта, формирующих расширенный запрос на основе применения специализированных отраслевых тезаурусов и семантических сетей, в Интернете на сегодня …
Установите соответствие дат и описаний исторических прорывов в машинном зрении:
Операция над данными, с помощью которой можно переупорядочить строки в списке в соответствии с содержанием конкретных столбцов, – это …
Установите правильный порядок процедуры анализа текстовой информации, осуществляемой аналитиком:
Подборка тематически связанных данных, расположенных на одном рабочем листе, – это …
… данные обычно существуют в таблицах, подобных файлам Excel и электронным таблицам Google Docs
Установите соответствие английского обозначения признака больших данных и характеристики данного признака:
… данные представляют собой высокоорганизованную, фактическую и точную информацию и обычно представлены в форме букв и цифр, которые хорошо вписываются в строки и столбцы таблиц
Установите правильную последовательность действий, если необходимо создать собственный формат данных (лс) и применить его для поля электронной таблицы «Мощность двигателя» (см. рисунок ниже):

Программный продукт TextAnalyst научно-производственного инновационного центра …, использует для решения задач распознавания слов нейросетевые технологии и, в основном, предназначен для решения задачи автоматического реферирования документов
… данных – это процесс, посредством которого извлекается необходимая для обработки информация, впоследствии предоставляющая решение поставленной перед ним задачи/проблемы
Установите соответствие компонентов распознавания текста и их характеристик:
… данных являются соцсети, приложения, веб-визоры, камеры наблюдения, видеорегистраторы, датчики и другие системы, где генерируются разнородные данные
Согласно принципу трех V английским словом «…» обозначают разнообразие, способность обработки множества типов, источников и форматов данных
Установите соответствие понятий и их определений:
… – это утверждение о том, что представляют собой законы, лежащие в основе изучаемой генеральной совокупности
Структурированные данные часто называют …, что означает, что их объективный и заранее определенный характер позволяет нам легко подсчитывать, измерять и выражать данные в числах
Установите соответствие признаков больших данных и их характеристик:
… – проект фонда Apache Software Foundation, платформа с открытым исходным кодом для обработки больших данных; благодаря распределенной файловой системе и распределенным вычислениям эта разработка позволяет обрабатывать и анализировать очень большие объемы данных.
Такой метод обработки изображений, как …, используется для поиска и (или) подсчета деталей, его цель заключается в упрощении и/или изменении представления изображения, чтобы его было проще и легче анализировать
Английское название хранилищ данных масштаба предприятия, где данные хранятся в неструктурированном / необработанном виде, – Data …
Установите соответствие элементов специфики работы со неструктурированными данными и их содержания:
… – это полный набор объектов, связанных с поставленной перед изучением проблемой
… – это сокращенное английское обозначение одного из основных процессов в управлении хранилищами данных, которое можно перевести как «извлечение, преобразование, загрузка / извлечение, загрузка, преобразование»
Установите правильную последовательность этапов анализа данных:
Макрокоманда, содержащая последовательность действий, записанных пользователем, – это …
Карта с нанесенной на нее информацией в виде цвета или с помощью других способов – это …
… включает данные, которые относятся к нескольким однородным объектам, при этом каждый объект описан в виде набора характеристик; обычно его можно представить в виде таблицы в несколько строк и столбцов
… – английское сокращенное обозначение специализированных комплектов разработчика позволяющих при необходимости создавать собственное программное обеспечение, адаптированное к задачам, решаемым той или иной организацией
На рисунке ниже приведены … списка

Среди разработчиков программного обеспечения, реализующих передовые поисковые лингвистические технологии, следует выделить ЗАО «…» – такие разработки этой фирмы, как «Следопыт», «Классификатор» и «Аннотатор», позволяют осуществлять оперативный поиск документов, их индексирование, классификацию и автоматическое аннотирование
… впервые использовал термин «большие данные» в журнале Nature по аналогии с терминами «большая нефть», «большая руда»
Характеристики ответов (шпаргалок) к экзамену
Тип
Коллекция: Ответы (шпаргалки) к экзамену
Учебное заведение
Семестр
Просмотров
9
Количество вопросов

❓ Как копировать вопросы во время теста в Синергии?
Стараюсь держать низкие цены на коллекции ответов на вопросы!