Для студентов МФПУ «Синергия» по предмету Управление базами данныхВведение в анализ больших данныхВведение в анализ больших данных
5,005281
2024-07-21СтудИзба

Ответы к экзамену: Введение в анализ больших данных

Бестселлер

Описание

Ответы представлены на итоговый и компетентностный тесты.
Перед покупкой сверьте список вопросов и убедитесь, что вам нужны ответы именно на эти вопросы!
С вопросами и вы можете ознакомиться ДО покупки.
Для быстрого поиска вопроса используйте Ctrl+F.

В реляционной модели представленные данные для пользователя передаются в виде …
  • таблиц
  • списков
  • графа типа дерева
  • произвольного графа
  • файлов

В числовом ряду 3, 5, 8, 12, 2, 9, 6, 10, 11, 14 медиана (с точностью до 0,1) равна …

В языке программирования R используются такие типы данных, как … (укажите 5 вариантов ответа)
  • numeric
  • integer
  • quantitative
  • attributive
  • logical
  • complex
  • character

В языке программирования R тип данных «строка» – это …

Вектор частных производных функции потерь по весам нейронной сети, который указывает на направление наибольшего роста этой функции, – это …

Вычислительная единица в искусственных нейронных сетях, которая получает информацию, производит над ней простые вычисления и передает ее дальше, – это …
  • перцептрон
  • градиент
  • нейрон
  • протон

Группа элементов, обладающих каким-то общим свойством и находящихся на небольшом расстоянии другу от друга, – это …

Данные являются структурированными в … (укажите 2 варианта ответа)
  • отчете о продажах, составленном в MS Excel
  • таблице с ежедневными показаниями температуры помещения за год в файле формата CSV
  • файлах Google Sheets
  • фильмах, представленных в формате mpeg на одном жестком диске

Деревья классификации относятся к стратегии …
  • обучения с учителем
  • обучения без учителя
  • обучения с подкреплением
  • ленивого обучения

Если все значения признака увеличить в 16 раз, дисперсия увеличится в … раз

Интеграция – это …
  • сбор данных из нескольких источников в единое место хранения
  • объединение данных из различных источников для получения их согласованного представления
  • привлечение к решению инновационных задач широкого круга лиц по типу субподрядной работы на добровольных началах
  • область исследования, занимающаяся созданием компьютерных алгоритмов для преобразования данных в обоснованные действия

Консолидация – это …
  • сбор данных из нескольких источников в единое место хранения
  • объединение данных из различных источников для получения их согласованного
  • представления привлечение к решению инновационных задач широкого круга лиц по типу субподрядной работы на добровольных началах
  • область исследования, занимающаяся созданием компьютерных алгоритмов для преобразования данных в обоснованные действия

Краудсорсинг – это …
  • сбор данных из нескольких источников в единое место хранения
  • объединение данных из различных источников для получения их согласованного представления
  • привлечение к решению инновационных задач широкого круга лиц по типу субподрядной работы на добровольных началах
  • область исследования, занимающаяся созданием компьютерных алгоритмов для преобразования данных в обоснованные действия

Машинное обучение – это …
  • сбор данных из нескольких источников в единое место хранения
  • объединение данных из различных источников для получения их согласованного представления
  • привлечение к решению инновационных задач широкого круга лиц по типу субподрядной работы на добровольных началах
  • область исследования, занимающаяся созданием компьютерных алгоритмов для преобразования данных в обоснованные действия

Метод Data Mining, который относит объекты к одному из заранее известных классов, – это …

Метод, используемый для предотвращения дублирования данных в реляционных базах данных, – …

Минимальная единица измерения информации – это …

Нажатие клавиши «…» предложит возможные варианты продолжения текста кода, включая выбор параметров и переменных в аргументах набираемых команд

Нажатием сочетания клавиш «…» и «–» можно написать оператор присваивания "

Название на английском языке системы или репозитория данных, хранящихся в необработанном формате, – …

Неверно, что MapReduce …
  • это интерфейс для массово-параллельной обработки данных, где вычисления производятся на узлах
  • это две операции: распределения и сборки данных
  • был придуман разработчиками Hadoop
  • был анонсирован разработчиками Google

Неверно, что Variety в контексте характеристик Big Data означает … (укажите 3 варианта ответа)
  • высокую скорость генерирования данных
  • разные типы данных в колонках таблиц реляционных систем управления базами данных (СУБД)
  • разнообразие отраслей, являющихся источниками данных
  • разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные

Определите правильную последовательность этапов распределенных вычислений MapReduce:
  1. Input
  2. Splitting
  3. Mapping
  4. Shuffling
  5. Reducing

Первые большие наборы данных начали использовать …
  • в 1990-х гг.
  • в 1960–70-х гг.
  • в 1980-х гг.
  • после 2012 г.

Причина создания баз данных NoSQL – …
  • высокая стоимость горизонтальной масштабируемости RDBMS при сохранении требования высокой доступности
  • недостаточная гибкость языка запросов SQL
  • невозможность хранения больших объемов информации в базе данных
  • дороговизна лицензий RDBMS

Простейший вид нейронной сети, который представляет собой алгоритм для выполнения двоичной классификации, – это …

Процесс преобразования данных в код, который можно распознать только с помощью определенного ключа или пароля, – это …

Разветвляющийся алгоритм – это …
  • присутствие в алгоритме хотя бы одного условия
  • набор команд, которые выполняются последовательно друг за другом
  • многократное выполнение одних и тех же действий
  • алгоритм, использующий подпрограммы

Расположите в правильной последовательности этапы дивизимного метода кластерного анализа:
  1. все объекты помещаются в один кластер С1
  2. выбирается объект, у которого среднее значение расстояния до других объектов в этом кластере наибольшее
  3. выбранный объект удаляется из кластера С1 и формирует первый элемент второго кластера С2
  4. объект в кластере С1, для которого разность между средним расстоянием до объектов, находящихся в С2, и средним расстоянием до объектов, остающихся в С1, наибольшая, переносится в С2
  5. каждый последующий уровень применяет процедуру разделения к одному из кластеров, полученных на предыдущем уровне

Расположите в правильной последовательности этапы кластерного анализа методом k-средних:
  1. выбирается k произвольных исходных центров кластеров – обычно выбираются k объектов
  2. все объекты разбиваются на k групп, наиболее близких к одному из центров
  3. вычисляются новые центры кластеров
  4. проводится новое разбиение всех объектов на основании близости к новым центрам

Сокращенное английское название семейства нереляционных баз данных – …

Укажите правильную последовательность шагов алгоритма машинного обучения (ML):
  1. сбор данных
  2. исследование и подготовка данных
  3. обучение модели
  4. оценка модели
  5. улучшение модели

Укажите правильную последовательность этапов анализа данных в языке программирования R:
  1. сбор данных
  2. импорт данных из источника в программную среду r
  3. разведочный анализ
  4. очистка и трансформация данных
  5. моделирование
  6. презентация результатов Вопрос: 41 - й

Установите правильный порядок действий при проектировании баз данных (БД):
  1. анализ предметной области с учетом требования конечных пользователей
  2. обобщенное описание БД с использованием естественного языка, математических формул, графиков и других средств
  3. формализация представления данных в БД
  4. решение проблемы передачи данных

Установите соответствие баз данных и их характеристик:

Установите соответствие видов искусственных нейронных сетей и их характеристик:

Установите соответствие между аргументами функции leaflet() и их содержанием:

Установите соответствие между метриками расстояния между объектами и формулами расчета:

Установите соответствие между понятием и его содержанием:

Установите соответствие функций, применяемых для расчета ошибок выходного сигнала нейронной сети, и формул для их вычисления:

Установите соответствие целей инфраструктуры Hadoop и их характеристик:

Фамилия британского ученого, который разработал эмпирический тест, призванный определить способность компьютера мыслить как человек, – …

Целое четырехзначное число, отражающее количество зеттабайт в йоттабайте, – …

Циклический алгоритм используется при вычислении … (укажите 2 варианта ответа)
  • суммы всех чисел от 1 до 100
  • площади трапеции
  • корня квадратного уравнения
  • суммы двух чисел, введенных с клавиатуры
  • среднего арифметического всех двухзначных чисел

Чтобы получить помощь в программной среде R, можно … (укажите 3 варианта ответа)
  • поставить курсор на название функции и нажать F1
  • перед названием функции напечатать знак вопроса
  • воспользоваться функцией help()
  • поставить курсор на название функции и нажать ALT + F1
  • поставить курсор перед названием функции и нажать F1

Язык программирования R является потомком языка …
  • jаvascript
  • S
  • Python
  • С++

… – это группа файлов стандартной структуры, служащих для хранения данных и организованных таким образом, чтобы обеспечить легкий доступ к ним, эффективное управление и обновление

… – это процесс преобразования данных в выводы, на основе которых будут приниматься решения и строиться действия с помощью людей, процессов и технологий

… является шириной коробки в диаграмме «ящик с усами»
  • Диапазон
  • Интерквартильный размах
  • Стандартное отклонение
  • Нижний квартиль
  • Медиана

Data Mining – это процесс обнаружения в сырых данных … (укажите 3 варианта ответа)
  • ранее сформулированных гипотез
  • неочевидных закономерностей
  • практических закономерностей
  • объективных закономерностей
  • большого количества закономерностей

SQL – это …
  • реляционная база данных
  • язык неструктурированных запросов
  • язык структурированных запросов
  • средство для создания пайплайнов

Velocity в контексте характеристик Big Data означает …
  • высокую скорость генерирования данных
  • разные типы данных в колонках таблиц реляционных систем управления базами данных (СУБД)
  • разнообразие отраслей, являющихся источниками данных
  • разнообразие типов данных, включающих структурированные, полуструктурированные и неструктурированные

Web Mining применяет технологию Data Mining для анализа … (укажите 4 варианта ответа)
  • неструктурированной информации
  • структурированной информации
  • неоднородной информации
  • однородной информации
  • распределенной и значительной по объему информации
  • информации, содержащейся на веб-узлах


В вашей компании необходимо организовать сбор, хранение и обработку больших данных. На что в первую очередь должно обратить внимание руководство при организации хранения и обработки данных?
  • Обеспечить управление доступом, которое должно защищать данные.
  • Оценить уровень риска и отменить контрмеры.
  • Обеспечить необходимый уровень доступности, целостности и конфиденциальности данных.
  • Обеспечить удобство использования данных при анализе.

Вам необходимо импортировать в программную среду RStudio текстовый файл с разделителем. Какую функцию вы будете использовать?
  • read.text()
  • read.table()
  • read_text()
  • read_table():

Вам необходимо организовать потоковую обработку событий в режиме реального времени. Какую технологию необходимо использовать?
  • Spark Streaming
  • Apache Kafka
  • Apache Hadoop
  • MapReduce

Вам необходимо предсказать значения непрерывной числовой величины для входных данных. Какой метод вам в этом поможет?
  • Переобучение.
  • Регрессия.
  • Кластеризация.
  • Классификация

Вам нужно рассчитать необходимые параметры для создания обшивки самолета. Какая из областей машинного обучения вам в этом поможет?
  • Компьютерное зрение.
  • Латентная модель.
  • Обучение ранжированию.
  • Предсказательное моделирование

Ваша компания использует различные технологии для сбора и хранения данных. Приведите пример данных, когда эффективнее использовать технологию Hadoop.
  • Поминутное сохранение данных транзакций торговых точек.
  • Построение графика ежегодной выручки.
  • Анализ 10 Гб данных.
  • Сравнение цен с конкурентами.

Вашей компании необходимо закупить новый вид сырья. Вам необходимо узнать, насколько может упасть стоимость этого сырья в ближайшем будущем и когда это может произойти. Какой метод Data Mining вы будете использовать?
  • Прогнозирование.
  • Кластеризация.
  • Классификация
  • Поиск ассоциативных правил.

Вашей компании необходимо определить структуру клиентов по их вкладу в доходы компании. Какой метод Data Mining вы будете использовать?
  • Прогнозирование.
  • Кластеризация.
  • Классификация.
  • Поиск ассоциативных правил

Выполнены следующие строки кода в программной среде RStudio: vec
  • 2
  • 5
  • 10
  • 2,5

Разным группам пользователей с различным уровнем доступа требуется доступ к одной и той же информации. Что следует предпринять руководству?
  • Снизить уровень классификации этой информации.
  • Улучшить контроль за безопасностью этой информации.
  • Требовать подписания специального разрешения каждый раз, когда человеку требуется доступ к этой информации.
  • Открыть временный доступ к информации по запросу пользователей.

Характеристики ответов (шпаргалок) к экзамену

Учебное заведение
Просмотров
228
Размер
361,79 Kb

Список файлов

Ответы.pdf
Как копировать вопросы во время теста в Синергии?

Комментарии

Отзыв
все ок
Поделитесь ссылкой:
Цена: 350 руб.
Расширенная гарантия +3 недели гарантии, +10% цены
Несколько человек купили за последний месяц
Рейтинг покупателей
5 из 5
Поделитесь ссылкой:
Сопутствующие материалы
Вы можете использовать полученные ответы для подготовки к экзамену в учебном заведении и других целях, не нарушающих законодательство РФ и устав Вашего учебного заведения.
Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6294
Авторов
на СтудИзбе
314
Средний доход
с одного платного файла
Обучение Подробнее