Введение в анализ больших данных
Ответы к экзамену: Введение в анализ больших данных
Новинка
Описание
| # | Вопрос |
| 2 | Отказоустойчивость Big Data имеет место, когда … |
| 4 | Название технологии, которая имитирует человеческое поведение, – искусственный … |
| 5 | Компьютер, выделенный из группы персональных компьютеров (или рабочих станций) для выполнения какой-либо сервисной задачи без непосредственного участия человека, – это … |
| 7 | Целое четырехзначное число, отражающее количество петабайт в зеттабайте, – … |
| 8 | Установите соответствие целей инфраструктуры Hadoop и их характеристик: |
| 9 | Установите правильную последовательность этапов процесса MapReduсe подсчета цветов в текстовых файлах: |
| 10 | Аналитическим отделом компании был получен спам по e-mail с приложенным файлом: Что следует предпринять? |
| | |
| 1 | Реляционные базы данных организованы в виде … |
| 2 | SQL – это … |
| 3 | В числе систем управления базами данных (СУБД), которые полностью полагаются на оперативную память при хранении информации, – … (укажите 2 варианта ответа) |
| 4 | Английское название фреймворка для вычисления наборов распределенных задач с использованием большого количества компьютеров, образующих кластер, – … |
| 5 | Сокращенное английское название языка структурированных запросов – … |
| 6 | Метод исследования, характеризующийся выделением и изучением отдельных частей объектов исследования, – … (слово происходит от греч. «разложение») |
| 7 | Сокращенное английское название семейства нереляционных баз данных – … |
| 8 | Установите соответствие баз данных и их характеристик: |
| 9 | Установите правильный порядок действий при проектировании баз данных: |
| 10 | Рассматривается несколько технологий систем управления базами данных (СУБД). Это технологии Hadoop, Cassandra, HDInsight и Redis. Какая из данных технологий не использует принцип MapReduce? |
| | |
| 1 | Неверно, что существует такой вид искусственных нейронных сетей, как … |
| 2 | Такой вид машинного обучения, как …, основывается на взаимодействии обучаемой системы со средой |
| 3 | Градиентом в искусственных нейронных сетях называют … |
| 5 | Процесс привлечения к решению задач в инновационной сфере широкого круга лиц по типу субподрядной работы на добровольных началах с применением информационно-коммуникационных технологий – это … |
| 6 | Область исследования, включающая создание компьютерных алгоритмов для преобразования данных в обоснованные действия, – это … обучение |
| 7 | Вычислительная единица в искусственных нейронных сетях, которая получает информацию, производит над ней простые вычисления и передает ее дальше, – это … |
| 8 | Установите соответствие функций, применяемых для расчета ошибок выходного сигнала нейронной сети, и формул для их вычисления: |
| 9 | Укажите правильную последовательность шагов алгоритма машинного обучения (ML): |
| 10 | Вам необходимо принять решение о выдаче кредита клиенту. Какой метод машинного обучения вам в этом поможет? |
| # | Вопрос |
| 1 | Если расстоянием между кластерами называется минимальное из расстояний между парами объектов, один из которых входит в первый кластер, а другой – во второй, то это расстояние … |
| 2 | Процедура снижения признакового пространства … |
| 3 | Возможность снижения размерности признакового пространства обусловлена … (укажите 3 варианта ответа) |
| 4 | Элементы матрицы факторных нагрузок меняются в пределах … |
| 5 | Если в результате расчетов получены значения двух первых главных компонент λ1=1,928 и λ2=0,072, тогда относительный вклад первой главной компоненты в суммарную дисперсию (с точностью до 0,1) равен … % |
| 6 | Если был проведен компонентный анализ по шести переменным и суммы квадратов факторных нагрузок для трех главных компонент равны 3,5, 1,3 и 0,3 соответственно, тогда относительный вклад первых двух компонент в общую дисперсию составляет … % |
| 7 | Если выборочные данные о потреблении и накоплении пяти домохозяйств представлены матрицей «объект – свойство» (см. ниже), то, считая, что различия в потреблении в 4 раза важнее различий в накоплении, а сумма весовых коэффициентов равна 1, взвешенное евклидово расстояние между домохозяйствами № 1 и № 2 с точностью до 0,01 будет равно … |
| 8 | Расстояние Манхэттен между векторами (-6, 3, -2) и (-1, 3, -3) равно … |
| 9 | Установите соответствие между метриками расстояния между объектами и формулами расчета: |
| 10 | Вашей компании необходимо проанализировать продуктовые наборы для их своевременной закупки и совместного размещения в торговом зале. Какой метод Data Mining вы будете использовать? |
| | |
| 1 | Функция … реализует алгоритм классификации в языке программирования R |
| 2 | Функция … реализует алгоритм кластеризации в языке программирования R |
| 3 | Библиотека … является базовой для Data Science на языке программирования Python |
| 5 | Язык программирования, который объединяет объектно-ориентированный и функциональный подходы и используется в Apache Spark, – это язык … |
| 6 | Способность языка программирования распознавать типы переменных – это … |
| 7 | Язык программирования … имеет лицензию от компании MathWorks и широко используется для вычислений как в научных, так и в промышленных целях |
| 8 | Язык программирования R является потомком языка … |
| 9 | Установите соответствие между аргументами функции leaflet() и их содержанием: |
| 10 | Укажите правильную последовательность этапов анализа данных в языке программирования R: |
| | |
| 1 | Velocity в контексте характеристик Big Data означает … |
| 2 | Неверно, что Variety в контексте характеристик Big Data означает … (укажите 3 варианта ответа) |
| 3 | Минимальная единица измерения информации – это … |
| 4 | … – это процесс преобразования данных в выводы, на основе которых будут приниматься решения и строиться действия с помощью людей, процессов и технологий |
| 6 | Установите соответствие между понятием и его содержанием: |
| 7 | Установите соответствие целей инфраструктуры Hadoop и их характеристик: |
| 8 | Причина создания баз данных NoSQL – … |
| 9 | Неверно, что MapReduce … |
| 10 | В реляционной модели представленные данные для пользователя передаются в виде … |
| 11 | Сокращенное английское название семейства нереляционных баз данных – … |
| 12 | Установите соответствие этапов MapReduce и их содержания: |
| 13 | Установите соответствие баз данных и их характеристик: |
| 14 | Краудсорсинг – это … |
| 15 | Интеграция – это … |
| 16 | Машинное обучение – это … |
| 17 | Фамилия британского ученого, который разработал эмпирический тест, призванный определить способность компьютера мыслить как человек, – … |
| 18 | Простейший вид нейронной сети, который представляет собой алгоритм для выполнения двоичной классификации, – это … |
| 19 | Data Mining – это процесс обнаружения в сырых данных … (укажите 3 варианта ответа) |
| 20 | Деревья классификации относятся к стратегии … |
| 21 | Метод Data Mining, который относит объекты к одному из заранее известных классов, – это … |
| 23 | Если все значения признака увеличить в 16 раз, дисперсия увеличится в … раз |
| 24 | Расположите в правильной последовательности этапы дивизимного метода кластерного анализа: |
| 25 | Установите соответствие между описательными статистиками и их определением: |
| 26 | Расположите в правильной последовательности этапы кластерного анализа методом k-средних: |
| 27 | В языке программирования R используются такие типы данных, как … (укажите 5 вариантов ответа) |
| 28 | Нажатием сочетания клавиш «…» и «–» можно написать оператор присваивания "<-" |
| 29 | Язык программирования R является потомком языка … |
| 30 | Установите соответствие между пакетами языка программирования R и их назначением: |
| | |
| 1 | В вашей компании необходимо организовать сбор, хранение и обработку больших данных. На что в первую очередь должно обратить внимание руководство при организации хранения и обработки данных? |
| 2 | Разным группам пользователей с различным уровнем доступа требуется доступ к одной и той же информации. Что следует предпринять руководству? |
| 3 | Ваша компания использует различные технологии для сбора и хранения данных. Приведите пример данных, когда эффективнее использовать технологию Hadoop. |
| 4 | Вам нужно рассчитать необходимые параметры для создания обшивки самолета. Какая из областей машинного обучения вам в этом поможет? |
| 5 | Вам необходимо предсказать значения непрерывной числовой величины для входных данных. Какой метод вам в этом поможет? |
| 6 | Вашей компании необходимо закупить новый вид сырья. Вам необходимо узнать, насколько может упасть стоимость этого сырья в ближайшем будущем и когда это может произойти. Какой метод Data Mining вы будете использовать? |
| 7 | Вашей компании необходимо определить структуру клиентов по их вкладу в доходы компании. Какой метод Data Mining вы будете использовать? |
| 8 | Вам необходимо импортировать в программную среду RStudio текстовый файл с разделителем. Какую функцию вы будете использовать? |
Характеристики ответов (шпаргалок) к экзамену
Учебное заведение
Семестр
Программы
Просмотров
0
Качество
Идеальное компьютерное
Размер
286,56 Kb
Список файлов
Введение в анализ больших данных.pdf
Комментарии
Нет комментариев
Стань первым, кто что-нибудь напишет!
МосАП
id118154006















