Для студентов МФПУ «Синергия» по предмету Введение в анализ больших данныхВведение в анализ больших данных Итоговый, компетентностный тестВведение в анализ больших данных Итоговый, компетентностный тест
5,0059
2025-02-25СтудИзба

📚 Коллекция ответов по предмету Введение в анализ больших данных в Синергии – большая база! 💯

Бестселлер

Описание

Список вопросов

Вашей компании необходимо определить структуру клиентов по их вкладу в доходы компании. Какой метод Data Mining вы будете использовать?
Ваша компания использует различные технологии для сбора и хранения данных. Приведите пример данных, когда эффективнее использовать технологию Hadoop.
Выполнены следующие строки кода в программной среде RStudio:
vec <- c(3,5,2,1,8,4,9,10,3,15,1,11)
vec[2]
В вашей компании необходимо организовать сбор, хранение и обработку больших данных. На что в первую очередь должно обратить внимание руководство при организации хранения и обработки данных?
Вам нужно рассчитать необходимые параметры для создания обшивки самолета. Какая из областей машинного обучения вам в этом поможет?
Чтобы получить помощь в программной среде R, можно … (укажите 3 варианта ответа)
Вам необходимо предсказать значения непрерывной числовой величины для входных данных. Какой метод вам в этом поможет?
Вам необходимо организовать потоковую обработку событий в режиме реального времени. Какую технологию необходимо использовать?
Web Mining применяет технологию Data Mining для анализа … (укажите 4 варианта ответа)
Вам необходимо импортировать в программную среду RStudio текстовый файл с разделителем. Какую функцию вы будете использовать?
В числовом ряду 3, 5, 8, 12, 2, 9, 6, 10, 11, 14 медиана (с точностью до 0,1) равна …
Нажатием сочетания клавиш «…» и «–» можно написать оператор присваивания "<-"
… является шириной коробки в диаграмме «ящик с усами»
Разветвляющийся алгоритм – это …
В реляционной модели представленные данные для пользователя передаются в виде …
Циклический алгоритм используется при вычислении … (укажите 2 варианта ответа)
Вашей компании необходимо закупить новый вид сырья. Вам необходимо узнать, насколько может упасть стоимость этого сырья в ближайшем будущем и когда это может произойти. Какой метод Data Mining вы будете использовать?
В языке программирования R ошибочными являются такие варианты присвоения, как … (укажите 2 варианта ответа)
Данные являются структурированными в … (укажите 2 варианта ответа)
Если расстоянием между кластерами называется минимальное из расстояний между парами объектов, один из которых входит в первый кластер, а другой – во второй, то это расстояние …
Процедура снижения признакового пространства …
Язык программирования R является потомком языка …
Метод Data Mining, который относит объекты к одному из заранее известных классов, – это …
Velocity в контексте характеристик Big Data означает …
Название на английском языке системы или репозитория данных, хранящихся в необработанном формате, – …
Вычислительная единица в искусственных нейронных сетях, которая получает информацию, производит над ней простые вычисления и передает ее дальше, – это …
… – это процесс преобразования данных в выводы, на основе которых будут приниматься решения и строиться действия с помощью людей, процессов и технологий
Процесс преобразования данных в код, который можно распознать только с помощью определенного ключа или пароля, – это …
Разным группам пользователей с различным уровнем доступа требуется доступ к одной и той же информации. Что следует предпринять руководству?
В числе примеров структурированных данных – … (укажите 2 варианта ответа)
Вам необходимо принять решение о выдаче кредита клиенту. Какой метод машинного обучения вам в этом поможет?
Установите правильную последовательность этапов процесса MapReduсe подсчета цветов в текстовых файлах:
  1. чтение входных файлов
  2. каждая строка передается заданию
  3. ключ отображается на значение
  4. ключи сортируются, чтобы упростить обобщение данных
  5. фаза свертки суммирует количество вхождений каждого цвета и выводит для каждого ключа один файл с общим количеством вхождений этого цвета
  6. ключи собираются в выходной файл
Деревья классификации относятся к стратегии …
Краудсорсинг – это …
Минимальная единица измерения информации – это …
Укажите правильную последовательность этапов анализа данных в языке программирования R:
  1. сбор данных
  2. импорт данных из источника в программную среду R
  3. разведочный анализ
  4. очистка и трансформация данных
  5. моделирование
  6. презентация результатов
Фамилия британского ученого, который разработал эмпирический тест, призванный определить способность компьютера мыслить как человек, – …
Библиотека … является базовой для Data Science на языке программирования Python
Неверно, что существует такой вид искусственных нейронных сетей, как …
Язык программирования, который объединяет объектно- ориентированный и функциональный подходы и используется в Apache Spark, – это язык …
Английское название фреймворка для вычисления наборов распределенных задач с использованием большого количества компьютеров, образующих кластер, – …
Процесс привлечения к решению задач в инновационной сфере широкого круга лиц по типу субподрядной работы на добровольных началах с применением информационно- коммуникационных технологий – это …
Такой вид машинного обучения, как …, основывается на взаимодействии обучаемой системы со средой
Элементы матрицы факторных нагрузок меняются в пределах …
Hadoop – это проект …
Алгоритм — это:
Аналитическим отделом компании был получен спам по e-mail с приложенным файлом: Что следует предпринять?
В каких из приведенных ниже случаев речь идет структурированных данных:
Горизонтальная масштабируемость при обработке Big Data – это:
Заказчик бизнес-процесса – это должностное лицо:
Интеграция – это …
К основным характеристикам Big Data относятся:
Как в R обозначаются пропущенные значения?
Как можно получить помощь в R:
Как назвается в R тип данных «строки»?
Как назвается в R тип данных «целые числа»?
Как назвается в R тип данных «числа с плавающей точкой»?
Какая функция dplyr служит для вертикального объединения таблиц?
Какие типы данных используются в R:
Какие циклы доступны в базовом синтаксисе языка R?
Каким образом можно объявить переменную «а» на языке R:
Компьютер, выделенный из группы персональных компьютеров (или рабочих станций) для выполнения какой-либо сервисной
задачи без непосредственного участия человека, – это …
Локальность данных Big Data – это:
Медианой для выборки 1, ,3,7,10,15,16,18 является:
Метод исследования, характеризующийся выделением и изучением отдельных частей объектов исследования, – … (слово происходит от греч. «разложение»)
На каком из этапов жизненного цикла данных по методологии CRISP-DM происходит проверка гипотез?
Назовите сложности иерархических методов кластеризации:
Неверно, что Классификация относится к:
Объём накопленных человечеством цифровых данных на 2022 год измеряется:
Отказоустойчивость Big Data – это, когда:
Процессы маркетинга относят к группе:
Процессы подбора персонала относят к группе:
Расположите в правильной последовательности этапы дивизимного метода кластерного анализа:
  1. все объекты помещаются в один кластер С1
  2. выбирается объект, у которого среднее значение расстояния до других объектов в этом кластере наибольшее
  3. выбранный объект удаляется из кластера С1 и формирует первый элемент второго кластера С2
  4. объект в кластере С1, для которого разность между средним расстоянием до объектов, находящихся в С2, и средним расстоянием до объектов, остающихся в С1, наибольшая, переносится в С2
  5. каждый последующий уровень применяет процедуру разделения к одному из кластеров, полученных на предыдущем уровне
Расположите в правильной последовательности этапы кластерного анализа методом k-средних:
  1. выбирается k произвольных исходных центров кластеров – обычно выбираются k объектов
  2. все объекты разбиваются на k групп, наиболее близких к одному из центров
  3. вычисляются новые центры кластеров
  4. проводится новое разбиение всех объектов на основании близости к новым центрам
Расположите в правильной последовательности этапы кластерного анализа методом k-средних:
  1. выбирается k произвольных исходных центров кластеров – обычно выбираются k объектов
  2. все объекты разбиваются на k групп, наиболее близких к одному из центров
  3. вычисляются новые центры кластеров
Реляционные базы данных организованы в виде …
Решение задачи прогнозирования ...
Сколько в 1 зеттабайте тарабайт?
Совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения,
передачи и обработки, – это …
Сокращенное английское название семейства нереляционных баз данных – …
Сокращенное английское название языка структурированных запросов – …
Технология Web mining применяет технологию Data Mining для анализа:
Укажите правильную последовательность шагов алгоритма машинного обучения (ML):
  1. сбор данных
  2. исследование и подготовка данных
  3. обучение модели
  4. оценка модели
  5. улучшение модели
Установите соответствие баз данных и их характеристик: MongoDB - хранилище документов
  1. MongoDB
  2. Reddis
  3. Neo4J
  4. Cassandra
  5. хранилище документов
  6. хранилище «ключ – значение»
  7. графовая база данных
  8. столбцовая база данных
Установите соответствие между алгоритмами объединения двух кластеров и их характеристиками:
  1. Метод дальнего соседа
  2. Метод средней связи
  3. Метод медианной связи
  4. Степень близости оценивается по степени близости между наиболее отдаленными объектами кластеров
  5. Степень близости оценивается как средняя величина степеней близости между объектами кластеров
  6. Расстояние между любым кластером S и новым кластером, который получился в результате объединения кластеров P и Q, определяется как расстояние от центра кластера S до середины отрезка, соединяющего центры кластеров P и Q
Установите соответствие между аргументами функции leaflet() и их содержанием:
  1. data
  2. width
  3. crs
  4. origin
  5. матрица, фрейм данных, пространственные данные
  6. ширина карты
  7. используемая система координат
  8. начало координат в проекции scales - масштабные коэффициенты
Установите соответствие между наиболее распространенными подходами обработки данных и их характеристиками:
  1. SQL
  2. MapReduce
  3. SAP HANA
  4. Язык структурированных запросов, позволяющий работать с базами данных. С его помощью можно создавать и модифицировать данные, а управлением массива данных занимается соответствующая система управления базами данных (СУБД)
  5. Модель распределения вычислений. Используется для параллельных вычислений над очень большими наборами данных (петабайты и более). В программном интерфейсе не данные передаются на обработку программе, а программа – данным. Таким образом, запрос представляет собой отдельную программу. Принцип работы заключается в последовательной обработке данных двумя методами
  6. Высокопроизводительная платформа для хранения и обработки данных. Обеспечивает высокую скорость обработки запросов. Еще одним отличительным признаком является то, что эта платформа упрощает системный ландшафт, уменьшая затраты на поддержку аналитических систем
Установите соответствие между описательными статистиками и их определением:
  1. Мода
  2. Медиана
  3. Первый квартиль
  4. Третий квартиль
  5. наиболее часто встречающееся значение признака в совокупности
  6. значение признака, которое делит ранжированную совокупность на две равные части
  7. значение признака, ниже (левее) которого располагаются 25 % измеренных значений
  8. значение признака, правее которого располагаются 75 % измеренных значений
Установите соответствие между пакетами языка программирования R и их назначением:
  1. arm
  2. ggplot2
  3. maptools
  4. vcd
  5. outliers
  6. анализ моделей регрессии
  7. графический пакет высокой функциональности
  8. инструментарий работы с географическими картами
  9. визуализация категориальных данных
  10. анализ выбросов в данных
Установите соответствие между понятием и его содержанием:
  1. Data lake
  2. Data science
  3. Data mining
  4. Machine learning
  5. хранилище больших данных в необработанном виде
  6. дисциплина, изучающая проблемы анализа, обработки и представления информации в цифровой форме
  7. интеллектуальный анализ данных с целью выявления закономерностей
  8. теория и практика разработки самообучающихся программ, большая область искусственного интеллекта
Установите соответствие между способами обучения нейронной сети и их характеристиками:
  1. Обучение без учителя
  2. Обучение с учителем
  3. Обучение с подкреплением
  4. Модель использует неразмеченные данные, из которых алгоритм самостоятельно пытается извлечь признаки и зависимости
  5. Нейронная сеть обучается на размеченном наборе данных и предсказывает ответы, которые используются для оценки точности алгоритма на обучающих данных
  6. Система обучается в процессе взаимодействия с окружающей средой, а не на исторических данных
Установите соответствие целей инфраструктуры Hadoop и их характеристик:
  1. Надежность
  2. Отказоустойчивость
  3. Масштабируемость
  4. Портируемость
  5. достигается посредством создания нескольких копий данных и повторного применения логики обработки в случае сбоя
  6. обнаружение сбоев и их автоматическое и применение автоматического восстановления
  7. данные и их обработка распределяются в кластерах
  8. возможность установки на всех видах устройств и операционных систем
Установите соответствие этапов MapReduce и их содержания:
  1. Input
  2. Splitting
  3. Mapping
  4. Shuffling
  5. Reducing
  6. загрузка входных данных для обработки
  7. разбивка данных на порции
  8. обработка порционных данных воркерами в формате «ключ – значение»
  9. сортировка ключей для упрощения обобщенных данных
  10. объединение и вывод результата
Что такое Business Intelligence (Bl):
Язык программирования … имеет лицензию от компании MathWorks и широко используется для вычислений как в научных, так и в промышленных целях

Характеристики ответов (шпаргалок) к заданиям

Учебное заведение
Номер задания
Программы
Просмотров
33
Качество
Идеальное компьютерное
Количество вопросов
Как копировать вопросы во время теста в Синергии?
Картинка-подпись
Гарантия сдачи без лишних хлопот! ✅🎓 Ответы на тесты по любым дисциплинам, базы вопросов, работы и услуги для Синергии, МЭИ и других вузов – всё уже готово! 🚀 🎯📚 Гарантия качества – или возврат денег! 💰✅

Комментарии

Поделитесь ссылкой:
Базовая цена: 299 руб.
Помощь со сдачей Услуга за 999 руб.
Помощь с ЛЮБОЙ практикой Услуга за 3990 руб.
Расширенная гарантия +3 недели гарантии, +10% цены
Несколько человек купили за последний месяц
Рейтинг покупателей
5 из 5
Поделитесь ссылкой:
Сопутствующие материалы
Вы можете использовать полученные ответы для подготовки к экзамену в учебном заведении и других целях, не нарушающих законодательство РФ и устав Вашего учебного заведения.
Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6294
Авторов
на СтудИзбе
314
Средний доход
с одного платного файла
Обучение Подробнее