Для студентов МФПУ «Синергия» по предмету Введение в анализ больших данныхВведение в анализ больших данных Итоговый, компетентностный тестВведение в анализ больших данных Итоговый, компетентностный тест
5,00516
2025-02-252025-02-25СтудИзба
📚 Коллекция ответов по предмету Введение в анализ больших данных в Синергии – большая база! 💯
Ответы к заданиям Итоговый: Введение в анализ больших данных Итоговый, компетентностный тест
Бестселлер
Описание
Крупная база ответов к предмету🔥 Введение в анализ больших данных 🔥
С помощью данной коллекции вы 100% сдадите ЛЮБОЙ тест.
➡️ Много готовых практик для разных направлений! ⬅️
➡️ ‼️ Готовые базы ответов на ВСЕ предметы в Синергии ☢️ ⬅️
➡️ ✔️ Отдельные ответы на вопросы 💯 ⬅️
⭐ Сессия под ключ (помощь с сессией под ключ) 🗝️ ⭐
➡️ Помощь с НИР (научно-исследовательской работой) ⭐
⛏️ Помощь с ЛЮБОЙ практикой ⬅️
📕 Помощь с ВКР (любая ДИПЛОМНАЯ работа) 📚 ◀️
⬆️ Жми на нужную ссылку! ⬆️
С помощью данной коллекции вы 100% сдадите ЛЮБОЙ тест.
➡️ Много готовых практик для разных направлений! ⬅️
➡️ ‼️ Готовые базы ответов на ВСЕ предметы в Синергии ☢️ ⬅️
➡️ ✔️ Отдельные ответы на вопросы 💯 ⬅️
⭐ Сессия под ключ (помощь с сессией под ключ) 🗝️ ⭐
➡️ Помощь с НИР (научно-исследовательской работой) ⭐
⛏️ Помощь с ЛЮБОЙ практикой ⬅️
📕 Помощь с ВКР (любая ДИПЛОМНАЯ работа) 📚 ◀️
⬆️ Жми на нужную ссылку! ⬆️
- Итоговая аттестация
- Итоговый тест
- Компетентностный тест
- Заключение
Список вопросов
Вашей компании необходимо определить структуру клиентов по их вкладу в доходы компании. Какой метод Data Mining вы будете использовать?
Выполнены следующие строки кода в программной среде RStudio:
vec <- c(3,5,2,1,8,4,9,10,3,15,1,11)
vec[2]
vec <- c(3,5,2,1,8,4,9,10,3,15,1,11)
vec[2]
Нажатием сочетания клавиш «…» и «–» можно написать оператор присваивания "<-"
Ваша компания использует различные технологии для сбора и хранения данных. Приведите пример данных, когда эффективнее использовать технологию Hadoop.
Чтобы получить помощь в программной среде R, можно … (укажите 3 варианта ответа)
Вам необходимо импортировать в программную среду RStudio текстовый файл с разделителем. Какую функцию вы будете использовать?
В вашей компании необходимо организовать сбор, хранение и обработку больших данных. На что в первую очередь должно обратить внимание руководство при организации хранения и обработки данных?
Вам необходимо организовать потоковую обработку событий в режиме реального времени. Какую технологию необходимо использовать?
Вам нужно рассчитать необходимые параметры для создания обшивки самолета. Какая из областей машинного обучения вам в этом поможет?
Вам необходимо предсказать значения непрерывной числовой величины для входных данных. Какой метод вам в этом поможет?
Вашей компании необходимо закупить новый вид сырья. Вам необходимо узнать, насколько может упасть стоимость этого сырья в ближайшем будущем и когда это может произойти. Какой метод Data Mining вы будете использовать?
В числовом ряду 3, 5, 8, 12, 2, 9, 6, 10, 11, 14 медиана (с точностью до 0,1) равна …
Циклический алгоритм используется при вычислении … (укажите 2 варианта ответа)
Web Mining применяет технологию Data Mining для анализа … (укажите 4 варианта ответа)
Разветвляющийся алгоритм – это …
… является шириной коробки в диаграмме «ящик с усами»
В языке программирования R ошибочными являются такие варианты присвоения, как … (укажите 2 варианта ответа)
Если расстоянием между кластерами называется минимальное из расстояний между парами объектов, один из которых входит в первый кластер, а другой – во второй, то это расстояние …
Процедура снижения признакового пространства …
Название на английском языке системы или репозитория данных, хранящихся в необработанном формате, – …
Данные являются структурированными в … (укажите 2 варианта ответа)
Расположите в правильной последовательности этапы кластерного анализа методом k-средних:
- выбирается k произвольных исходных центров кластеров – обычно выбираются k объектов
- все объекты разбиваются на k групп, наиболее близких к одному из центров
- вычисляются новые центры кластеров
- проводится новое разбиение всех объектов на основании близости к новым центрам
В реляционной модели представленные данные для пользователя передаются в виде …
Язык программирования R является потомком языка …
Элементы матрицы факторных нагрузок меняются в пределах …
Установите соответствие между описательными статистиками и их определением:
- Мода
- Медиана
- Первый квартиль
- Третий квартиль
- наиболее часто встречающееся значение признака в совокупности
- значение признака, которое делит ранжированную совокупность на две равные части
- значение признака, ниже (левее) которого располагаются 25 % измеренных значений
- значение признака, правее которого располагаются 75 % измеренных значений
Деревья классификации относятся к стратегии …
Краудсорсинг – это …
Неверно, что существует такой вид искусственных нейронных сетей, как …
Метод Data Mining, который относит объекты к одному из заранее известных классов, – это …
Velocity в контексте характеристик Big Data означает …
Разным группам пользователей с различным уровнем доступа требуется доступ к одной и той же информации. Что следует предпринять руководству?
В каких из приведенных ниже случаев речь идет структурированных данных:
В числе примеров структурированных данных – … (укажите 2 варианта ответа)
Вам необходимо принять решение о выдаче кредита клиенту. Какой метод машинного обучения вам в этом поможет?
Вычислительная единица в искусственных нейронных сетях, которая получает информацию, производит над ней простые вычисления и передает ее дальше, – это …
… – это процесс преобразования данных в выводы, на основе которых будут приниматься решения и строиться действия с помощью людей, процессов и технологий
Процесс преобразования данных в код, который можно распознать только с помощью определенного ключа или пароля, – это …
Библиотека … является базовой для Data Science на языке программирования Python
Язык программирования, который объединяет объектно- ориентированный и функциональный подходы и используется в Apache Spark, – это язык …
Английское название фреймворка для вычисления наборов распределенных задач с использованием большого количества компьютеров, образующих кластер, – …
Процесс привлечения к решению задач в инновационной сфере широкого круга лиц по типу субподрядной работы на добровольных началах с применением информационно- коммуникационных технологий – это …
Такой вид машинного обучения, как …, основывается на взаимодействии обучаемой системы со средой
Установите правильную последовательность этапов процесса MapReduсe подсчета цветов в текстовых файлах:
- чтение входных файлов
- каждая строка передается заданию
- ключ отображается на значение
- ключи сортируются, чтобы упростить обобщение данных
- фаза свертки суммирует количество вхождений каждого цвета и выводит для каждого ключа один файл с общим количеством вхождений этого цвета
- ключи собираются в выходной файл
Минимальная единица измерения информации – это …
Укажите правильную последовательность этапов анализа данных в языке программирования R:
- сбор данных
- импорт данных из источника в программную среду R
- разведочный анализ
- очистка и трансформация данных
- моделирование
- презентация результатов
Фамилия британского ученого, который разработал эмпирический тест, призванный определить способность компьютера мыслить как человек, – …
Hadoop – это проект …
SQL – это …
Алгоритм — это:
Аналитическим отделом компании был получен спам по e-mail с приложенным файлом: Что следует предпринять?
Горизонтальная масштабируемость при обработке Big Data – это:
Заказчик бизнес-процесса – это должностное лицо:
Интеграция – это …
К основным характеристикам Big Data относятся:
Как в R обозначаются пропущенные значения?
Как можно получить помощь в R:
Как назвается в R тип данных «строки»?
Как назвается в R тип данных «целые числа»?
Как назвается в R тип данных «числа с плавающей точкой»?
Какая функция dplyr служит для вертикального объединения таблиц?
Какие типы данных используются в R:
Какие циклы доступны в базовом синтаксисе языка R?
Каким образом можно объявить переменную «а» на языке R:
Компьютер, выделенный из группы персональных компьютеров (или рабочих станций) для выполнения какой-либо сервисной
задачи без непосредственного участия человека, – это …
задачи без непосредственного участия человека, – это …
Локальность данных Big Data – это:
Медианой для выборки 1, ,3,7,10,15,16,18 является:
Метод исследования, характеризующийся выделением и изучением отдельных частей объектов исследования, – … (слово происходит от греч. «разложение»)
На каком из этапов жизненного цикла данных по методологии CRISP-DM происходит проверка гипотез?
Назовите сложности иерархических методов кластеризации:
Неверно, что Классификация относится к:
Объём накопленных человечеством цифровых данных на 2022 год измеряется:
Отказоустойчивость Big Data – это, когда:
Процессы маркетинга относят к группе:
Процессы подбора персонала относят к группе:
Расположите в правильной последовательности этапы дивизимного метода кластерного анализа:
- все объекты помещаются в один кластер С1
- выбирается объект, у которого среднее значение расстояния до других объектов в этом кластере наибольшее
- выбранный объект удаляется из кластера С1 и формирует первый элемент второго кластера С2
- объект в кластере С1, для которого разность между средним расстоянием до объектов, находящихся в С2, и средним расстоянием до объектов, остающихся в С1, наибольшая, переносится в С2
- каждый последующий уровень применяет процедуру разделения к одному из кластеров, полученных на предыдущем уровне
Расположите в правильной последовательности этапы кластерного анализа методом k-средних:
- выбирается k произвольных исходных центров кластеров – обычно выбираются k объектов
- все объекты разбиваются на k групп, наиболее близких к одному из центров
- вычисляются новые центры кластеров
Реляционные базы данных организованы в виде …
Решение задачи прогнозирования ...
Сколько в 1 зеттабайте тарабайт?
Совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения,
передачи и обработки, – это …
передачи и обработки, – это …
Сокращенное английское название семейства нереляционных баз данных – …
Сокращенное английское название языка структурированных запросов – …
Технология Web mining применяет технологию Data Mining для анализа:
Укажите правильную последовательность шагов алгоритма машинного обучения (ML):
- сбор данных
- исследование и подготовка данных
- обучение модели
- оценка модели
- улучшение модели
Установите соответствие баз данных и их характеристик: MongoDB - хранилище документов
- MongoDB
- Reddis
- Neo4J
- Cassandra
- хранилище документов
- хранилище «ключ – значение»
- графовая база данных
- столбцовая база данных
Установите соответствие между алгоритмами объединения двух кластеров и их характеристиками:
- Метод дальнего соседа
- Метод средней связи
- Метод медианной связи
- Степень близости оценивается по степени близости между наиболее отдаленными объектами кластеров
- Степень близости оценивается как средняя величина степеней близости между объектами кластеров
- Расстояние между любым кластером S и новым кластером, который получился в результате объединения кластеров P и Q, определяется как расстояние от центра кластера S до середины отрезка, соединяющего центры кластеров P и Q
Установите соответствие между аргументами функции leaflet() и их содержанием:
- data
- width
- crs
- origin
- матрица, фрейм данных, пространственные данные
- ширина карты
- используемая система координат
- начало координат в проекции scales - масштабные коэффициенты
Установите соответствие между наиболее распространенными подходами обработки данных и их характеристиками:
- SQL
- MapReduce
- SAP HANA
- Язык структурированных запросов, позволяющий работать с базами данных. С его помощью можно создавать и модифицировать данные, а управлением массива данных занимается соответствующая система управления базами данных (СУБД)
- Модель распределения вычислений. Используется для параллельных вычислений над очень большими наборами данных (петабайты и более). В программном интерфейсе не данные передаются на обработку программе, а программа – данным. Таким образом, запрос представляет собой отдельную программу. Принцип работы заключается в последовательной обработке данных двумя методами
- Высокопроизводительная платформа для хранения и обработки данных. Обеспечивает высокую скорость обработки запросов. Еще одним отличительным признаком является то, что эта платформа упрощает системный ландшафт, уменьшая затраты на поддержку аналитических систем
Установите соответствие между пакетами языка программирования R и их назначением:
- arm
- ggplot2
- maptools
- vcd
- outliers
- анализ моделей регрессии
- графический пакет высокой функциональности
- инструментарий работы с географическими картами
- визуализация категориальных данных
- анализ выбросов в данных
Установите соответствие между понятием и его содержанием:
- Data lake
- Data science
- Data mining
- Machine learning
- хранилище больших данных в необработанном виде
- дисциплина, изучающая проблемы анализа, обработки и представления информации в цифровой форме
- интеллектуальный анализ данных с целью выявления закономерностей
- теория и практика разработки самообучающихся программ, большая область искусственного интеллекта
Установите соответствие между способами обучения нейронной сети и их характеристиками:
- Обучение без учителя
- Обучение с учителем
- Обучение с подкреплением
- Модель использует неразмеченные данные, из которых алгоритм самостоятельно пытается извлечь признаки и зависимости
- Нейронная сеть обучается на размеченном наборе данных и предсказывает ответы, которые используются для оценки точности алгоритма на обучающих данных
- Система обучается в процессе взаимодействия с окружающей средой, а не на исторических данных
Установите соответствие целей инфраструктуры Hadoop и их характеристик:
- Надежность
- Отказоустойчивость
- Масштабируемость
- Портируемость
- достигается посредством создания нескольких копий данных и повторного применения логики обработки в случае сбоя
- обнаружение сбоев и их автоматическое и применение автоматического восстановления
- данные и их обработка распределяются в кластерах
- возможность установки на всех видах устройств и операционных систем
Установите соответствие этапов MapReduce и их содержания:
- Input
- Splitting
- Mapping
- Shuffling
- Reducing
- загрузка входных данных для обработки
- разбивка данных на порции
- обработка порционных данных воркерами в формате «ключ – значение»
- сортировка ключей для упрощения обобщенных данных
- объединение и вывод результата
Что такое Business Intelligence (Bl):
Язык программирования … имеет лицензию от компании MathWorks и широко используется для вычислений как в научных, так и в промышленных целях
Характеристики ответов (шпаргалок) к заданиям
Тип
Коллекция: Ответы (шпаргалки) к заданиям
Учебное заведение
Номер задания
Программы
Просмотров
74
Качество
Идеальное компьютерное
Количество вопросов


Гарантия сдачи без лишних хлопот! ✅🎓 Ответы на тесты по любым дисциплинам, базы вопросов, работы и услуги для Синергии, МЭИ и других вузов – всё уже готово! 🚀 🎯📚 Гарантия качества – или возврат денег! 💰✅