Для студентов МФПУ «Синергия» по предмету Введение в анализ больших данныхВведение в анализ больших данных Итоговый, компетентностный тестВведение в анализ больших данных Итоговый, компетентностный тест
5,0059
2025-02-252025-02-25СтудИзба
📚 Коллекция ответов по предмету Введение в анализ больших данных в Синергии – большая база! 💯
Бестселлер
Описание
Крупная база ответов к предмету🔥 Введение в анализ больших данных 🔥
С помощью данной коллекции вы 100% сдадите ЛЮБОЙ тест.
➡️ Много готовых практик для разных направлений! ⬅️
➡️ ‼️ Готовые базы ответов на ВСЕ предметы в Синергии ☢️ ⬅️
➡️ ✔️ Отдельные ответы на вопросы 💯 ⬅️
⭐ Сессия под ключ (помощь с сессией под ключ) 🗝️ ⭐
➡️ Помощь с НИР (научно-исследовательской работой) ⭐
⛏️ Помощь с ЛЮБОЙ практикой ⬅️
📕 Помощь с ВКР (любая ДИПЛОМНАЯ работа) 📚 ◀️
⬆️ Жми на нужную ссылку! ⬆️
С помощью данной коллекции вы 100% сдадите ЛЮБОЙ тест.
➡️ Много готовых практик для разных направлений! ⬅️
➡️ ‼️ Готовые базы ответов на ВСЕ предметы в Синергии ☢️ ⬅️
➡️ ✔️ Отдельные ответы на вопросы 💯 ⬅️
⭐ Сессия под ключ (помощь с сессией под ключ) 🗝️ ⭐
➡️ Помощь с НИР (научно-исследовательской работой) ⭐
⛏️ Помощь с ЛЮБОЙ практикой ⬅️
📕 Помощь с ВКР (любая ДИПЛОМНАЯ работа) 📚 ◀️
⬆️ Жми на нужную ссылку! ⬆️
- Итоговая аттестация
- Итоговый тест
- Компетентностный тест
- Заключение
Список вопросов
Вашей компании необходимо определить структуру клиентов по их вкладу в доходы компании. Какой метод Data Mining вы будете использовать?
Ваша компания использует различные технологии для сбора и хранения данных. Приведите пример данных, когда эффективнее использовать технологию Hadoop.
Выполнены следующие строки кода в программной среде RStudio:
vec <- c(3,5,2,1,8,4,9,10,3,15,1,11)
vec[2]
vec <- c(3,5,2,1,8,4,9,10,3,15,1,11)
vec[2]
В вашей компании необходимо организовать сбор, хранение и обработку больших данных. На что в первую очередь должно обратить внимание руководство при организации хранения и обработки данных?
Вам нужно рассчитать необходимые параметры для создания обшивки самолета. Какая из областей машинного обучения вам в этом поможет?
Чтобы получить помощь в программной среде R, можно … (укажите 3 варианта ответа)
Вам необходимо предсказать значения непрерывной числовой величины для входных данных. Какой метод вам в этом поможет?
Вам необходимо организовать потоковую обработку событий в режиме реального времени. Какую технологию необходимо использовать?
Web Mining применяет технологию Data Mining для анализа … (укажите 4 варианта ответа)
Вам необходимо импортировать в программную среду RStudio текстовый файл с разделителем. Какую функцию вы будете использовать?
В числовом ряду 3, 5, 8, 12, 2, 9, 6, 10, 11, 14 медиана (с точностью до 0,1) равна …
Нажатием сочетания клавиш «…» и «–» можно написать оператор присваивания "<-"
… является шириной коробки в диаграмме «ящик с усами»
Разветвляющийся алгоритм – это …
В реляционной модели представленные данные для пользователя передаются в виде …
Циклический алгоритм используется при вычислении … (укажите 2 варианта ответа)
Вашей компании необходимо закупить новый вид сырья. Вам необходимо узнать, насколько может упасть стоимость этого сырья в ближайшем будущем и когда это может произойти. Какой метод Data Mining вы будете использовать?
В языке программирования R ошибочными являются такие варианты присвоения, как … (укажите 2 варианта ответа)
Данные являются структурированными в … (укажите 2 варианта ответа)
Если расстоянием между кластерами называется минимальное из расстояний между парами объектов, один из которых входит в первый кластер, а другой – во второй, то это расстояние …
Процедура снижения признакового пространства …
Язык программирования R является потомком языка …
Метод Data Mining, который относит объекты к одному из заранее известных классов, – это …
Velocity в контексте характеристик Big Data означает …
Название на английском языке системы или репозитория данных, хранящихся в необработанном формате, – …
Вычислительная единица в искусственных нейронных сетях, которая получает информацию, производит над ней простые вычисления и передает ее дальше, – это …
… – это процесс преобразования данных в выводы, на основе которых будут приниматься решения и строиться действия с помощью людей, процессов и технологий
Процесс преобразования данных в код, который можно распознать только с помощью определенного ключа или пароля, – это …
Разным группам пользователей с различным уровнем доступа требуется доступ к одной и той же информации. Что следует предпринять руководству?
В числе примеров структурированных данных – … (укажите 2 варианта ответа)
Вам необходимо принять решение о выдаче кредита клиенту. Какой метод машинного обучения вам в этом поможет?
Установите правильную последовательность этапов процесса MapReduсe подсчета цветов в текстовых файлах:
- чтение входных файлов
- каждая строка передается заданию
- ключ отображается на значение
- ключи сортируются, чтобы упростить обобщение данных
- фаза свертки суммирует количество вхождений каждого цвета и выводит для каждого ключа один файл с общим количеством вхождений этого цвета
- ключи собираются в выходной файл
Деревья классификации относятся к стратегии …
Краудсорсинг – это …
Минимальная единица измерения информации – это …
Укажите правильную последовательность этапов анализа данных в языке программирования R:
- сбор данных
- импорт данных из источника в программную среду R
- разведочный анализ
- очистка и трансформация данных
- моделирование
- презентация результатов
Фамилия британского ученого, который разработал эмпирический тест, призванный определить способность компьютера мыслить как человек, – …
Библиотека … является базовой для Data Science на языке программирования Python
Неверно, что существует такой вид искусственных нейронных сетей, как …
Язык программирования, который объединяет объектно- ориентированный и функциональный подходы и используется в Apache Spark, – это язык …
Английское название фреймворка для вычисления наборов распределенных задач с использованием большого количества компьютеров, образующих кластер, – …
Процесс привлечения к решению задач в инновационной сфере широкого круга лиц по типу субподрядной работы на добровольных началах с применением информационно- коммуникационных технологий – это …
Такой вид машинного обучения, как …, основывается на взаимодействии обучаемой системы со средой
Элементы матрицы факторных нагрузок меняются в пределах …
Hadoop – это проект …
SQL – это …
Алгоритм — это:
Аналитическим отделом компании был получен спам по e-mail с приложенным файлом: Что следует предпринять?
В каких из приведенных ниже случаев речь идет структурированных данных:
Горизонтальная масштабируемость при обработке Big Data – это:
Заказчик бизнес-процесса – это должностное лицо:
Интеграция – это …
К основным характеристикам Big Data относятся:
Как в R обозначаются пропущенные значения?
Как можно получить помощь в R:
Как назвается в R тип данных «строки»?
Как назвается в R тип данных «целые числа»?
Как назвается в R тип данных «числа с плавающей точкой»?
Какая функция dplyr служит для вертикального объединения таблиц?
Какие типы данных используются в R:
Какие циклы доступны в базовом синтаксисе языка R?
Каким образом можно объявить переменную «а» на языке R:
Компьютер, выделенный из группы персональных компьютеров (или рабочих станций) для выполнения какой-либо сервисной
задачи без непосредственного участия человека, – это …
задачи без непосредственного участия человека, – это …
Локальность данных Big Data – это:
Медианой для выборки 1, ,3,7,10,15,16,18 является:
Метод исследования, характеризующийся выделением и изучением отдельных частей объектов исследования, – … (слово происходит от греч. «разложение»)
На каком из этапов жизненного цикла данных по методологии CRISP-DM происходит проверка гипотез?
Назовите сложности иерархических методов кластеризации:
Неверно, что Классификация относится к:
Объём накопленных человечеством цифровых данных на 2022 год измеряется:
Отказоустойчивость Big Data – это, когда:
Процессы маркетинга относят к группе:
Процессы подбора персонала относят к группе:
Расположите в правильной последовательности этапы дивизимного метода кластерного анализа:
- все объекты помещаются в один кластер С1
- выбирается объект, у которого среднее значение расстояния до других объектов в этом кластере наибольшее
- выбранный объект удаляется из кластера С1 и формирует первый элемент второго кластера С2
- объект в кластере С1, для которого разность между средним расстоянием до объектов, находящихся в С2, и средним расстоянием до объектов, остающихся в С1, наибольшая, переносится в С2
- каждый последующий уровень применяет процедуру разделения к одному из кластеров, полученных на предыдущем уровне
Расположите в правильной последовательности этапы кластерного анализа методом k-средних:
- выбирается k произвольных исходных центров кластеров – обычно выбираются k объектов
- все объекты разбиваются на k групп, наиболее близких к одному из центров
- вычисляются новые центры кластеров
- проводится новое разбиение всех объектов на основании близости к новым центрам
Расположите в правильной последовательности этапы кластерного анализа методом k-средних:
- выбирается k произвольных исходных центров кластеров – обычно выбираются k объектов
- все объекты разбиваются на k групп, наиболее близких к одному из центров
- вычисляются новые центры кластеров
Реляционные базы данных организованы в виде …
Решение задачи прогнозирования ...
Сколько в 1 зеттабайте тарабайт?
Совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения,
передачи и обработки, – это …
передачи и обработки, – это …
Сокращенное английское название семейства нереляционных баз данных – …
Сокращенное английское название языка структурированных запросов – …
Технология Web mining применяет технологию Data Mining для анализа:
Укажите правильную последовательность шагов алгоритма машинного обучения (ML):
- сбор данных
- исследование и подготовка данных
- обучение модели
- оценка модели
- улучшение модели
Установите соответствие баз данных и их характеристик: MongoDB - хранилище документов
- MongoDB
- Reddis
- Neo4J
- Cassandra
- хранилище документов
- хранилище «ключ – значение»
- графовая база данных
- столбцовая база данных
Установите соответствие между алгоритмами объединения двух кластеров и их характеристиками:
- Метод дальнего соседа
- Метод средней связи
- Метод медианной связи
- Степень близости оценивается по степени близости между наиболее отдаленными объектами кластеров
- Степень близости оценивается как средняя величина степеней близости между объектами кластеров
- Расстояние между любым кластером S и новым кластером, который получился в результате объединения кластеров P и Q, определяется как расстояние от центра кластера S до середины отрезка, соединяющего центры кластеров P и Q
Установите соответствие между аргументами функции leaflet() и их содержанием:
- data
- width
- crs
- origin
- матрица, фрейм данных, пространственные данные
- ширина карты
- используемая система координат
- начало координат в проекции scales - масштабные коэффициенты
Установите соответствие между наиболее распространенными подходами обработки данных и их характеристиками:
- SQL
- MapReduce
- SAP HANA
- Язык структурированных запросов, позволяющий работать с базами данных. С его помощью можно создавать и модифицировать данные, а управлением массива данных занимается соответствующая система управления базами данных (СУБД)
- Модель распределения вычислений. Используется для параллельных вычислений над очень большими наборами данных (петабайты и более). В программном интерфейсе не данные передаются на обработку программе, а программа – данным. Таким образом, запрос представляет собой отдельную программу. Принцип работы заключается в последовательной обработке данных двумя методами
- Высокопроизводительная платформа для хранения и обработки данных. Обеспечивает высокую скорость обработки запросов. Еще одним отличительным признаком является то, что эта платформа упрощает системный ландшафт, уменьшая затраты на поддержку аналитических систем
Установите соответствие между описательными статистиками и их определением:
- Мода
- Медиана
- Первый квартиль
- Третий квартиль
- наиболее часто встречающееся значение признака в совокупности
- значение признака, которое делит ранжированную совокупность на две равные части
- значение признака, ниже (левее) которого располагаются 25 % измеренных значений
- значение признака, правее которого располагаются 75 % измеренных значений
Установите соответствие между пакетами языка программирования R и их назначением:
- arm
- ggplot2
- maptools
- vcd
- outliers
- анализ моделей регрессии
- графический пакет высокой функциональности
- инструментарий работы с географическими картами
- визуализация категориальных данных
- анализ выбросов в данных
Установите соответствие между понятием и его содержанием:
- Data lake
- Data science
- Data mining
- Machine learning
- хранилище больших данных в необработанном виде
- дисциплина, изучающая проблемы анализа, обработки и представления информации в цифровой форме
- интеллектуальный анализ данных с целью выявления закономерностей
- теория и практика разработки самообучающихся программ, большая область искусственного интеллекта
Установите соответствие между способами обучения нейронной сети и их характеристиками:
- Обучение без учителя
- Обучение с учителем
- Обучение с подкреплением
- Модель использует неразмеченные данные, из которых алгоритм самостоятельно пытается извлечь признаки и зависимости
- Нейронная сеть обучается на размеченном наборе данных и предсказывает ответы, которые используются для оценки точности алгоритма на обучающих данных
- Система обучается в процессе взаимодействия с окружающей средой, а не на исторических данных
Установите соответствие целей инфраструктуры Hadoop и их характеристик:
- Надежность
- Отказоустойчивость
- Масштабируемость
- Портируемость
- достигается посредством создания нескольких копий данных и повторного применения логики обработки в случае сбоя
- обнаружение сбоев и их автоматическое и применение автоматического восстановления
- данные и их обработка распределяются в кластерах
- возможность установки на всех видах устройств и операционных систем
Установите соответствие этапов MapReduce и их содержания:
- Input
- Splitting
- Mapping
- Shuffling
- Reducing
- загрузка входных данных для обработки
- разбивка данных на порции
- обработка порционных данных воркерами в формате «ключ – значение»
- сортировка ключей для упрощения обобщенных данных
- объединение и вывод результата
Что такое Business Intelligence (Bl):
Язык программирования … имеет лицензию от компании MathWorks и широко используется для вычислений как в научных, так и в промышленных целях
Характеристики ответов (шпаргалок) к заданиям
Тип
Коллекция: Ответы (шпаргалки) к заданиям
Учебное заведение
Номер задания
Программы
Просмотров
33
Качество
Идеальное компьютерное
Количество вопросов


Гарантия сдачи без лишних хлопот! ✅🎓 Ответы на тесты по любым дисциплинам, базы вопросов, работы и услуги для Синергии, МЭИ и других вузов – всё уже готово! 🚀 🎯📚 Гарантия качества – или возврат денег! 💰✅