📝Системы обработки больших данных (Big Data).фмен_БАК
Описание
Сборник всех ответов по предмету "Системы обработки больших данных (Big Data)"! Оплачивая тесты на этой страничке Вы приобретаете ответы по этому предмету!
Что целесообразно создавать при необходимости сравнения значений нескольких наборов данных:
Поверхностную диаграмму
Графики
Гистограммы
Признаки и измерены в количественной шкале. Требуется выяснить, являются ли эти переменные независимыми. Для того чтобы решить эту задачу, можно
преобразовать обе переменные в номинальные переменные и применить критерий хи-квадрат
преобразовать обе переменные в порядковые переменные и применить ранговый критерий Спирмена
применить критерий Колмогорова-Смирнова
Кто создал первую модель искусственных нейронных сетей?
Фрэнк Розенблатт
Уоррен Мак-Каллок и Уолтер Питтс
Ян Лекун
Дэвид И. Румельхарт, Дж. Е. Хинтон и Рональд Дж. Вильямс
Большие данные – это:
Данные объемом более 10Тб
Данные объемом более 100Тб
Данные объемом более 150Тб
Нет ограничений на минимальный объем
Признаки и измерены в номинальной шкале. Какой критерий можно применить для проверки гипотезы о независимости этих признаков?
ранговый критерий Спирмена
ранговый критерий Кендэла
критерий хи-квадрат Фишера-Пирсона
критерий, основанный на выборочном коэффициенте корреляции
Укажите фактор(ы), способствовавший появлению тренда больших данных:
маркетинговые кампании крупных корпораций;
снижение издержек на хранение данных;
появление новых технологий обработки потоковых данных;
выпуск баз данных с обработкой данных в памяти.
Большинство методов Data mining были разработаны в рамках …
классического анализа данных
теории баз данных
теории искусственного интеллекта
В ходе эксперимента получена реализация двумерной выборки. Известно, что первое наблюдение (5;3), а второе (3;1). Можно сказать, что эти пары
согласованы
несогласованы
коррелированны
некоррелированны
Выбор в электронной таблице данных, соответствующих определенным условиям:
Сортировка
Анализ
Фильтрация
Графическое представление числовых данных, позволяющее быстро оценить соотношение нескольких величин:
Диаграмма
Статистика
Инфографика
Деревья решений относятся к группам …
статистических методов
кибернетических методов
логических методов
методов кросс-табуляции
R2 –это
коэффициент множественной корреляции
коэффициент множественной детерминации
частным коэффициентом корреляции
Для какой шкалы применимы только такие операции как равно и не равно?
номинальная шкала
порядковая шкала
интервальная шкала
Значение коэффициента корреляции расположены в диапазоне
от -1 до +1
от 0 до +1
от 0 до -1
от -2 до +2
Какая функция в R приводит строку к нижнему регистру?
format(x)
paste(…)
tolower(x)
nchar(x)
Известно, что коэффициент корреляции случайных величин и равен нулю. Это означает, что
линейная связь между случайными величинами и отсутствует
случайные величины и линейно зависимы
случайные величины и зависимы
случайные величины и независимы
если случайный вектор является гауссовским, то случайные величины и независимы
Классификация относится к стратегии:
обучения с учителем
обучения без учителя
обучения с подкреплением
Интервальная шкала – это шкала…
содержащая категории, которые могут упорядочиваться, однако разности не имеют смысла
разности между значениями которой могут быть вычислены, однако их отношения не имеет смысла
содержащая только категории, которые не могут упорядочиваться
К технологиям, используемым для сбора и обработки Больших Данных, можно отнести:
программное обеспечение
оборудование
социальные сети
сервисные услуги
СУБДД
В каком типе гистограмм прямоугольники, которые отображают данные, располагаются друг над другом:
В гистограммах с группировкой
В гистограммах с накоплением
В объёмных гистограммах
Как называется гистограмма, в которой вертикальная ось имеет шкалу в процентах:
Гистограмма с накоплением
Гистограмма с группировкой
Нормированная гистограмма с накоплением
Какая функция в R используется для конвертации векторов в текстовые переменные и объединяет их в одно текстовое выражение?
format(x)
paste(…)
tolower(x)
nchar(x)
Какие диаграммы аналогичны гистограммам:
Линейчатые
Лепестковые
Круговые
Не верно утверждение о том, что:
Большие объёмы данных приводят к слабой их структуризации, поэтому появляется такое разнообразие данных
Увеличившаяся производительность телекоммуникационных каналов привела к росту объёмов передаваемой информации
Удешевление систем хранения на единицу информации привело к росту рынка больших данных
Большое разнообразие источников данных
Какие диаграммы с гладкими кривыми можно использовать для построения графиков функций:
Линейчатые диаграммы
Нормированные гистограммы с накоплением
Точечные диаграммы
Один из объектов любой диаграммы:
Ось периодичности
Ось категорий
Ось постоянства
Какой вид диаграмм можно использовать при большом количестве данных, необходимости отображения динамики изменения данных во времени:
Циклическая гистограмма
Круговая диаграмма
График
Доверительный интервал это -
интервал от минимального до максимального значения признака
среднеквадратическое отклонение
интервал, содержаний оцениваемый параметр генеральной совокупности
стандартная ошибка среднего
Кластер можно охарактеризовать как …
группу объектов, имеющих общие свойства
один объект, изолированный от других
группу объектов, имеющую внутреннюю однородность
Табличные процессоры позволяют строить:
Линейные диаграммы
Линейчатые диаграммы
Частичные диаграммы
Корреляционное отношение изменяется в пределах
от -1 до +1
от 0 до +1
от 0 до -1
от -2 до +2
Метод наименьших квадратов может применяться в случае
только парной регрессии
только множественной регрессии
нелинейной и линейной множественной регрессии
коллинеарной регрессии
Как называется тип диаграмм, в котором геометрические фигуры располагаются горизонтально:
Пропорциональная диаграмма
Линейчатая диаграмма
Гистограмма
На какой вкладке размещены инструменты сортировки в Microsoft Excel:
Вставка
Вид
Данные
Один из объектов любой диаграммы:
Ось движений
Ось значений
Ось понятий
Найдите соответствие между функцией в R и еe описанием:
A. с(…)
B. sеq(from, to, by=)
C. list(…)
D. сbind(…)
E. Объединяет аргументы в вектор
F. Генерирует последовательность чисел с шагом
G. Создает список объектов
H. Объединяет объекты по столбцам
Значимость множественной корреляции оценивается по
критерий Пирсона
критерий Фишера
критерий Лапласа
критерий Романовского
Как называется тип представления данных, который позволяет оценивать соотношение нескольких величин:
Диаграмма
График
Таблица
Не верно утверждение о том, что:
Большие данные это данные объёма свыше 1 Тб.
Проблема больших данных это проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна.
Большие данные - это тренд в области ИТ, подогреваемый маркетинговыми кампаниями крупных вендоров.
Большие данные как правило не структурированы.
К какому типу диаграмм относятся плоские и объёмные круговые диаграммы:
К круговым диаграммам
К циклопическим диаграммам
К спектральным диаграммам
Не верно, что закономерности, определенные с использованием технологии Data Mining должны обладать такими свойствами:
быть очевидными
быть неочевидными
быть практически полезными
быть объективными
Какие типы данных используются в R:
logical
numeric
integer
attributive
complex
character
Не верно, что технология Web Mining применяет Data Mining для анализа:
Неоднородной информации
Неструктурированной информации
Структурированной информации
Распределенной и значительной по объему информации
Один из объектов любой диаграммы:
Границы диаграммы
Область диаграммы
Очертания диаграммы
Некоррелированность случайных величин означает
отсутствие любой связи между ними
отсутствие линейной связи между ними
их независимость
Определите правильную последовательность термина «Big Data»:
1 цифровой информации
2 быстро поступающей
3 неоднородной
4 огромные объемы
5 которые
6 традиционными
7 невозможно
8 обработать
9 инструментами
Отметьте значимые события, повлиявшие на формирование тренда больших данных:
разработка Hadoop;
изобретение принципа MapReduce;
разработка языка Pyhton;
победа Deepblue в матче с Г.Каспаровым.
Переменная измерена в номинальной шкале, а переменная - в количественной шкале. Требуется выяснить, являются ли эти переменные независимыми. Для того чтобы решить эту задачу, можно
преобразовать переменную в номинальную переменную и применить критерий хи-квадрат
преобразовать переменную в количественную переменную и применить критерий для проверки независимости количественных переменных
применить критерий Колмогорова-Смирнова
Объём накопленных человечеством цифровых данных на 2023 год измеряется:
Петабайтами
Зеттабайтами
Экзабайтами
Йоттабайтами
При проверки гипотезы о виде распределения используется
критерий Пирсона
критерий Фишера
критерий Лапласа
критерий Романовского
Регрессионный и дискриминантный анализ относятся…
к статистическим методам Data mining
к кибернетическим методам Data mining
не являются методами Data mining
Найдите соответствие между понятием и его описанием
A. Data lake
B. Data science
C. Data mining
D. Machine learning
E. Хранилище больших данных в необработанном виде.
F. Дисциплина, изучающая проблемы анализа, обработки и представления информации в цифровой форме.
G. Интеллектуальный анализ данных с целью выявления закономерностей.
H. Теория и практика разработки самообучающихся программ, большая область искусственного интеллекта.
Сколько наблюдений во фрейме данных, если он содержит 42 строки и 4 колонки?
168
4
42
126
В процессе работы Data Mining программы пользователь может получить:
некоторый процент недостоверных результатов
только верные результаты, ложные выводы исключены
только статистически достоверные результаты
Сколько Петабайт в Зеттабайте
1 миллион
Не верно, что Variety в контексте характеристик Big Data означает:
Высокая скорость генерирования данных
Разные типы данных в колонках таблиц реляционных СУБД
Разнообразие отраслей, являющихся источниками данных
Разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные
Сто (100) студентов прошли тестирование по математическому анализу и по физике. Пусть переменная Х- рейтинг студентов по математическому анализу, а переменная Y- рейтинг по физике. Коэффициент корреляции Спирмена для переменных и оказался равным 0.6. Эта информация
позволяет на уровне значимости 0.05 сделать вывод о том, что между показателями и существует монотонная положительная связь
позволяет на уровне значимости 0.05 сделать вывод о том, что между показателями и существует монотонная отрицательная связь
позволяет сделать вывод о том, что на уровне значимости 0.05 нет оснований для отклонения гипотезы о независимости показателей и
не позволяет сделать вывод о зависимости или независимости показателей и
Такие данные как температура воздуха относятся к …
атрибутивным данным
непрерывным данным
дискретным данным
альтернативным данным
Установите соответствие между функциями и их определениями:
A. mutate_at
B. transmute
C. mutate
D. изменяет определенные переменные по имени
E. добавляет новые переменные во фрейм данных и удаляет существующие переменные
F. добавляет новые переменные во фрейм данных, сохраняя существующие переменные
Целесообразно использовать диаграммы типа график:
Когда количество данных в наборе достаточно большое
Когда нужно показать изменения данных с течением времени
Когда нужно отобразить части одного целого
Табличные процессоры позволяют строить:
Графики
Планы
Перспективные диаграммы
Установите соответствие целей инфраструктуры Hadoop и их определений:
A. Надежность
B. Отказоустойчивость
C. Масштабируемость
D. Портируемость
E. достигается посредством создания нескольких копий данных и повторного применения логики обработки в случае сбоя
F. обнаружение сбоев и их автоматическое и применение автоматического восстановления
G. данные и их обработка распределяются в кластерах
H. возможность установки на всех видах устройств и операционных систем
Алгоритм k-средних предназначен для решения задачи:
Классификации
Кластеризации
Прогнозирования
Снижения размерности
Какие диаграммы можно использовать для построения графиков функций:
Точечные
Лепестковые
Поверхностные
Определите правильную последовательность модели распределенных вычислений MapReduce:
1 Reduce
2 предварительные
3 данные
4 выбирает
5 их
6 агрегирует
7 Map
Data Mining — это процесс обнаружения в сырых данных…
ранее сформулированных гипотез
неочевидных закономерностей
практических закономерностей
объективных закономерностей
большого количества закономерностей
Какие коэффициенты находят путем возведения в квадрат частных коэффициентов корреляции:
множественные коэффициенты детерминации;
коэффициенты множественной корреляции;
частные коэффициенты детерминации.
В какой гистограмме прямоугольники, изображающие числовые данные, располагаются друг над другом:
В гистограмме с группировкой
В нормированной гистограмме
В гистограмме с накоплением
Найдите соответствие между функцией в R и еe описанием:
A. str(оbject)
B. summаry(оbject)
C. hеad(x)
D. tаil(x)
E. Внутренняя структура объекта
F. Общая информация об объекте
G. Посмотреть начальные строки объекта
H. Посмотреть последние строки объекта
Табличные процессоры позволяют строить:
Теоретические гистограммы
Гистограммы
Практические гистограммы
Какой пакет позволяет загружать данные из листа Excel файла?
readxl
excelreadr
googlesheets
vroom
sheets_read
В каком типе гистограмм прямоугольники, являющиеся графическими изображениями числовых данных из разных наборов, располагаются друг с другом:
В объёмных гистограммах
В гистограммах с группировкой
В гистограммах с накоплением
Какие диаграммы теряют наглядность при большом количестве элементов данных и позволяют отобразить только один ряд данных:
Круговые диаграммы
Линейчатые диаграммы
Гистограммы с накоплением
Какая функция в R форматирует объект так, чтобы он красиво выглядел на экране?
format(x)
paste(…)
tolower(x)
nchar(x)
Один из объектов любой диаграммы:
Сущность диаграммы
Вид диаграммы
Название диаграммы
Какая функция в R возвращает количество знаков в строке x?
format(x)
paste(…)
tolower(x)
nchar(x)Показать/скрыть дополнительное описание
Что целесообразно создавать при необходимости сравнения значений нескольких наборов данных: Поверхностную диаграмму Графики Гистограммы Признаки и измерены в количественной шкале. Требуется выяснить, являются ли эти переменные независимыми. Для того чтобы решить эту задачу, можно преобразовать обе переменные в номинальные переменные и применить критерий хи-квадрат преобразовать обе переменные в порядковые переменные и применить ранговый критерий Спирмена применить критерий Колмогорова-Смирнова Кто создал первую модель искусственных нейронных сетей? Фрэнк Розенблатт Уоррен Мак-Каллок и Уолтер Питтс Ян Лекун Дэвид И. Румельхарт, Дж. Е. Хинтон и Рональд Дж. Вильямс Большие данные – это: Данные объемом более 10Тб Данные объемом более 100Тб Данные объемом более 150Тб Нет ограничений на минимальный объем Признаки и измерены в номинальной шкале.
Какой критерий можно применить для проверки гипотезы о независимости этих признаков? ранговый критерий Спирмена ранговый критерий Кендэла критерий хи-квадрат Фишера-Пирсона критерий, основанный на выборочном коэффициенте корреляции Укажите фактор(ы), способствовавший появлению тренда больших данных: маркетинговые кампании крупных корпораций; снижение издержек на хранение данных; появление новых технологий обработки потоковых данных; выпуск баз данных с обработкой данных в памяти. Большинство методов Data mining были разработаны в рамках … классического анализа данных теории баз данных теории искусственного интеллекта В ходе эксперимента получена реализация двумерной выборки.
Известно, что первое наблюдение (5;3), а второе (3;1). Можно сказать, что эти пары согласованы несогласованы коррелированны некоррелированны Выбор в электронной таблице данных, соответствующих определенным условиям: Сортировка Анализ Фильтрация Графическое представление числовых данных, позволяющее быстро оценить соотношение нескольких величин: Диаграмма Статистика Инфографика Деревья решений относятся к группам … статистических методов кибернетических методов логических методов методов кросс-табуляции R2 –это коэффициент множественной корреляции коэффициент множественной детерминации частным коэффициентом корреляции Для какой шкалы применимы только такие операции как равно и не равно? номинальная шкала порядковая шкала интервальная шкала Значение коэффициента корреляции расположены в диапазоне от -1 до +1 от 0 до +1 от 0 до -1 от -2 до +2 Какая функция в R приводит строку к нижнему регистру? format(x) paste(…) tolower(x) nchar(x) Известно, что коэффициент корреляции случайных величин и равен нулю.
Это означает, что линейная связь между случайными величинами и отсутствует случайные величины и линейно зависимы случайные величины и зависимы случайные величины и независимы если случайный вектор является гауссовским, то случайные величины и независимы Классификация относится к стратегии: обучения с учителем обучения без учителя обучения с подкреплением Интервальная шкала – это шкала… содержащая категории, которые могут упорядочиваться, однако разности не имеют смысла разности между значениями которой могут быть вычислены, однако их отношения не имеет смысла содержащая только категории, которые не могут упорядочиваться К технологиям, используемым для сбора и обработки Больших Данных, можно отнести: программное обеспечение оборудование социальные сети сервисные услуги СУБДД В каком типе гистограмм прямоугольники, которые отображают данные, располагаются друг над другом: В гистограммах с группировкой В гистограммах с накоплением В объёмных гистограммах Как называется гистограмма, в которой вертикальная ось имеет шкалу в процентах: Гистограмма с накоплением Гистограмма с группировкой Нормированная гистограмма с накоплением Какая функция в R используется для конвертации векторов в текстовые переменные и объединяет их в одно текстовое выражение? format(x) paste(…) tolower(x) nchar(x) Какие диаграммы аналогичны гистограммам: Линейчатые Лепестковые Круговые Не верно утверждение о том, что: Большие объёмы данных приводят к слабой их структуризации, поэтому появляется такое разнообразие данных Увеличившаяся производительность телекоммуникационных каналов привела к росту объёмов передаваемой информации Удешевление систем хранения на единицу информации привело к росту рынка больших данных Большое разнообразие источников данных Какие диаграммы с гладкими кривыми можно использовать для построения графиков функций: Линейчатые диаграммы Нормированные гистограммы с накоплением Точечные диаграммы Один из объектов любой диаграммы: Ось периодичности Ось категорий Ось постоянства Какой вид диаграмм можно использовать при большом количестве данных, необходимости отображения динамики изменения данных во времени: Циклическая гистограмма Круговая диаграмма График Доверительный интервал это - интервал от минимального до максимального значения признака среднеквадратическое отклонение интервал, содержаний оцениваемый параметр генеральной совокупности стандартная ошибка среднего Кластер можно охарактеризовать как … группу объектов, имеющих общие свойства один объект, изолированный от других группу объектов, имеющую внутреннюю однородность Табличные процессоры позволяют строить: Линейные диаграммы Линейчатые диаграммы Частичные диаграммы Корреляционное отношение изменяется в пределах от -1 до +1 от 0 до +1 от 0 до -1 от -2 до +2 Метод наименьших квадратов может применяться в случае только парной регрессии только множественной регрессии нелинейной и линейной множественной регрессии коллинеарной регрессии Как называется тип диаграмм, в котором геометрические фигуры располагаются горизонтально: Пропорциональная диаграмма Линейчатая диаграмма Гистограмма На какой вкладке размещены инструменты сортировки в Microsoft Excel: Вставка Вид Данные Один из объектов любой диаграммы: Ось движений Ось значений Ось понятий Найдите соответствие между функцией в R и еe описанием: A.
с(…) B. sеq(from, to, by=) C. list(…) D. сbind(…) E. Объединяет аргументы в вектор F. Генерирует последовательность чисел с шагом G. Создает список объектов H. Объединяет объекты по столбцам Значимость множественной корреляции оценивается по критерий Пирсона критерий Фишера критерий Лапласа критерий Романовского Как называется тип представления данных, который позволяет оценивать соотношение нескольких величин: Диаграмма График Таблица Не верно утверждение о том, что: Большие данные это данные объёма свыше 1 Тб. Проблема больших данных это проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна.
Большие данные - это тренд в области ИТ, подогреваемый маркетинговыми кампаниями крупных вендоров. Большие данные как правило не структурированы. К какому типу диаграмм относятся плоские и объёмные круговые диаграммы: К круговым диаграммам К циклопическим диаграммам К спектральным диаграммам Не верно, что закономерности, определенные с использованием технологии Data Mining должны обладать такими свойствами: быть очевидными быть неочевидными быть практически полезными быть объективными Какие типы данных используются в R: logical numeric integer attributive complex character Не верно, что технология Web Mining применяет Data Mining для анализа: Неоднородной информации Неструктурированной информации Структурированной информации Распределенной и значительной по объему информации Один из объектов любой диаграммы: Границы диаграммы Область диаграммы Очертания диаграммы Некоррелированность случайных величин означает отсутствие любой связи между ними отсутствие линейной связи между ними их независимость Определите правильную последовательность термина «Big Data»: 1 цифровой информации 2 быстро поступающей 3 неоднородной 4 огромные объемы 5 которые 6 традиционными 7 невозможно 8 обработать 9 инструментами Отметьте значимые события, повлиявшие на формирование тренда больших данных: разработка Hadoop; изобретение принципа MapReduce; разработка языка Pyhton; победа Deepblue в матче с Г.Каспаровым.
Переменная измерена в номинальной шкале, а переменная - в количественной шкале. Требуется выяснить, являются ли эти переменные независимыми. Для того чтобы решить эту задачу, можно преобразовать переменную в номинальную переменную и применить критерий хи-квадрат преобразовать переменную в количественную переменную и применить критерий для проверки независимости количественных переменных применить критерий Колмогорова-Смирнова Объём накопленных человечеством цифровых данных на 2023 год измеряется: Петабайтами Зеттабайтами Экзабайтами Йоттабайтами При проверки гипотезы о виде распределения используется критерий Пирсона критерий Фишера критерий Лапласа критерий Романовского Регрессионный и дискриминантный анализ относятся… к статистическим методам Data mining к кибернетическим методам Data mining не являются методами Data mining Найдите соответствие между понятием и его описанием A.
Data lake B. Data science C. Data mining D. Machine learning E. Хранилище больших данных в необработанном виде. F. Дисциплина, изучающая проблемы анализа, обработки и представления информации в цифровой форме. G. Интеллектуальный анализ данных с целью выявления закономерностей. H. Теория и практика разработки самообучающихся программ, большая область искусственного интеллекта. Сколько наблюдений во фрейме данных, если он содержит 42 строки и 4 колонки? 168 4 42 126 В процессе работы Data Mining программы пользователь может получить: некоторый процент недостоверных результатов только верные результаты, ложные выводы исключены только статистически достоверные результаты Сколько Петабайт в Зеттабайте 1 миллион Не верно, что Variety в контексте характеристик Big Data означает: Высокая скорость генерирования данных Разные типы данных в колонках таблиц реляционных СУБД Разнообразие отраслей, являющихся источниками данных Разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные Сто (100) студентов прошли тестирование по математическому анализу и по физике.
Пусть переменная Х- рейтинг студентов по математиче....
Список вопросов
Характеристики ответов (шпаргалок) к экзамену

