Для студентов МФПУ «Синергия» по предмету Математика для анализа данныхМатематика для анализа данныхМатематика для анализа данных
5,0055
2023-11-172023-11-17СтудИзба
СИНЕРГИЯ Математика для анализа данных Тест 85 баллов 2023 год
Бестселлер
Описание
СИНЕРГИЯ Математика для анализа данных
МТИ МосТех МосАП МФПУ Синергия Тест оценка ОТЛИЧНО (85 баллов) 2023 год
Задания
1. Data Mining — это процесс обнаружения в сырых данных…
*ранее сформулированных гипотез
* неочевидных закономерностей
*практических закономерностей
*объективных закономерностей
*большого количества закономерностей
2. R2 –это
*коэффициент множественной корреляции
* коэффициент множественной детерминации
*частным коэффициентом корреляции
3. Алгоритм k-средних предназначен для решения задачи:
*Классификации
* Кластеризации
*Прогнозирования
*Снижения размерности
4. Большие данные – это:
*Данные объемом более 10Тб
*Данные объемом более 100Тб
*Данные объемом более 150Тб
*Нет ограничений на минимальный объем
5. Большинство методов Data mining были разработаны в рамках …
*классического анализа данных
*теории баз данных
*теории искусственного интеллекта
6. В какой гистограмме прямоугольники, изображающие числовые данные, располагаются друг над другом:
*В гистограмме с группировкой
*В нормированной гистограмме
* В гистограмме с накоплением
7. В каком типе гистограмм прямоугольники, которые отображают данные, располагаются друг над другом:
*В гистограммах с группировкой
* В гистограммах с накоплением
*В объёмных гистограммах
8. В каком типе гистограмм прямоугольники, являющиеся графическими изображениями числовых данных из разных наборов, располагаются друг с другом:
*В объёмных гистограммах
* В гистограммах с группировкой
*В гистограммах с накоплением
9. В процессе работы Data Mining программы пользователь может получить:
*рый процент недостоверных результатов
*только верные результаты, ложные выводы исключены
* только статистически достоверные результаты
10. В ходе эксперимента получена реализация двумерной выборки. Известно, что первое наблюдение (5;3), а второе (3;1). Можно сказать, что эти пары
* согласованы
*несогласованы
*коррелированны
*некоррелированны
11. Выбор в электронной таблице данных, соответствующих определенным условиям:
*Сортировка
*Анализ
* Фильтрация
12. Графическое представление числовых данных, позволяющее быстро оценить соотношение нескольких величин:
* Диаграмма
*Статистика
*Инфографика
13. Деревья решений относятся к группам …
*статистических методов
*кибернетических методов
*логических методов
*методов кросс-табуляции
14. Для какой шкалы применимы только такие операции как равно и не равно?
* номинальная шкала
*порядковая шкала
*интервальная шкала
15. Доверительный интервал это-
*интервал от минимального до максимального значения признака
*среднеквадратическое отклонение
* интервал, содержаний оцениваемый параметр генеральной совокупности
*стандартная ошибка среднего
16. Значение коэффициента корреляции расположены в диапазоне
* от -1 до +1
*от 0 до +1
*от 0 до -1
*от -2 до +2
17. Значимость множественной корреляции оценивается по
*критерий Пирсона
* критерий Фишера
*критерий Лапласа
*критерий Романовского
18. Известно, что коэффициент корреляции случайных величин и равен нулю. Это означает, что
* линейная связь между случайными величинами и отсутствует
*случайные величины и линейно зависимы
*случайные величины и зависимы
*случайные величины и независимы
* если случайный вектор является гауссовским, то случайные величины и независимы
19. Интервальная шкала – это шкала…
*содержащая категории, которые могут упорядочиваться, однако разности не имеют смысла
*разности между значениями которой могут быть вычислены, однако их отношения не имеет смысла
*содержащая только категории, которые не могут упорядочиваться
20. К какому типу диаграмм относятся плоские и объёмные круговые диаграммы:
* К круговым диаграммам
*К циклопическим диаграммам
*К спектральным диаграммам
21. К технологиям, используемым для сбора и обработки Больших Данных, можно отнести:
*программное обеспечение
*оборудование
*социальные сети
*сервисные услуги
* СУБДД
22. Как называется гистограмма, в которой вертикальная ось имеет шкалу в процентах:
*Гистограмма с накоплением
*Гистограмма с группировкой
* Нормированная гистограмма с накоплением
23. Как называется тип диаграмм, в котором геометрические фигуры располагаются горизонтально:
*Пропорциональная диаграмма
* Линейчатая диаграмма
*Гистограмма
24. Как называется тип представления данных, который позволяет оценивать соотношение нескольких величин:
* Диаграмма
*График
*Таблица
25. Какая функция в R возвращает количество знаков в строке x?
*format(x)
*paste(…)
*tolower(x)
* nchar(x)
26. Какая функция в R используется для конвертации векторов в текстовые переменные и объединяет их в одно текстовое выражение?
*format(x)
* paste(…)
*tolower(x)
*nchar(x)
27. Какая функция в R приводит строку к нижнему регистру?
*format(x)
*paste(…)
* tolower(x)
*nchar(x)
28. Какая функция в R форматирует объект так, чтобы он красиво выглядел на экране?
* format(x)
*paste(…)
*tolower(x)
*nchar(x)
29. Какие диаграммы аналогичны гистограммам:
* Линейчатые
*Лепестковые
*Круговые
30. Какие диаграммы можно использовать для построения графиков функций:
* Точечные
*Лепестковые
*Поверхностные
31. Какие диаграммы с гладкими кривыми можно использовать для построения графиков функций:
*Линейчатые диаграммы
*Нормированные гистограммы с накоплением
* Точечные диаграммы
32. Какие диаграммы теряют наглядность при большом количестве элементов данных и позволяют отобразить только один ряд данных:
* Круговые диаграммы
*Линейчатые диаграммы
*Гистограммы с накоплением
33. Какие коэффициенты находят путем возведения в квадрат частных коэффициентов корреляции:
*множественные коэффициенты детерминации;
*коэффициенты множественной корреляции;
* частные коэффициенты детерминации.
34. Какие типы данных используются в R:
*logical
*numeric
*integer
*attributive
*complex
* character
35. Какой вид диаграмм можно использовать при большом количестве данных, необходимости отображения динамики изменения данных во времени:
*Циклическая гистограмма
*Круговая диаграмма
* График
36. Какой вид связи изображен на рис 1..
*обратно пропорциональная связь
*вязь отсутствует
*прямо пропорциональная связь
*связь нелинейная
37. Какой пакет позволяет загружать данные из листа Excel файла?
*readxl
* excelreadr
*googlesheets
*vroom
*sheets_read
38. Какой пакет позволяет загружать данные из листа Excel файла?
*readxl
* excelreadr
*googlesheets
*vroom
*sheets_read
39. Классификация относится к стратегии:
* обучения с учителем
*обучения без учителя
*обучения с подкреплением
40. Кластер можно охарактеризовать как …
*группу объектов, имеющих общие свойства
*один объект, изолированный от других
*группу объектов, имеющую внутреннюю однородность
41. Корреляционное отношение изменяется в пределах
*от -1 до +1
* от 0 до +1
*от 0 до -1
*от -2 до +2
42. Коэффициент вариации определяется по формуле:
*1
*2
* 3
*4
43. Кто создал первую модель искусственных нейронных сетей?
*Фрэнк Розенблатт
* Уоррен Мак-Каллок и Уолтер Питтс
*Ян Лекун
*Дэвид И. Румельхарт, Дж. Е. Хинтон и Рональд Дж. Вильямс
44. Метод наименьших квадратов может применяться в случае
*только парной регрессии
*только множественной регрессии
* нелинейной и линейной множественной регрессии
*коллинеарной регрессии
45. На какой вкладке размещены инструменты сортировки в Microsoft Excel:
*Вставка
*Вид
* Данные
46. Найдите соответствие между функцией в R и еe описанием:
A. str(оbject)
B. summаry(оbject)
C. hеad(x)
D. tаil(x)
E. Внутренняя структура объекта
F. Общая информация об объекте
G. Посмотреть начальные строки объекта
H. Посмотреть последние строки объекта
47. Найдите соответствие между функцией в R и еe описанием:
A. с(…)
B. sеq(from, to, by=)
C. list(…)
D. сbind(…)
E. Объединяет аргументы в вектор
F. Генерирует последовательность чисел с шагом
G. Создает список объектов
H. Объединяет объекты по столбцам
48. Не верно утверждение о том, что:
*Большие объёмы данных приводят к слабой их структуризации, поэтому появляется такое разнообразие данных
*Увеличившаяся производительность телекоммуникационных каналов привела к росту объёмов передаваемой информации
*Удешевление систем хранения на единицу информации привело к росту рынка больших данных
*Большое разнообразие источников данных
49. Не верно утверждение о том, что:
* Большие данные это данные объёма свыше 1 Тб.
*Проблема больших данных это проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна.
*Большие данные - это тренд в области ИТ, подогреваемый маркетинговыми кампаниями крупных вендоров.
*Большие данные как правило не структурированы.
50. Не верно, что Variety в контексте характеристик Big Data означает:
* Высокая скорость генерирования данных
* Разные типы данных в колонках таблиц реляционных СУБД
* Разнообразие отраслей, являющихся источниками данных
*Разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные
51. Не верно, что закономерности, определенные с использованием технологии Data Mining должны обладать такими свойствами:
* быть очевидными
*быть неочевидными
* быть практически полезными
*быть объективными
52. Не верно, что технология Web Mining применяет Data Mining для анализа:
*Неоднородной информации
*Неструктурированной информации
*Структурированной информации
*Распределенной и значительной по объему информации
53. Некоррелированность случайных величин означает
*отсутствие любой связи между ними
* отсутствие линейной связи между ними
*их независимость
54. Объём накопленных человечеством цифровых данных на 2023 год измеряется:
*Петабайтами
*Зеттабайтами
*Экзабайтами
*Йоттабайтами
55. Один из объектов любой диаграммы:
*Границы диаграммы
* Область диаграммы
*Очертания диаграммы
56. Один из объектов любой диаграммы:
*Сущность диаграммы
*Вид диаграммы
* Название диаграммы
57. Один из объектов любой диаграммы:
*Ось периодичности
* Ось категорий
*Ось постоянства
58. Один из объектов любой диаграммы:
*Ось движений
* Ось значений
*Ось понятий
59. Определите правильную последовательность термина «Big Data»:
1цифровой информации
2быстро поступающей
3неоднородной
4огромные объемы
5которые
6традиционными
7невозможно
8обработать
9инструментами
60. Отметьте значимые события, повлиявшие на формирование тренда больших данных:
* разработка Hadoop;
* изобретение принципа MapReduce;
*разработка языка Pyhton;
*победа Deepblue в матче с Г.Каспаровым.
61. Переменная измерена в номинальной шкале, а переменная - в количественной шкале. Требуется выяснить, являются ли эти переменные независимыми. Для того чтобы решить эту задачу, можно
* преобразовать переменную в номинальную переменную и применить критерий хи-квадрат
*преобразовать переменную в количественную переменную и применить критерий для проверки *независимости количественных переменных
*применить критерий Колмогорова-Смирнова
62. При проверки гипотезы о виде распределения используется
* критерий Пирсона
*критерий Фишера
*критерий Лапласа
*критерий Романовского
63. Признаки и измерены в количественной шкале. Требуется выяснить, являются ли эти переменные независимыми. Для того чтобы решить эту задачу, можно
* преобразовать обе переменные в номинальные переменные и применить критерий хи-квадрат
* преобразовать обе переменные в порядковые переменные и применить ранговый критерий Спирмена
*применить критерий Колмогорова-Смирнова
64. Признаки и измерены в номинальной шкале. Какой критерий можно применить для проверки гипотезы о независимости этих признаков?
*ранговый критерий Спирмена
*ранговый критерий Кендэла
* критерий хи-квадрат Фишера-Пирсона
*критерий, основанный на выборочном коэффициенте корреляции
65. Регрессионный и дискриминантный анализ относятся…
*к статистическим методам Data mining
*к кибернетическим методам Data mining
*не являются методами Data mining
66. Сколько наблюдений во фрейме данных, если он содержит 42 строки и 4 колонки?
* 168
*4
*42
*126
67. Сколько наблюдений во фрейме данных, если он содержит 42 строки и 4 колонки?
* 168
*4
*42
*126
68. Сколько Петабайт в Зеттабайте
69. Сто (100) студентов прошли тестирование по математическому анализу и по физике. Пусть переменная Х- рейтинг студентов по математическому анализу, а переменная Y- рейтинг по физике. Коэффициент корреляции Спирмена для переменных и оказался равным 0.6. Эта информация
* позволяет на уровне значимости 0.05 сделать вывод о том, что между показателями и существует монотонная положительная связь
*позволяет на уровне значимости 0.05 сделать вывод о том, что между показателями и существует монотонная отрицательная связь
*позволяет сделать вывод о том, что на уровне значимости 0.05 нет оснований для отклонения гипотезы о независимости показателей и
*не позволяет сделать вывод о зависимости или независимости показателей и
70. Табличные процессоры позволяют строить:
*Теоретические гистограммы
* Гистограммы
*Практические гистограммы
71. Табличные процессоры позволяют строить:
* Графики
*Планы
*Перспективные диаграммы
72. Табличные процессоры позволяют строить:
*Линейные диаграммы
*Линейчатые диаграммы
*Частичные диаграммы
73. Такие данные как температура воздуха относятся к …
*атрибутивным данным
*непрерывным данным
*дискретным данным
*альтернативным данным
74. Укажите фактор(ы), способствовавший появлению тренда больших данных:
*маркетинговые кампании крупных корпораций;
*снижение издержек на хранение данных;
*появление новых технологий обработки потоковых данных;
*выпуск баз данных с обработкой данных в памяти.
75. Услуги по построению архитектуры системы базы данных, обустройству и оптимизации инфраструктуры, и обеспечению безопасности хранения данных относятся к …
76. Установите соответствие между функциями и их определениями:
A. mutate_at
B. transmute
C. mutate
D. изменяет определенные переменные по имени
E. добавляет новые переменные во фрейм данных и удаляет существующие переменные
F. добавляет новые переменные во фрейм данных, сохраняя существующие переменные
77. Целесообразно использовать диаграммы типа график:
* Когда количество данных в наборе достаточно большое
*Когда нужно показать изменения данных с течением времени
*Когда нужно отобразить части одного целого
78. Что целесообразно создавать при необходимости сравнения значений нескольких наборов данных:
*Поверхностную диаграмму
*Графики
* Гистограммы
79. Установите соответствие целей инфраструктуры Hadoop и их определений:
A. Надежность
B. Отказоустойчивость
C. Масштабируемость
D. Портируемость
E. достигается посредством создания нескольких копий данных и повторного применения логики обработки в случае сбоя
F. обнаружение сбоев и их автоматическое и применение автоматического восстановления
G. данные и их обработка распределяются в кластерах
H. возможность установки на всех видах устройств и операционных систем
80. Найдите соответствие между понятием и его описанием
A. Data lake
B. Data science
C. Data mining
D. Machine learning
E. Хранилище больших данных в необработанном виде.
F. Дисциплина, изучающая проблемы анализа, обработки и представления информации в цифровой форме.
G. Интеллектуальный анализ данных с целью выявления закономерностей.
H. Теория и практика разработки самообучающихся программ, большая область искусственного интеллекта.
81. Определите правильную последовательность модели распределенных вычислений MapReduce:
1 Reduce
2 предварительные
3 данные
4 выбирает
5 их
6 агрегирует
7 MapПоказать/скрыть дополнительное описание
МТИ МосТех МосАП МФПУ Синергия Тест оценка ОТЛИЧНО (85 баллов) 2023 год
Задания
1. Data Mining — это процесс обнаружения в сырых данных…
*ранее сформулированных гипотез
* неочевидных закономерностей
*практических закономерностей
*объективных закономерностей
*большого количества закономерностей
2. R2 –это
*коэффициент множественной корреляции
* коэффициент множественной детерминации
*частным коэффициентом корреляции
3. Алгоритм k-средних предназначен для решения задачи:
*Классификации
* Кластеризации
*Прогнозирования
*Снижения размерности
4. Большие данные – это:
*Данные объемом более 10Тб
*Данные объемом более 100Тб
*Данные объемом более 150Тб
*Нет ограничений на минимальный объем
5. Большинство методов Data mining были разработаны в рамках …
*классического анализа данных
*теории баз данных
*теории искусственного интеллекта
6. В какой гистограмме прямоугольники, изображающие числовые данные, располагаются друг над другом:
*В гистограмме с группировкой
*В нормированной гистограмме
* В гистограмме с накоплением
7. В каком типе гистограмм прямоугольники, которые отображают данные, располагаются друг над другом:
*В гистограммах с группировкой
* В гистограммах с накоплением
*В объёмных гистограммах
8. В каком типе гистограмм прямоугольники, являющиеся графическими изображениями числовых данных из разных наборов, располагаются друг с другом:
*В объёмных гистограммах
* В гистограммах с группировкой
*В гистограммах с накоплением
9. В процессе работы Data Mining программы пользователь может получить:
*рый процент недостоверных результатов
*только верные результаты, ложные выводы исключены
* только статистически достоверные результаты
10. В ходе эксперимента получена реализация двумерной выборки. Известно, что первое наблюдение (5;3), а второе (3;1). Можно сказать, что эти пары
* согласованы
*несогласованы
*коррелированны
*некоррелированны
11. Выбор в электронной таблице данных, соответствующих определенным условиям:
*Сортировка
*Анализ
* Фильтрация
12. Графическое представление числовых данных, позволяющее быстро оценить соотношение нескольких величин:
* Диаграмма
*Статистика
*Инфографика
13. Деревья решений относятся к группам …
*статистических методов
*кибернетических методов
*логических методов
*методов кросс-табуляции
14. Для какой шкалы применимы только такие операции как равно и не равно?
* номинальная шкала
*порядковая шкала
*интервальная шкала
15. Доверительный интервал это-
*интервал от минимального до максимального значения признака
*среднеквадратическое отклонение
* интервал, содержаний оцениваемый параметр генеральной совокупности
*стандартная ошибка среднего
16. Значение коэффициента корреляции расположены в диапазоне
* от -1 до +1
*от 0 до +1
*от 0 до -1
*от -2 до +2
17. Значимость множественной корреляции оценивается по
*критерий Пирсона
* критерий Фишера
*критерий Лапласа
*критерий Романовского
18. Известно, что коэффициент корреляции случайных величин и равен нулю. Это означает, что
* линейная связь между случайными величинами и отсутствует
*случайные величины и линейно зависимы
*случайные величины и зависимы
*случайные величины и независимы
* если случайный вектор является гауссовским, то случайные величины и независимы
19. Интервальная шкала – это шкала…
*содержащая категории, которые могут упорядочиваться, однако разности не имеют смысла
*разности между значениями которой могут быть вычислены, однако их отношения не имеет смысла
*содержащая только категории, которые не могут упорядочиваться
20. К какому типу диаграмм относятся плоские и объёмные круговые диаграммы:
* К круговым диаграммам
*К циклопическим диаграммам
*К спектральным диаграммам
21. К технологиям, используемым для сбора и обработки Больших Данных, можно отнести:
*программное обеспечение
*оборудование
*социальные сети
*сервисные услуги
* СУБДД
22. Как называется гистограмма, в которой вертикальная ось имеет шкалу в процентах:
*Гистограмма с накоплением
*Гистограмма с группировкой
* Нормированная гистограмма с накоплением
23. Как называется тип диаграмм, в котором геометрические фигуры располагаются горизонтально:
*Пропорциональная диаграмма
* Линейчатая диаграмма
*Гистограмма
24. Как называется тип представления данных, который позволяет оценивать соотношение нескольких величин:
* Диаграмма
*График
*Таблица
25. Какая функция в R возвращает количество знаков в строке x?
*format(x)
*paste(…)
*tolower(x)
* nchar(x)
26. Какая функция в R используется для конвертации векторов в текстовые переменные и объединяет их в одно текстовое выражение?
*format(x)
* paste(…)
*tolower(x)
*nchar(x)
27. Какая функция в R приводит строку к нижнему регистру?
*format(x)
*paste(…)
* tolower(x)
*nchar(x)
28. Какая функция в R форматирует объект так, чтобы он красиво выглядел на экране?
* format(x)
*paste(…)
*tolower(x)
*nchar(x)
29. Какие диаграммы аналогичны гистограммам:
* Линейчатые
*Лепестковые
*Круговые
30. Какие диаграммы можно использовать для построения графиков функций:
* Точечные
*Лепестковые
*Поверхностные
31. Какие диаграммы с гладкими кривыми можно использовать для построения графиков функций:
*Линейчатые диаграммы
*Нормированные гистограммы с накоплением
* Точечные диаграммы
32. Какие диаграммы теряют наглядность при большом количестве элементов данных и позволяют отобразить только один ряд данных:
* Круговые диаграммы
*Линейчатые диаграммы
*Гистограммы с накоплением
33. Какие коэффициенты находят путем возведения в квадрат частных коэффициентов корреляции:
*множественные коэффициенты детерминации;
*коэффициенты множественной корреляции;
* частные коэффициенты детерминации.
34. Какие типы данных используются в R:
*logical
*numeric
*integer
*attributive
*complex
* character
35. Какой вид диаграмм можно использовать при большом количестве данных, необходимости отображения динамики изменения данных во времени:
*Циклическая гистограмма
*Круговая диаграмма
* График
36. Какой вид связи изображен на рис 1..
*обратно пропорциональная связь
*вязь отсутствует
*прямо пропорциональная связь
*связь нелинейная
37. Какой пакет позволяет загружать данные из листа Excel файла?
*readxl
* excelreadr
*googlesheets
*vroom
*sheets_read
38. Какой пакет позволяет загружать данные из листа Excel файла?
*readxl
* excelreadr
*googlesheets
*vroom
*sheets_read
39. Классификация относится к стратегии:
* обучения с учителем
*обучения без учителя
*обучения с подкреплением
40. Кластер можно охарактеризовать как …
*группу объектов, имеющих общие свойства
*один объект, изолированный от других
*группу объектов, имеющую внутреннюю однородность
41. Корреляционное отношение изменяется в пределах
*от -1 до +1
* от 0 до +1
*от 0 до -1
*от -2 до +2
42. Коэффициент вариации определяется по формуле:
*1
*2
* 3
*4
43. Кто создал первую модель искусственных нейронных сетей?
*Фрэнк Розенблатт
* Уоррен Мак-Каллок и Уолтер Питтс
*Ян Лекун
*Дэвид И. Румельхарт, Дж. Е. Хинтон и Рональд Дж. Вильямс
44. Метод наименьших квадратов может применяться в случае
*только парной регрессии
*только множественной регрессии
* нелинейной и линейной множественной регрессии
*коллинеарной регрессии
45. На какой вкладке размещены инструменты сортировки в Microsoft Excel:
*Вставка
*Вид
* Данные
46. Найдите соответствие между функцией в R и еe описанием:
A. str(оbject)
B. summаry(оbject)
C. hеad(x)
D. tаil(x)
E. Внутренняя структура объекта
F. Общая информация об объекте
G. Посмотреть начальные строки объекта
H. Посмотреть последние строки объекта
47. Найдите соответствие между функцией в R и еe описанием:
A. с(…)
B. sеq(from, to, by=)
C. list(…)
D. сbind(…)
E. Объединяет аргументы в вектор
F. Генерирует последовательность чисел с шагом
G. Создает список объектов
H. Объединяет объекты по столбцам
48. Не верно утверждение о том, что:
*Большие объёмы данных приводят к слабой их структуризации, поэтому появляется такое разнообразие данных
*Увеличившаяся производительность телекоммуникационных каналов привела к росту объёмов передаваемой информации
*Удешевление систем хранения на единицу информации привело к росту рынка больших данных
*Большое разнообразие источников данных
49. Не верно утверждение о том, что:
* Большие данные это данные объёма свыше 1 Тб.
*Проблема больших данных это проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна.
*Большие данные - это тренд в области ИТ, подогреваемый маркетинговыми кампаниями крупных вендоров.
*Большие данные как правило не структурированы.
50. Не верно, что Variety в контексте характеристик Big Data означает:
* Высокая скорость генерирования данных
* Разные типы данных в колонках таблиц реляционных СУБД
* Разнообразие отраслей, являющихся источниками данных
*Разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные
51. Не верно, что закономерности, определенные с использованием технологии Data Mining должны обладать такими свойствами:
* быть очевидными
*быть неочевидными
* быть практически полезными
*быть объективными
52. Не верно, что технология Web Mining применяет Data Mining для анализа:
*Неоднородной информации
*Неструктурированной информации
*Структурированной информации
*Распределенной и значительной по объему информации
53. Некоррелированность случайных величин означает
*отсутствие любой связи между ними
* отсутствие линейной связи между ними
*их независимость
54. Объём накопленных человечеством цифровых данных на 2023 год измеряется:
*Петабайтами
*Зеттабайтами
*Экзабайтами
*Йоттабайтами
55. Один из объектов любой диаграммы:
*Границы диаграммы
* Область диаграммы
*Очертания диаграммы
56. Один из объектов любой диаграммы:
*Сущность диаграммы
*Вид диаграммы
* Название диаграммы
57. Один из объектов любой диаграммы:
*Ось периодичности
* Ось категорий
*Ось постоянства
58. Один из объектов любой диаграммы:
*Ось движений
* Ось значений
*Ось понятий
59. Определите правильную последовательность термина «Big Data»:
1цифровой информации
2быстро поступающей
3неоднородной
4огромные объемы
5которые
6традиционными
7невозможно
8обработать
9инструментами
60. Отметьте значимые события, повлиявшие на формирование тренда больших данных:
* разработка Hadoop;
* изобретение принципа MapReduce;
*разработка языка Pyhton;
*победа Deepblue в матче с Г.Каспаровым.
61. Переменная измерена в номинальной шкале, а переменная - в количественной шкале. Требуется выяснить, являются ли эти переменные независимыми. Для того чтобы решить эту задачу, можно
* преобразовать переменную в номинальную переменную и применить критерий хи-квадрат
*преобразовать переменную в количественную переменную и применить критерий для проверки *независимости количественных переменных
*применить критерий Колмогорова-Смирнова
62. При проверки гипотезы о виде распределения используется
* критерий Пирсона
*критерий Фишера
*критерий Лапласа
*критерий Романовского
63. Признаки и измерены в количественной шкале. Требуется выяснить, являются ли эти переменные независимыми. Для того чтобы решить эту задачу, можно
* преобразовать обе переменные в номинальные переменные и применить критерий хи-квадрат
* преобразовать обе переменные в порядковые переменные и применить ранговый критерий Спирмена
*применить критерий Колмогорова-Смирнова
64. Признаки и измерены в номинальной шкале. Какой критерий можно применить для проверки гипотезы о независимости этих признаков?
*ранговый критерий Спирмена
*ранговый критерий Кендэла
* критерий хи-квадрат Фишера-Пирсона
*критерий, основанный на выборочном коэффициенте корреляции
65. Регрессионный и дискриминантный анализ относятся…
*к статистическим методам Data mining
*к кибернетическим методам Data mining
*не являются методами Data mining
66. Сколько наблюдений во фрейме данных, если он содержит 42 строки и 4 колонки?
* 168
*4
*42
*126
67. Сколько наблюдений во фрейме данных, если он содержит 42 строки и 4 колонки?
* 168
*4
*42
*126
68. Сколько Петабайт в Зеттабайте
69. Сто (100) студентов прошли тестирование по математическому анализу и по физике. Пусть переменная Х- рейтинг студентов по математическому анализу, а переменная Y- рейтинг по физике. Коэффициент корреляции Спирмена для переменных и оказался равным 0.6. Эта информация
* позволяет на уровне значимости 0.05 сделать вывод о том, что между показателями и существует монотонная положительная связь
*позволяет на уровне значимости 0.05 сделать вывод о том, что между показателями и существует монотонная отрицательная связь
*позволяет сделать вывод о том, что на уровне значимости 0.05 нет оснований для отклонения гипотезы о независимости показателей и
*не позволяет сделать вывод о зависимости или независимости показателей и
70. Табличные процессоры позволяют строить:
*Теоретические гистограммы
* Гистограммы
*Практические гистограммы
71. Табличные процессоры позволяют строить:
* Графики
*Планы
*Перспективные диаграммы
72. Табличные процессоры позволяют строить:
*Линейные диаграммы
*Линейчатые диаграммы
*Частичные диаграммы
73. Такие данные как температура воздуха относятся к …
*атрибутивным данным
*непрерывным данным
*дискретным данным
*альтернативным данным
74. Укажите фактор(ы), способствовавший появлению тренда больших данных:
*маркетинговые кампании крупных корпораций;
*снижение издержек на хранение данных;
*появление новых технологий обработки потоковых данных;
*выпуск баз данных с обработкой данных в памяти.
75. Услуги по построению архитектуры системы базы данных, обустройству и оптимизации инфраструктуры, и обеспечению безопасности хранения данных относятся к …
76. Установите соответствие между функциями и их определениями:
A. mutate_at
B. transmute
C. mutate
D. изменяет определенные переменные по имени
E. добавляет новые переменные во фрейм данных и удаляет существующие переменные
F. добавляет новые переменные во фрейм данных, сохраняя существующие переменные
77. Целесообразно использовать диаграммы типа график:
* Когда количество данных в наборе достаточно большое
*Когда нужно показать изменения данных с течением времени
*Когда нужно отобразить части одного целого
78. Что целесообразно создавать при необходимости сравнения значений нескольких наборов данных:
*Поверхностную диаграмму
*Графики
* Гистограммы
79. Установите соответствие целей инфраструктуры Hadoop и их определений:
A. Надежность
B. Отказоустойчивость
C. Масштабируемость
D. Портируемость
E. достигается посредством создания нескольких копий данных и повторного применения логики обработки в случае сбоя
F. обнаружение сбоев и их автоматическое и применение автоматического восстановления
G. данные и их обработка распределяются в кластерах
H. возможность установки на всех видах устройств и операционных систем
80. Найдите соответствие между понятием и его описанием
A. Data lake
B. Data science
C. Data mining
D. Machine learning
E. Хранилище больших данных в необработанном виде.
F. Дисциплина, изучающая проблемы анализа, обработки и представления информации в цифровой форме.
G. Интеллектуальный анализ данных с целью выявления закономерностей.
H. Теория и практика разработки самообучающихся программ, большая область искусственного интеллекта.
81. Определите правильную последовательность модели распределенных вычислений MapReduce:
1 Reduce
2 предварительные
3 данные
4 выбирает
5 их
6 агрегирует
7 MapПоказать/скрыть дополнительное описание
СИНЕРГИЯ Математика для анализа данных Тест 85 баллов 2023 год.
Характеристики вопросов/заданий к зачёту
Учебное заведение
Учебная пора
Программы
Теги
Просмотров
34
Размер
215,86 Kb
Список файлов
Решение.pdf
