Lektsia_3_2013 (818899)

Файл №818899 Lektsia_3_2013 (Лекции)Lektsia_3_2013 (818899)2020-12-042020-12-04СтудИзба

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла

Лекция 3

Тема 1. Вариационный ряд – понятие, построение, характеристики

Дана выборка:

Обрабатывать данные в таком виде неудобно. => Упорядочим данные так, чтобы:

В вариационном ряду элемент x(k) называется k-й порядковой статистикой.

Следующая выборочная характеристика:

Минимум

Для нашего ряда (см. пример):

Максимум

Для нашего ряда (см. пример):

Размах R – разность между n-й и первой порядковыми статистиками в выборке объема n, т.е. разность между наибольшим и наименьшим значениями в выборке: R = x(n) – x(1).

В ряде вероятностно-статистических методов принятия решений применяют и иные показатели рассеивания. В частности, в методах статистического регулирования процессов используют средний размах – среднее арифметическое размахов, полученных в определенном количестве выборок одинакового объема.

Вспомним понятие квантили:

Кванти́ль в математической статистике — значение, которое заданная случайная величина не превышает с фиксированной вероятностью.

Пусть x – случайная величина.

Функция распределения ее -

Квантиль порядка a – это число x(a) такое, что F(x(a))=a x(a)=F^-1(a)

F(x_a)=a, где x_a– квантиль порядка а.

График: квантиль x_a порядка a:

Сначала рассмотрим теоретические квантили:

а=0,5 x_0.5- медиана (теоретическая)

а=0,25 x_0.25– нижний квартиль;

а=0,75 x_0.75– верхний квартиль.

а=0,1 x_0.1– нижний дециль;

а=0,9 x_0.9– верхний дециль.

Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля от 90 % наибольших величин, лежащих выше дециля.

Выборочная медиана - результат наблюдения, занимающий центральное место в вариационном ряду, построенном по выборке с нечетным числом элементов, или полусумма двух результатов наблюдений, занимающих два центральных места в вариационном ряду, построенном по выборке с четным числом элементов. Таким образом, если объем выборки n – нечетное число…

где x(k) и x(k+1) – порядковые статистики.

Выборочный нижний квартиль

Для нашего примера:

Выборочный верхний квартиль

Для нашего примера:

Межквартильное расстояние, т.е. расстояние между выборочными квартилями x([0,75n]) и x([0,25n]) порядка 0,75 и 0,25 соответственно, где [0,75n] – целая часть числа 0,75n, а [0,25n] –целая часть числа 0,25n.

Другой вид выборочного среднего – выборочная медиана. Она определяется через порядковые статистики.

Мода выборки – наиболее часто встречающееся значение в ряду;
Амплитуда моды – количество повторений модального значения

Приведем пример:

№	Вид работников	З/П	Число	Сумма
1	Низкоквал.рабочие	100	40	4000
2	Высококвал.рабочие	200	30	6000
3	Инженеры и служащие	300	25	7500
4	Топ-менеджеры	1000	4	4000
5	Ген директор,владелец	18500	1	18500
			100	40000

Средняя ЗП:

Мода:

Амплитуда моды:

Медиана:

Мода <медианы<М(х)

НА 16 МАРТА

Тема 2. Данные с повторами (сгруппированные данные)

Построим по итогам рассмотрения примера выборочное распределение.

В качестве значений (xi) выступает доход (ЗП), в качестве количества повторов этих значений (fi) – число сотрудников с таким доходом

Значения xi	100	200	300	1000	18500
Число повторов fi	40	30	25	4	1

Выборочное среднее арифметическое

Выборочная дисперсия

- рассчитайте дома!

Выборочное среднее квадратическое отклонение

Здесь – значения признака изменяются дискретно.

Для группировки дискретных повторяющихся данных необходимо лишь перечислить все возможные встречающиеся значения выборки, а затем для каждого из них подсчитать число повторений в ряду.

В случае, если значения признака изменяются недискретно, т.е. непрерывно, и число таких значений достаточно велико, а повторов почти не наблюдается – данные целесообразно группировать с помощью интервалов.

Группировка – процесс разделения совокупности (или выборки) на группы.

Интервалы бывают

Закрытые (обе границы присутствуют)

Открытые (отсутствует либо верхняя, либо нижняя граница).

Равные и неравные.

Процесс разделения на интервалы начинается с определения равномерности изменения значений признака. Для этого значения в любом случае целесообразно упорядочить в порядке возрастания (неубывания).

Затем определяется разумное число групп, на которое будет делиться выборка.

Существует целый ряд формул для определения числа групп в группировке.

Одной из самых распространенных, но не бесспорных, является формула Стерджесса (1961 год), Sturges.

Для n результатов измерений величины, подчиняющейся нормальному распределению, число классов, используемых при построении гистограммы следует брать как

и форма полученной гистограммы будет приближаться к форме нормального распределения для достаточно большого k. Это и есть формула Стерджесса. В этом виде она попала практически во все учебники по статистике.

Существует целый ряд альтернативных формул, некоторые из которых вычисляют длину интервала, после чего определяется число требуемых классов (см. здесь).¶¶Рассмотрим пару таких формул:¶¶

Формула Скотта (Scott, 1979)¶

, где h - длина интервала, s - стандартное отклонение значений ряда измерений¶¶

Формула Фридмана Диакониса (Freedman and Diaconis, 1981)

¶ , где h - длина интервала, (IQ) - разница между верхним и нижним квартилем.¶¶Эти формулы довольно просты и обоснованы статистической теорией, и считаются предпочтительнее формулы Стерджесса.

Выбор числа интервалов группировки k при числе наблюдений n<100 – ориентировочное значение интервалов можно рассчитать с использованием формулы Хайнхольда и Гаеде:

Затем определяется шаг интервала (одного для равных интервалов и по числу интервалов для неравных интервалов) и строятся интервалы от минимума к максимуму. (СЕМИНАРЫ!..)

h=R/k

Характеристики

Тип файла

Документ

Размер

142 Kb

Материал

Лекции

Тип материала

Лекции

Предмет

Прикладная статистика

Высшее учебное заведение

МГТУ им. Н.Э.Баумана

Тип файла документ

Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.

Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.

Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.

Список файлов лекций

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.