Lektsia_1_2013 (Лекции)
Описание файла
Документ из архива "Лекции", который расположен в категории "". Всё это находится в предмете "прикладная статистика" из 4 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. .
Онлайн просмотр документа "Lektsia_1_2013"
Текст из документа "Lektsia_1_2013"
Пункт 1. Статистика - что это такое?
Прикладная статистика – наука о том, как обрабатывать данные - любой вид зарегистрированной информации.
Пункт 2. Книга чисел в Ветхом Завете. Переписи населения.
Как известно, статистические методы применялись на практике (и, следовательно, были теоретически разработаны) с древних времен. В Библии Ветхий завет начинается с Пятикнижия Моисеева, и четвертая книга Пятикнижия называется «Числа». Она начинается с описания проведенной под руководством Моисея переписи военнообязанных.
1:17-46. После внимательного изучения записей, которые велись в каждом роде и в каждой семье, были отобраны годные к военной службе мужчины двадцати лет и старше; всех их пересчитали (ст. 17-19). И вот число воинов, выставленных каждым коленом:
Родоначальник колена | Число военнообязанных |
От Рувима | 46.500 (ст. 21) |
От Симеона | 59.300 (ст. 23) |
От Гада | 45.650 (ст. 25) |
… | … |
От Неффалима | 53.400 (ст. 43) |
Всего | 603.550 (ст. 46) |
С математической точки зрения они сводились к подсчетам числа попаданий значений наблюдаемых признаков в определенные градации. В дальнейшем результаты стали представлять в виде таблиц и диаграмм, как это и сейчас делает Росстат РФ. Надо признать, что по сравнению с Ветхим Заветом есть прогресс - в Библии не было таблиц. Однако нет продвижения по сравнению с работами российских статистиков конца девятнадцатого - начала двадцатого века (типовой монографией тех времен можно считать книгу, которая в настоящее время еще легко доступна). http://orlovs.pp.ru/diff/antorlov/sovrstat.htm
Пункт 3. Статистика как наука. Собрание определений термина «статистика»
Впервые термин «статистика» мы находим в художественной литературе — в пьесе Шекспира «Гамлет» (1602 г., акт 5, сцена 2). Смысл этого слова у Шекспира — знать, придворные.
Гамлет говорит Горацио: «Когда-то я считал, как наша знать, // Стыдом писать красиво».
Статистика происходит от латинского слова status, что в оригинале означает «состояние» или «политическое состояние», положение.
В течение следующих 400 лет термин «статистика» понимали и понимают по-разному. В 1972 году в МГУ коллектив авторов привел более 200 определений термина «статистика».
XVII век
У истоков статистической науки стояли две школы:
- немецкая описательная школа, или Государствоведение;
- английская школа политических арифметиков.
Описательная школа
Вначале под статистикой понимали описание экономического и политического состояния государства или его части.
Своей задачей считали описание достопримечательностей государства: (территории, населения, климата, политического устройства и т.п.) – без анализа закономерностей и связей между явлениями.
Впервые термин «статистика» был введён в научный обиход в 1749 г. немецким статистиком, профессором философии и права Готфридом Ахенвалем (1719-1772 гг.), выпустившим книгу о государствоведении, отраслью которого он считал статистику. С 1746 г. Г. Ахенваль впервые в марбургском, а затем в геттингенском университете начал читать новую учебную дисциплину, которую он назвал статистикой.
Например, к 1792 г. относится определение: «статистика описывает состояние государства в настоящее время или в некоторый известный момент в прошлом» (Людер Август Фердинанд — (Lueder, 1760-1819) немецкий историк, экономист и статистик, профессор в Геттингене и Йене). Сначала был приверженцем школы ОС, но в 1812 г. счел ее бессодержательной. И в настоящее время деятельность государственных статистических служб вполне укладывается в это определение.
Политические арифметики
Представители школы политических арифметиков (Уильям Пети – «статистика – наука об управлении», Джон Граунт) своей главной задачей считали выявление на основе большого числа наблюдений различных закономерностей и взаимосвязей в изучаемых явлениях.
Уильям Петти, по выражению Маркса, "отец политической экономии и в некотором роде изобретатель статистики".
Однако постепенно термин «статистика» стал использоваться более широко.
По Наполеону Бонапарту, «статистика — это бюджет вещей». Тем самым статистические методы были признаны полезными не только для административного управления, но и для применения на уровне отдельного предприятия.
Согласно формулировке 1833 г., «цель статистики заключается в представлении фактов в наиболее сжатой форме » (А. М. Guerry, Фр.).
Приведем еще два высказывания. Статистика состоит в наблюдении явлений, которые могут быть подсчитаны или выражены посредством чисел (1895). Статистика — это численное представление фактов из любой области исследования в их взаимосвязи (1909).
В ХХ в. статистику часто рассматривают, прежде всего, как самостоятельную научную дисциплину. Статистика есть совокупность методов и принципов, согласно которым проводится сбор, анализ, сравнение, представление и интерпретация числовых данных (1925).
Российская государственная статистика ведет свою историю с 1802 года.
Федеральная служба государственной статистики (ФСГС или Росстат)
- осуществляет функции по формированию официальной статистической информации о социальных, экономических, демографических, экологических и других общественных процессах в РФ;
- осуществляет функции по контролю в сфере статистической деятельности.
Сайт Росстата – www.gks.ru
В 1954 г. академик АН УССР Б. В. Гнеденко дал следующее определение: «Статистика состоит из трех разделов:
1) сбор статистических сведений, то есть сведений, характеризующих отдельные единицы каких-либо массовых совокупностей;
2) статистическое исследование полученных данных, заключающееся в выяснении тех закономерностей, которые могут быть установлены на основе данных массового наблюдения;
3) разработка приемов статистического наблюдения и анализа статистических данных. Последний раздел, собственно, и составляет содержание математической статистики».
http://www.aup.ru/books/m163/vv.htm - орлов книга Прикладная статистика 2004
Термин «статистика» употребляют еще в двух смыслах. Во-первых, в обиходе под «статистикой» часто понимают набор количественных данных о каком-либо явлении или процессе. Во-вторых, статистикой называют функцию от результатов наблюдений, используемую для оценивания характеристик и параметров распределений и проверки гипотез. (учебник Прикладная статистика, А.И. Орлов).
Пункт 3. Структура статистики.
Математическая статистика
Прикладная статистика
-
Статистические методы (СМ) в экономике – Эконометрика;
-
СМ в технике – Технометрика;
-
СМ в химии – Химометрия;
-
СМ в биологии – Биометрия;
-
Социально-демографическая статистика и экономическая статистика
-
СМ в госуправлении и т.п.
Большой вред развитию статистической науки и практики нанесло Всесоюзное совещание статистиков 1954 г. На нем было принято, что статистика – это одна из экономических наук, фактически – ведомственная наука ЦСУ – Госкомстата – Росстата (Федеральной службы государственной статистики). При этом организаторы совещания не посмели покуситься на само существование математической статистики, но отнесли ее исключительно к математике, в которой была выделена специальность «теория вероятностей и математическая статистика». Все остальные области применения статистических методов перестали замечаться. Стали цениться теоремы, но вопросы практики применения статистических методов стали отодвигаться на задний план.
Как реакция на уход в математику выделилась новая научная дисциплина – прикладная статистика – 1981 г. – когда вышел сборник, включающий термин «прикладная статистика». Пути ПС и МС разошлись, и ПС позиционировалась как наука об обработке данных – результатов наблюдений, измерений, испытаний, анализов, опытов (технологии сбора и обработки данных).
Новая парадигма прикладной статистики.pdf
Появление прикладной статистики. В нашей стране термин «прикладная статистика» вошел в широкое употребление в 1981 г. после выхода массовым тиражом (33940 экз.) сборника «Современные проблемы кибернетики (прикладная статистика)».
Периоды развития прикладной статистики
№ | Этапы | Характерные черты | Годы |
1 | Описательная статистика | Тексты, таблицы, графики. Отдельные расчетные приемы (МНК) обобщать первичные результаты, полученные при наблюдении или в эксперименте. Процедуры: группировка данных по их значениям, построению распределения их частот, выявление центральных тенденций распределения (например, средней арифметической) и оценка разброса данных по отношению к найденной центральной тенденции. | До 1990 |
2 | Параметрическая статистика | Модели параметрических семейств распределений – нормальных, гамма и др. Теория оценивания параметров и проверки гипотез Анализ одновременного распределения двух или более переменных и выявление отношений (связи) между ними. | 1900 - 1933 |
3 | Непараметрическая статистика | Произвольные непрерывные распределения. Непараметрические методы оценивания и проверки гипотез когда неизвестны параметры распределения исследуемой выборки или переменные измеренные в бедной шкале (например, в номинальной или порядковой) или если объемы данных недостаточны дли прим. парам. Методов. | 1933 - 1979 |
4 | Нечисловая статистика | Выборка – из элементов произвольных пространств. Использование показателей различия и расстояний объекты нечисловой природы, используется в нормативно-технической и методической документации | С 1979 |
Объекты нечисловой природы – элементы пространств, не являющихся линейными. Примерами являются бинарные отношения (ранжировки, разбиения, толерантности), множества, последовательности символов (тексты). Объекты нечисловой природы нельзя складывать и умножать на числа,
Параметрическая или непараметрическая статистика?
Иногда утверждают, что в случае, когда погрешность измерения (или иная случайная величина) определяется в результате совокупного действия многих малых факторов, то в силу Центральной Предельной Теоремы (ЦПТ) теории вероятностей эта величина хорошо приближается (по распределению) нормальной случайной величиной. Такое утверждение справедливо, если малые факторы действуют аддитивно и независимо друг от друга. Если же они действуют мультипликативно, то в силу той же ЦПТ аппроксимировать надо логарифмически нормальным распределением. В прикладных задачах обосновать аддитивность, а не мультипликативность действия малых факторов обычно не удается. Если же зависимость имеет общий характер, не приводится к аддитивному или мультипликативному виду, а также нет оснований принимать модели, дающие экспоненциальное, Вейбулла-Гнеденко, гамма или иные распределения, то о распределении итоговой случайной величины практически ничего не известно, кроме внутриматематических свойств типа регулярности.
Прикладную статистику по виду статистических данных принято делить на следующие направления:
-
статистика случайных величин (одномерная статистика);
-
многомерный статистический анализ;
-
статистика временных рядов и случайных процессов;
-
статистика нечисловых данных (ее важная часть - статистика интервальных данных).
http://www.intuit.ru/department/mathematics/appstat/11
Описание данных
Совокупность, состоящая из единиц совокупности.
1. Статистическая совокупность - множество единиц, которые имеют одинаковый один или несколько признаков, но отличающихся между собой по другим признакам.
Статистической совокупностью могут быть:
-
Физические лица (в аудитории, на предприятии, в стране).
-
Физические единицы (станки, машины).
-
Юридические лица (заводы, фермерские хозяйства, банки, ВУЗы).
Главное - указать тот признак, который позволяет объединить отдельные единицы в совокупность (иметь объединяющий один или несколько признаков).
Пример: Совокупность предприятий: объединяющим признаком может быть идентичность выпускаемой продукции, или один владелец и даже местонахождение предприятий.
Совокупность банков: основной признак - это принадлежность банков к финансовым учреждениям.
Признак – функция, определенная для единиц совокупности,
значение признака