Статистические методы — это что такое? применение статистических методов
Содержание:
- Функции
- Параметрические процедуры статистического анализа данных
- 8 техник переговоров, которые помогут добиться своего
- Вероятностно-статистическое моделирование
- Прикладная статистика
- Метод сравнения в экономическом анализе
- Виды группировки
- Связанные темы
- Информационно-аналитическая работа
- Некорректная интерпретация статистических исследований
- Методы статистики.
- Развитие представлений о статистике
- Особенности терминологии
- Метод средних величин и группировки
- Классификация
- Что такое статистическая значимость?
- Сложности внедрения
- «Это топчик!»: что думает геймер о ноутбуке ASUS ROG Zephyrus G14
- Вычислительная статистика
Функции
Расшифровка аббревиатуры говорит сама за себя. Основные функции Росстата заключаются в ведении общих данных, их сопоставлении. Но, если говорить об этом подробнее, то ещё она:
- Представляет результаты работы гражданам и гос. органам, представителям власти, средствам массовой информации (как отечественным, так и зарубежным).
- Разрабатывает методологии, позволяющие разрабатывать и совершенствовать процесс получения статистики путём наблюдения и формирования лучших вариантов. Но они должны соответствовать требованиям.
- Собирать сведения и делать из них статистические отчеты.
- Развивать информационную систему, касающуюся ее сферы деятельности.
- Обеспечивать конфиденциальность и сохранность данных, требующих засекречивания.
- Контролировать выполнение законодательства РФ касательно статистики организациями без юр. лица и гражданами с ИП.
Это неполный список. Обязательств и задач стоит много еще и потому, что данная сфера вышла на международный уровень. Членство в таких организациях требует соблюдения условий и правил, установленных в начале сотрудничества.
Параметрические процедуры статистического анализа данных
Определение 1
Параметрическая статистика – это научная дисциплина, изучающая количественную сторону массовых общественных явлений, представленных в числовой форме, и выявляющая отношения между ними.
Основанием параметрических методов являются вполне вероятные предположения о характере распределения случайной величины. Чаще всего эти методы используются в анализе экспериментальных данных и предположении нормальности распределения этих данных.
Данное предположение имеет следствие – необходимость оценки исследуемых параметров распределения. Например, в t-тесте Стьюдента, оцениваемыми параметрами являются математическое ожидание и дисперсия.
Этот тест довольно часто используют для того, чтобы сравнить средние значения двух рядов данных на однородность или неоднородность. Кроме этого делается дополнительное предположение об однородности дисперсий распределения случайных величин в двух генеральных совокупностях – данные извлечены были из них.
Метод параметрического анализа имеет достоинство, заключающееся в том, что обладает высокой мощностью, т.е. способностью избегать ошибки второго рода или β-ошибки.
Чем меньше ошибки второго рода, тем мощность теста будет выше.
Параметрические тесты требуют специальных метрических шкал для описания имеющихся данных. Интервальная шкала и шкала отношений, которую называют абсолютной шкалой, относятся к метрическим шкалам.
С помощью интервальной шкалы исследователь может выяснить отношения равенства или неравенства элементов выборки, может оценить эквивалентность интервалов.
Абсолютная шкала оценивает эквивалентность отношений между элементами множества, которые получают в ходе измерения.
Исходя из этого, метрические шкалы относятся к сильным измерительным шкалам, поэтому параметрические методы точно выражают различия в распределении случайной величины при условии истинности гипотез.
Параметрические методы статистики применяются значительно шире, потому что в теории математической статистики они лучше разработаны. С другой стороны, использование методов параметрического анализа имеет свои трудности, которые состоят в том, что априорные предположения о характере исследуемых случайных величин, могут быть неверными.
Замечание 1
Подобные случаи являются характерными для психологических исследований каких-либо ситуаций.
Использование параметрического теста Стьюдента может в какой-то степени исказить выводы – это может произойти тогда, когда сравниваются две выборки, и обнаруживается, что распределение данных отличается от нормального и дисперсии в двух выборках значительно разнятся.
Но, в большинстве случаев, некоторые отклонения от теоретически заданных предположений являются некритичными для окончательного статистического вывода, хотя серьезная угроза сохраняется.
Для смягчения жестких требований параметрических моделей, назначают специальные процедуры для коррекции принятия решения по поводу истинности статистических гипотез.
8 техник переговоров, которые помогут добиться своего
Вероятностно-статистическое моделирование
Отличие выборочных исследований от экспертных проявляется, прежде всего, в числе обследованных объектов или субъектов – в выборочных исследованиях речь обычно идет о сотнях, а в экспертных – о десятках. Зато технологии экспертных исследований гораздо изощреннее. Еще более выражена специфика в демографических или логистических моделях, при обработке нарративной (текстовой, летописной) информации или при изучении взаимовлияния факторов. Ряд иных полезных моделей рассмотрен в .
Вопросы надежности и безопасности технических устройств и технологий, теории массового обслуживания подробно рассмотрены, например, в ставших классическими монографиях .
Прикладная статистика
Прикладная статистика — это наука о том, как обрабатывать данные произвольной природы. Математической основой прикладной статистики и статистических методов анализа является теория вероятностей и математическая статистика.
Описание вида данных и механизма их порождения — начало любого статистического исследования. Для описания данных применяют как детерминированные, так и вероятностные методы. С помощью детерминированных методов можно проанализировать только те данные, которые имеются в распоряжении исследователя. Например, с их помощью получены таблицы, рассчитанные органами официальной государственной статистики на основе представленных предприятиями и организациями статистических отчётов. Перенести полученные результаты на более широкую совокупность, использовать их для предсказания и управления можно лишь на основе вероятностно-статистического моделирования. Поэтому в математическую статистику часто включают лишь методы, опирающиеся на теорию вероятностей.
В простейшей ситуации статистические данные — это значения некоторого признака, свойственного изучаемым объектам. Значения могут быть количественными или представлять собой указание на категорию, к которой можно отнести объект. Во втором случае говорят о качественном признаке.
При измерении по нескольким количественным или качественным признакам в качестве статистических данных об объекте получаем вектор. Его можно рассматривать как новый вид данных. В таком случае выборка состоит из набора векторов. Есть часть координат — числа, а часть — качественные (категоризованные) данные, то говорим о векторе разнотипных данных.
Одним элементом выборки, то есть одним измерением, может быть и функция в целом. Например, описывающая динамику показателя, то есть его изменение во времени, — электрокардиограмма больного или амплитуда биений вала двигателя. Или временной ряд, описывающий динамику показателей определенной фирмы. Тогда выборка состоит из набора функций.
Элементами выборки могут быть и иные математические объекты. Например, бинарные отношения. Так, при опросах экспертов часто используют упорядочения (ранжировки) объектов экспертизы — образцов продукции, инвестиционных проектов, вариантов управленческих решений. В зависимости от регламента экспертного исследования элементами выборки могут быть различные виды бинарных отношений (упорядочения, разбиения, толерантности), множества, нечёткие множества и т. д.
Математическая природа элементов выборки в различных задачах прикладной статистики может быть самой разной. Однако можно выделить два класса статистических данных — числовые и нечисловые. Соответственно прикладная статистика разбивается на две части — числовую статистику и нечисловую статистику.
Числовые статистические данные — это числа, вектора, функции. Их можно складывать, умножать на коэффициенты. Поэтому в числовой статистике большое значение имеют разнообразные суммы. Математический аппарат анализа сумм случайных элементов выборки — это (классические) законы больших чисел и центральные предельные теоремы.
Нечисловые статистические данные — это категоризованные данные, вектора разнотипных признаков, бинарные отношения, множества, нечёткие множества и др. Их нельзя складывать и умножать на коэффициенты. Поэтому не имеет смысла говорить о суммах нечисловых статистических данных. Они являются элементами нечисловых математических пространств (множеств). Математический аппарат анализа нечисловых статистических данных основан на использовании расстояний между элементами (а также мер близости, показателей различия) в таких пространствах. С помощью расстояний определяются эмпирические и теоретические средние, доказываются законы больших чисел, строятся непараметрические оценки плотности распределения вероятностей, решаются задачи диагностики и кластерного анализа, и т. д. (см. ).
В прикладных исследованиях используют статистические данные различных видов. Это связано, в частности, со способами их получения. Например, если испытания некоторых технических устройств продолжаются до определённого момента времени, то получаем так называемые цензурированные данные, состоящие из набора чисел — продолжительности работы ряда устройств до отказа, и информации о том, что остальные устройства продолжали работать в момент окончания испытания. Цензурированные данные часто используются при оценке и контроле надежности технических устройств.
Метод сравнения в экономическом анализе
В экономическом анализе широкое распространение нашел еще один статистический метод – метод сравнения.
В бизнес-планировании чаще всего применяется сравнение с плановыми показателями, условием которого является сопоставимость показателей в соответствии с содержанием и структурой:
- круг оцениваемых показателей,
- цена,
- структура выпуска продукции,
- реализация товара и др.
Объектом последующего анализа считается отклонение фактических данных от плановых показателей.
Существуют еще несколько методов сравнения, которые используются в экономическом анализе:
- Сопоставление с прошлыми периодами (сравниваются хозяйственные показатели текущего периода с предшествующим периодом).
- Сопоставление с лучшими показателями (например, передовым опытом), чаще всего применяется при сравнении с показателями аналогичных организаций.
Виды группировки
Под статистической группировкой понимают разделение совокупности на группы (интервалы изменения параметра) однородные в каком-либо отношении. Число таких интервалов (групп) рассчитывается по формуле Стёрджеса:
- k=1+3,322lgn{\displaystyle k=1+3,322\lg n},
где k — число интервалов, n — число наблюдений.
Существует три вида группировки: аналитическая, типологическая, структурная.
- Аналитическая группировка — позволяет выявить связь между группировками.
- Типологическая группировка — разделение исследуемой совокупности на однородные группы.
- Структурная группировка — в которой происходит разделение однородной совокупности на группы, по определенному признаку.
Типические группы: максимально однородные внутри и разнородными снаружи.
Группировки бывают первичными и вторичными.
Первичные группировки получаются в ходе статистических наблюдений. А вторичные осуществляются на основании первичной.
Связанные темы
Информационно-аналитическая работа
Огромную работу проводят территориальные органы Росстата, направляя ее на формирование полной и достоверной информации.
Открытость деятельности Росстата дает возможность различным категориям пользователей получать своевременную статистическую информацию в любой сфере жизнедеятельности нашей страны.
Из года в год, проводя анализы получаемой информации, территориальные органы стараются расширить тематику изданий в области статистики и информационно-аналитических сведений, ставя для себя ориентиры в результате изученных потребностей пользователей.
Для предоставления доступа широкому кругу пользователей к информации статистики социально-экономических процессов, которые происходят в каждом субъекте Российской Федерации, имеют активное использование официальных интернет-порталов территориальных органов статистики.
Многие территориальные органы стараются обеспечивать своевременное размещение на своих интернет-порталах различных информационных и официальных материалов и изданий не только отдельно по региону.
Но по муниципальным образованиям. Благодаря имеющимся разработанным графикам:
- ведется срочная публикация информационных вопросов, имеющих актуальность в настоящее время с содержанием основных показателей развития;
- новостные ленты имеют регулярное пополнение информацией о ведение деятельности, размещение информации о выпусках изданий по статистике;
- поддержание в действующем состоянии рубрики «Муниципальная статистика».
Для знакомства с документами, имеющих регламентирующий характер достаточно зайти в подраздел «Нормативные документы».
Нормативные документы на официальном сайте Росстата
Для размещения особенно значимой информации касательно деятельности субъектов экономической деятельности используется единый федеральный реестр.
Здесь формируется юридически значимая информация, связанная с деятельностью:
- юридических и иностранных лиц;
- физических лиц и индивидуальных предпринимателей;
- государственных органов;
- органов местного самоуправления.
Открытость информации предполагает ее представление любому нуждающемуся в ней в свободном доступе всей статистической официальной информации, которая формируется в рамках Федерального плана статработ и официальной статметодолгии.
А также формирование обратной связи с разными категориями граждан (пользователей).
Информационное размещение основных показателей, пресс-релизов, экспресс-информаций, в том числе и отдельных материалов по статистике в области торговли в оперативном режиме на официальных сайтах территориальных органов в условиях информационно-телекоммуникационной сети «Интернет» регулируется приказом Росстата.
Территориальными органами велась работа, направленная на совершенствование представления аналитических данных по вопросам, связанным с внешней торговлей.
Были использованы носители информационных материалов, которые представляются региональными органами таможни.
Основные характеристики показателей по внешнеторговому обороту со странами дальнего и ближнего зарубежья (участники СНГ) включены в сборники, записки и бюллетени.
Можно ознакомиться с динамикой вывоза некоторых видов продукции в Республику Беларусь, а также ввоза некоторых категорий продуктов из Республики Беларусь в регионы России.
Предлагаемый к ознакомлению материал носит сводный характер и в комплексе он готов представить внешнюю торговлю федеральных и региональных округов, с отображением развития международного туризма в субъектах Российской Федерации.
Некорректная интерпретация статистических исследований
Бытует мнение, что данные статистических исследований всё чаще намеренно искажают или неправильно интерпретируют, выбирая только те данные, которые являются благоприятными для ведущего конкретное исследование. Неправильное использование статистических данных может быть как случайным, так и преднамеренным. В книге Даррелла Хаффа (1954) «Как лгать при помощи статистики» излагается ряд соображений по поводу использования и неправильного применения статистических данных. Некоторые авторы также проводят обзор статистических методов, используемых в определённых областях (например, Варн, Лазо, Рамос, и Риттер (2012)). Способы, позволяющие избежать неправильного толкования статистических данных включают в себя использование надлежащей схемы и исключение предвзятости при проведении исследований. Злоупотребление происходит тогда, когда такие выводы «заказываются» определёнными структурами, которые намеренно или бессознательно выводят на отбор предвзятых данных или проб. При этом гистограммы, как самый простой для использования и понимания (восприятия) вид диаграммы, могут быть сделаны либо с применением обычных программ для компьютера или просто нарисованы. Большинство людей не делают попыток искать ошибки или заблуждаются сами, поэтому и не видят ошибок. Таким образом, по мнению авторов, статистические данные, чтобы быть правдой, должны быть «не причёсаны» (то есть достоверные данные не должны выглядеть идеальными). Для того, чтобы полученные статистические данные оказались правдоподобными и точными, проба должна быть репрезентативной в целом.
Методы статистики.
Для изучения
предмета статистики разработаны и
применяются специфические приемы,
совокупность которых образует методологию
статистики (методы
массовых наблюдений, группировок,
обобщающих показателей, динамических
рядов, индексный метод и т.д.). Применение
в статистике конкретных методов
предопределяется поставленными задачами
и зависит от характера исходной
информации.
Общей основой
разработки и применения статистической
методологии является
диалектический метод познания, согласно
которому общественные явления и процессы
рассматриваются в развитии, взаимной
связи и причинной обусловленности.
Знание законов общественного развития
создает фундамент, с помощью которого
можно понять и правильно истолковать
явления, подлежащие статистическому
исследованию, выбрать надлежащую
методику его изучения и анализа.
При этом статистика
опирается на такие диалектические
категории, как количество
и качество,
необходимость
и случайность,
причинность
и закономерность,
единичное
и массовое,
индивидуальное
и общее.
Статистические
методы используются комплексно
(системно). Это обусловлено сложностью
процесса экономико-статистического
исследования, состоящего из трех основных
стадий:
первая –
сбор первичной статистической информации;
вторая
– статистическая сводка и обработка
первичной информации;
третья
– обобщение и интерпретация статистической
информации;
На первой
стадии
статистического исследования, в связи
с необходимостью учета всего многообразия
фактов и форм осуществления
социально-экономических процессов и в
соответствии с их массовым характером,
применяется метод
массового статистического наблюдения,
обеспечивающий
всеобщность, полноту и представительность
(репрезентативность) полученной первичной
информации.
На второй
стадии –
собранная в ходе массового наблюдения
информация подвергается обработке
методом
статистических группировок, позволяющим
выделить в изучаемой совокупности
социально-экономические типы; совершается
переход от характеристики единичных
фактов к характеристике данных,
объединенных в группы величин. Методы
группировки различаются в зависимости
от задач исследования и качественного
состояния первичного материала.
На третьей
стадии
проводится анализ
статистической информации на
основе применения обобщающих
статистических показателей:
абсолютных, относительных и средних
величин, вариации, тесноты связи и
скорости изменения социально-экономических
явлений во времени, индексов и др.
Проведение анализа позволяет проверить
причинно-следственные связи изучаемых
явлений и процессов, определить влияние
и взаимодействия различных факторов,
оценить эффективность принимаемых
управленческих решений, возможные
экономические и социальные последствия
складывающихся ситуаций.
При изучении
статистической информации широкое
применение имеют табличный
и графический
методы.
Статистическая
методология получила развитие в работах
видных отечественных ученых-статистиков:
В.С. Немчинова, С.Г. Струмилина, В.Н.
Старовского, В.И. Хотимского, Б.С.
Ястремского, А.Я.Боярского, Т.В. Рябушкина,
Н.К. Дружинина и др.
Статистическая
методология представляет собой
совокупность общих правил (принципов)
и специальных приемов, и методов.
Статистические методы можно сгруппировать
в соответствии с этапами статистического
исследования (табл. 1), (рис. 1).
Таблица 1
Классификация
статистических методов
Этапы |
Группа |
Сбор |
— |
Первичная |
— Группировка — Сводка — |
Представление |
— Статистические — |
Анализ |
— Метод обобщающих
— Выборочный
— Метод средних
— Вариационный
— Корреляционный
— Метод динамических — |
Рис.
1. Строение статистической методологии
Выбор того или
иного статистического метода зависит
от объекта и цели исследования.
Развитие представлений о статистике
Начало статистической практики относится примерно ко времени возникновения государства. Первой опубликованной статистической информацией можно считать глиняные таблички Шумерского царства (III — II тысячелетия до н. э.).
Сначала под статистикой понимали описание экономического и политического состояния государства или его части. Например, к 1792 году относится определение: «статистика описывает состояние государства в настоящее время или в некоторый известный момент в прошлом». И в настоящее время деятельность государственных статистических служб вполне укладывается в это определение.
Однако постепенно термин «статистика» стал использоваться более широко. По Наполеону Бонапарту, «статистика — это бюджет вещей». Тем самым статистические методы были признаны полезными не только для административного управления, но и для применения на уровне отдельного предприятия. Согласно формулировке 1833 года, «цель статистики заключается в представлении фактов в наиболее сжатой форме». Во 2-й половине XIX — начале XX веков сформировалась научная дисциплина — математическая статистика, являющаяся частью математики.
В XX веке статистику часто рассматривают прежде всего как самостоятельную научную дисциплину. Статистика есть совокупность методов и принципов, согласно которым проводится сбор, анализ, сравнение, представление и интерпретация числовых данных. В 1954 году академик АН УССР Б. В. Гнеденко дал следующее определение: «Статистика состоит из трёх разделов:
- сбор статистических сведений, то есть сведений, характеризующих отдельные единицы каких-либо массовых совокупностей;
- статистическое исследование полученных данных, заключающееся в выяснении тех закономерностей, которые могут быть установлены на основе данных массового наблюдения;
- разработка приёмов статистического наблюдения и анализа статистических данных». Последний раздел, собственно, и составляет содержание математической статистики.
Термин «статистика» употребляют ещё в двух смыслах. Во-первых, в обиходе под «статистикой» часто понимают набор количественных данных о каком-либо явлении или процессе. Во-вторых, статистикой называют функцию от результатов наблюдений, используемую для оценки характеристик и параметров распределений и проверки гипотез.
Особенности терминологии
Статистику рассматривают в качестве специфичной науки, системы госорганов, а также как набор цифр. Между тем далеко не все цифры можно считать статистикой. Разберемся в этом вопросе.
Для начала следует вспомнить, что слово «статистика» имеет латинские корни и происходит от понятия status. В буквальном переводе термин означает «определенное положение предметов, вещей». Следовательно, статистическими признаются только такие данные, с помощью которых фиксируются относительно устойчивые явления. Анализ, собственно, и выявляет эту устойчивость. Его используют, к примеру, при изучении социально-экономических, политических явлений.
Метод средних величин и группировки
С помощью использования метода средних величин происходит обобщение совокупности типичных показателей, сравнение изучаемого признака по различным совокупностям. В экономическом анализе используют следующие величины:
- среднеарифметическую величину,
- среднегармоническую величину,
- среднегеометрическую величину и др.
Группировка представляет собой классификацию явлений и процессов, причин и факторов, которые их обусловили. В процессе экономического анализа происходит:
- установление причинной связи,
- определение взаимосвязи показателей,
- выявление факторов и проведение факторного анализа (один из показателей, который получен в результате группировки, определяется в качестве фактора, воздействующего на другой фактор, а тот считается результатом влияния первого).
Классификация
К статистическим методам экономического анализа относятся разные приемы. Стоит сказать, их насчитывается довольно много. Однако ведущий специалист в сфере менеджмента качества в Японии К. Исикава рекомендует использовать семь основных методов:
- Диаграммы Парето.
- Группировка сведений по общим признакам.
- Контрольные карты.
- Причинно-следственные диаграммы.
- Гистограммы.
- Контрольные листки.
- Диаграммы разброса.
Руководствуясь собственным опытом в сфере менеджмента, Исикава утверждает, что 95% всех вопросов и проблем на предприятии можно решить, используя эти семь подходов.
Что такое статистическая значимость?
Эксперимент начинается с нулевой гипотезы, которая утверждает, что нет никакой связи между двумя явлениями, для которых будут собираться данные. Если цель эксперимента состоит в том, чтобы найти или продемонстрировать какой-то тип взаимосвязи или влияние, нулевая гипотеза равносильна утверждению, что эксперимент «потерпел неудачу».
Статистическая значимость – это математический критерий, который мы можем использовать, чтобы решить, следует ли нам принять или отвергнуть нулевую гипотезу.
Статистически значимый результат на основе заранее определенного порога вероятности указывает на то, что мы должны отклонить нулевую гипотезу; другими словами, что-то действительно произошло (связь наблюдалась, было произведено влияние, связь существует), и поэтому эксперимент выявил что-то потенциально значимое или интересное.
Явления, управляемые случайными процессами, обычно приводят к нормальному распределению значений. Таким образом, общепринято представлять концептуальную нулевую гипотезу в виде гауссовой кривой, что означает, что это распределение наблюдений, которое мы ожидаем, когда одна экспериментальная переменная не зависит от другой экспериментальной переменной.
Рисунок 1 – Если мы предполагаем, что нулевая гипотеза верна, мы часто будем использовать гауссову кривую в качестве функции плотности вероятности, с помощью которой мы решаем, является ли результат статистически значимым.
Сложности внедрения
В отечественной практике существует ряд препятствий, не позволяющих использовать статистические методы изучения показателей. Сложности возникают вследствие:
Отсутствия у большей части специалистов и руководителей предприятий адекватного понимания сущности и значение приемов, важности осмысления, преобразования и использования информации.
Незнания как самих статистических методов, так и порядка их применения.
Отсутствия у большей части специалистов опыта обработки эмпирической информации.
Недоверия к достоверности полученных результатов.
Отсутствия ясных, удобных для восприятия без привлечения математического аппарата пособий
«Это топчик!»: что думает геймер о ноутбуке ASUS ROG Zephyrus G14
Вычислительная статистика
Развитие вычислительной техники во второй половине XX века оказало значительное влияние на статистику. Ранее статистические модели были представлены преимущественно линейными моделями. Увеличение быстродействия ЭВМ и разработка соответствующих численных алгоритмов послужило причиной повышенного интереса к нелинейным моделям таким, как искусственные нейронные сети, и привело к разработке сложных статистических моделей, например обобщённая линейная модель и иерархическая модель.
Получили широкое распространение вычислительные методы, основанные на повторной выборке как критерий перестановок и бутстреппинг, наряду методы как семплирование по Гиббсу позволили более доступно использовать байесовские алгоритмы. В настоящее время существует разнообразное статистическое программное обеспечение общего и специализированного назначения.