Фондовая лекция по дисциплине «Правовая статистика», тема — Средние величины и показатели вариации. Выборочный метод.

«Санкт-Петербургская юридическая академия»
кафедра предпринимательского права










ФОНДОВАЯ ЛЕКЦИЯ
по учебной дисциплине
«ПРАВОВАЯ СТАТИСТИКА»
по теме «Средние величины и показатели вариации.
Выборочный метод»
Направление подготовки 40.03.01.(030900) Юриспруденция
квалификация ((степень) «бакалавр»)
Профиль подготовки - гражданско-правовой











Рассмотрен на заседании предметно-методической секции кафедры предпринимательского права
«____»_________________ 201__ г.

протокол № ______














Санкт-Петербург
2016
Тема № 2 «Средние величины и показатели вариации. Выборочный метод»

тема
Всего часов
Контактная
работа

СР

Приобретаемая компетенция



лекции
ПЗ



Тема 2. Средние величины и показатели вариации. Выборочный метод
22
6
6
10
ОК-9, ОК-10, ОК-12,
ПК-17



Учебные вопросы:

2.1. Средние величины.
2.2. Ряды распределения и обобщающие показатели вариации.
2.3. Понятие и научные основы выборочного метода.
2.4. Оценка результатов выборочного наблюдения.


Литература
Основная:
Правовая статистика: рекомендовано М-ом образования и науки РФ в качестве учебника для студентов вузов/под ред. В. С. Лялина, А. В. Симоненко.- 2-е изд., перераб. и доп.- М.:ЮНИТИ-ДАНА, 2014.
Правовая статистика: учебное пособие / Е.С. Янковская. – СПб.: НОУ СЮА, 2015.

Дополнительная:
Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник/ Под ред. И.И. Елисеевой. – изд., перераб. И доп. – М.: Финансы и статистика, 2010.
Общая теория статистики: учебник / М.Р. Ефимова и др. 2-е изд. – М.: ИНФРА-М, 2013.
Попаленко Е.В. Правовая статистика: учебник – М.: Юрлитинформ.: 2013.
Правовая статистика: учебник для студентов вузов / под ред. С.Я. Казанцева, С.Я. Лебедева, С.М. Иншакова. – 2-е изд., перераб. и доп. – М.: ЮНИТИ-ДАНА: Закон и право, 2012.
Практикум по социально-экономической статистике: учеб.-метод. Пособие / под ред. М.Г. Назарова. – М.: КноРус, 2014.
Статистика: учебное пособие / под ред. В.Н. Салина, Е.П. Шпаковской. 2-е изд., перераб. и доп. – М.: КноРус, 2014.
Юридическая статистика: учебник / В.В. Лунеев: Институт государства и права РАН. – 3-е изд., перераб. и доп. – М.: Норма: ИНФРА-М, 2014.


Основные дидактические единицы
Средняя величина как обобщающий статистический показатель. Правила применения средних величин.
Виды средних величин. Степенные средние и структурные средние величины. Общая формула степенной средней и преобразование ее в различные виды средних. Простые и взвешенные средние величины. Расчет средних величин из абсолютных и относительных величин. Выбор формы средней величины: средняя арифметическая, средняя геометрическая, средняя гармоническая, средняя квадратическая.
Структурные средние величины, их назначение и виды. Мода и медиана. Особенности расчета структурных средних величин в интервальных рядах распределения. Практика применения структурных средних величин.
Понятие о вариации значений признака и задачи ее статистического изучения. Вариационные ряды распределения, их ранжирование.
Анализ вариационных рядов. Показатели вариации. Абсолютные показатели вариации: размах вариации, среднее квадратическое отклонение. Математические свойства среднего квадратического отклонения (дисперсии) и упрощенный способ его расчета. Относительные показатели вариации: относительное линейное отклонение, коэффициент вариации.
Характеристики формы распределения. Эмпирические и теоретические распределения. Показатели асимметрии. Оценка существенности показателей асимметрии.
Понятие о выборочном наблюдении, его особенности и практика применения в статистике. Теоретическая основа и проблемы выборочного наблюдения. Генеральная и выборочная совокупность, их обобщающие характеристики. Виды, методы и способы отбора единиц из генеральной совокупности в выборочную.
Рассмотрение основных этапов проведения выборочного наблюдения.
Ошибка репрезентативности выборочных показателей. Основные виды ошибок выборки. Средние величины и показатели доли по выборке. Особенности расчета ошибок выборки при различных способах отбора единиц совокупности. Определение необходимого объема выборки..
Оценка результатов выборочного наблюдения. Способы распространения данных выборочного наблюдения на генеральную совокупность. Порядок расчета доверительных интервалов показателей по генеральной совокупности
Понятие о малой выборке, особенности оценки ее результатов. Методы определения предельной и средней ошибок малой выборки.

Учебно-материальное обеспечение
1. Мультимедийный проектор
2. Слайды
3. Задание для самостоятельной подготовки к практическому занятию

2.1. Средние величины
Средняя величина – это обобщающий показатель, выражающий типичное для данной однородной совокупности значение варьирующего признака. Примерами средних величин в правовой статистике могут служить: средний возраст сотрудников правоохранительных органов; средняя продолжительность рассмотрения дел в арбитражных судах и др.
Средние величины наиболее широко представлены в социально-экономической статистике. К их числу относятся средние цены, средняя оплата труда и средние душевые доходы, средняя производительность труда, средняя посещаемость музеев и театров и др. В правовой статистике конкретные разновидности средних величин не столь разнообразны. Но это компенсируется исключительно высоким аналитическим потенциалом одной средней величины в правовой статистике – числа зарегистрированный преступлений на 100000 человек населения. Этот показатель рассматривается в динамике и в территориальном разрезе, сравнивается с данными по регионам и другими странами мира. Он является индикатором уровня криминогенности в обществе и состояния общественной безопасности. Он также интерпретируется с точки зрения уровня морально-нравственного климата в обществе. Велико значение данного показателя при оценке нагрузки на правоохранительные органы и эффективности деятельности по профилактике преступности, при текущем и стратегическом планировании деятельности правоохранительных органов и при оценке потребности в их материально-техническом обеспечении.
При углубленном анализе состояния преступности используются такие средние показатели, как средний возраст лиц, совершивших преступления, и средний уровень их денежных доходов, средний срок лишения свободы у осужденных, размер материального ущерба в среднем от одного экономического преступление и др.
Широко применяются средние величины при статистическом анализе деятельности правоохранительных органов и состояния их материально-технического обеспечения. Среди этой группы показателей представлены: средний стаж работы сотрудников, их средняя оплата труда, средняя нагрузка на одного работника, средняя стоимость единицы того или иного вида имущества и др.
Средние величины могут рассчитываться как по сгруппированным, так и по не сгруппированным данным. Средние величины могут быть простыми и взвешенными. Возможны разные виды средних величин в зависимости от задачи исследования и характера рассматриваемых показателей. Различают два типа средних величин – степенные и структурные средние.
В общем виде схема расчета степенных средних величин может быть представлена приведенной ниже формулой.

Где: HYPER13 EMBED Equation.3 HYPER14HYPER15 - средняя величина;
x – индивидуальные значения признака;
m – показатель степени;
n – число единиц совокупности.

При m=1 мы получаем среднюю арифметическую, при m=2 мы получаем среднюю квадратическую, при m=0 мы получаем среднюю геометрическую, при m= -1 мы получаем среднюю гармоническую. При этом имеется следующее правило соотношения их числовых значений:


Теперь рассмотрим чем отличается каждый из данных видов средней величины.
Средняя арифметическая величина вычисляется при сохранении общего объёма признака в совокупности. Расчет выполняется чаще всего путём сложения значений изучаемого признака по всем единицам совокупности и деления полученной суммы на общее число единиц совокупности (частоту).
Показатель степени m = 1.



Если изучаемая совокупность состоит из большого числа единиц, то исходные данные представляют в сгруппированном виде (ряд распределения). Тогда среднее значение вычисляется как взвешенная средняя. Число единиц совокупности в разных группах принимается за «вес» (разные значения признака имеют разную степень значимости при расчётах). Взвешенная средняя арифметическая вычисляется по следующей формуле:
где: fi – частота или число единиц совокупности в i-ой группе;
xi – варианта или индивидуальное значение признака в i-ой группе.


Если при группировке значения признака даны как интервал, то при расчёте средней арифметической величины в качестве значения признака используется середина интервала.
Средняя арифметическая вычисляется при прямой пропорциональности между определяющим свойством и данным признаком.
Пример.
Рассмотрим общие сведения о состоянии преступности в области (33 населенных пункта) за месяц и найдем количество преступлений, приходящихся в среднем на один населенный пункт. Данные по 33 населенным пунктам области сгруппированы с выделением 5 групп с равными интервалами значений группировочного признака. Деление на группы произведено с использованием одинакового интервального шага - 4 преступления. Построим расчётную таблицу (Табл. 2), в которой, помимо исходных данных о количества преступлений и количества населенных пунктов в выделенных группах, добавим графу с обозначением середины интервала и расчетную графу (xf) - произведение частоты (число населенных пунктов) на середину интервала (количества преступлений в группе). Итоговая строка расчетной графы используется для вычисления среднего значения изучаемого признака (HYPER13 EMBED Equation.3 HYPER14HYPER15- количества преступлений в среднем на один населенный пункт).

Таблица 1. Расчётная таблица для распределения количества преступлений в среднем на один населенный пункт по области за март 2014 года (Данные условные)
Количество преступлений в населенном пункте
(варианта)
Середина интервала (х)
Кол-во населенных пунктов,
(f - частота)
xf

4-8
6
7
42

8-12
10
10
100

12-16
14
7
98

16-20
18
4
72

20-24
22
5
110

Итого:
----
33
422


Рассчитав данную таблицу, найдем количество преступлений в среднем на один населенный пункт по области за март месяц. Для проведения расчета следует использовать формулу взвешенной арифметической средней (так как данные сгруппированы) и данные итоговой строки таблицы:




Ответ: В среднем по области за март месяц приходилось по 13 преступлений на один населенный пункт.

Рассмотрим остальные формы средних величин.
Средняя квадратическая величина применяется при расчетах показателей вариации (см. тему 3) или в тех случаях, когда необходимо сохранить сумму квадратов исходной величины.




Средняя геометрическая применяется в расчетах средних темпов роста за некоторый период времени (см. тему 4) или, если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменным произведение индивидуальных величин. Также средняя геометрическая величина применяется при расчете средних значений в совокупности, где значение признака равно отдалено от максимального и минимального значения.

Средняя гармоническая применяется в анализе хозяйственной деятельности или при необходимости сохранить неизменной сумму величин, обратных индивидуальных значениям признака.




Структурные средние (мода, медиана)– это особый вид средних величин, применяемых для изучения характера внутреннего распределения единиц совокупности по изучаемому признаку. Кроме того, структурные средние могут быть использованы в качестве приближенной оценки степенной средней в условиях, когда отсутствует информация, необходимая для расчета степенной средней.
Мода (МО) – обозначает варианту, которой соответствует наибольшая частота в совокупности или в вариационном ряду. По не сгруппированным данным или по вариационному ряду с дискретными значениями вариант мода определяется непосредственно по исходным данным – это наиболее часто встречающееся значение признака. По сгруппированным данным, где варианты представлены в виде интервалов значений признака, моду определяют расчетным путем по следующей формуле:

где: модальным является интервал с наибольшей частотой;
x мо – нижняя граница модального интервала;
f мо – частота в модальном интервале;
fмо-1 – частота в интервале, предшествующем модальному;
f мо+1 – частота в следующем интервале за модальным;
i мо – величина модального интервала.
Медиана (Ме) - это значение признака, которое делит упорядоченную (ранжированную) последовательность единиц совокупности на две равные части. Как и при определении моды, по интервальным рядам распределения расчет выполняется по специальной формуле.
Медиану используют как наиболее надежный показатель среднего значения признака в условиях неоднородности ряда распределения, при резких отклонениях отдельных значений признака от средней арифметической. Рассчитывается медиана по следующей формуле:

где: медианным является первый интервал, накопленная частота которого превышает половину общей суммы частот;
x ме – нижняя граница медианного интервала;
i ме –величина медианного интервала;
f ме – частота в медианном интервале;
Sfме-1 – накопленная частота в интервале, предшествующем медианному.
Пример:
Найдём по данным из таблицы 2 модальное и медианное значения числа преступлений в области. Для этого включим в расчётную таблицу дополнительную графу накопленных частот (см. таблица 3).
Для расчёта моды определяем модальный интервал, где наибольшая частота – 10 населенных пунктов.


Для расчёта медианы возьмём группу, где накопленная частота больше половины общего количества населенных пунктов по области (половина от 33 – 16,5) – это вторая группа.


Ответ: Мода равна 10, т.е. самой распространенной вариантой является 10 преступлений на один населенный пункт. Медиана равна 12 (11,8), т.е. в половине общего числа населенных пунктов было совершено не более, чем 12 преступлений (в половине населенных пунктов было совершено не менее, чем 12 преступлений) за месяц.

Таблица 2. Расчётная таблица распределения количества преступлений в области за март 2014 года (Данные условные)
Количество преступлений

Середина интервала
(варианта)
Кол-во населенных пунктов
(частота)
xf
Накопленная частота

4-8
6
7
42
7

8-12
10
10
100
17

12-16
14
7
98
24

16-20
18
4
72
28

20-24
22
5
110
33

Итого:
х
33
422
х


2.2. Ряды распределения и обобщающие показатели вариации
Изучаемые признаки единиц однородной совокупности принимают разные значение у каждой единицы. Эти различия между единицами совокупности называются вариацией данного признака в совокупности. Причинами вариации являются различия в условиях возникновения, функционирования и развития каждой отдельной единицы данной совокупности. Чрезмерно высокая вариация, как и ее незначительный уровень могут быть препятствием к прогрессивному развитию и эффективному функционированию совокупности. Следовательно, при оценке свойств изучаемой совокупности, наряду с расчетом средних значений признаков и другими методами, актуальным направлением статистического исследования является анализ вариации признаков в совокупности. Изучение вариации – это одно из направлений сводки и группировки материалов наблюдения, в котором можно выделить три последовательных этапа.
Первым этапом статистического анализа вариации является систематизация и обобщение первичной статистической информации путем построения рядов распределения и их графиков. Второй этап состоит в расчете на основе рядов распределения системы обобщающих показателей вариации и характеристик центра распределения – средней, моды и медианы (методика расчета которых была изложена в теме 2). На третьем этапе производится интерпретация полученных обобщенных характеристик, т.е. формулируются выводы о закономерностях и важнейших тенденциях вариации исследуемой совокупности.
Статистические ряды распределения – это упорядоченное распределение единиц совокупности на группы по значениям атрибутивного (неколичественного) признака, либо по возрастанию или убыванию изучаемого количественного признака с подсчетом числа единиц совокупности в каждой группе. Соответственно, существуют два вида статистических рядов распределения:
Атрибутивные ряды распределения (группировка единиц совокупности по неколичественному признаку, т.е. не имеющему числового выражения);
Вариационные ряды распределения (группировка единиц совокупности по количественному признаку).
В свою очередь, вариационные ряды подразделяются на:
Дискретные (в подлежащем таблицы представлены все конкретные реально существующие числовые значения признака, вариация которого изучается);
Интервальные (в подлежащем таблицы представлены интервалы признака, вариация которого изучается).
Чтобы построить интервальный вариационный ряд, необходимо:
определить число выделяемых групп по формуле Стерджесса:
К = 1 + 3,32 ln n,
Где n – число выделяемых групп;
рассчитать величину интервала (i) по формуле:



где: Хmaх - максимальное значение изучаемого признака в совокупности;
Хmin - минимальное значение изучаемого признака в изучаемой совокупности;

построить подлежащее таблицы (интервального вариационного ряда) в виде «К» равных интервалов (вариант), где первый интервал начинается с максимального значения признака, а нижняя граница последнего соответствует минимальному значению изучаемого признака в совокупности (за счет округлений эта величина может быть приближенной);
построить сказуемое вариационного ряда (частоты - f), где подсчитывается число единиц совокупности в каждой выделенной группе. В итоговой строке сказуемого указывается общее число единиц совокупности (сумма f = n).
На основе построенного вариационного ряда можно в описательной форме сделать выводы о характере распределения совокупности по изучаемому признаку. При этом оцениваются степень однородности совокупности, мера и направление ассиметричности распределения, наличие одной или нескольких вершин. Для большей наглядности вариационный ряд можно представить в виде графической диаграммы – полигона распределения или гистограммы.
На основе вариационного ряда могут быть рассчитаны обобщающие показатели, дающие конкретную числовую меру масштабов и интенсивности вариации. По вариационным рядам определяются также структурные характеристики вариации – медиана распределения и мода распределения, техника расчета которых была рассмотрена в предыдущей теме.
К обобщающим показателям вариации относятся:
1. Абсолютные характеристики силы вариации - общий размах вариации и средние абсолютные размеры вариации:
Размах вариации;
Среднее линейное отклонение;
Дисперсия;
Среднее квадратическое отклонение.
2. Относительные показатели (характеристики интенсивности) вариации:
Коэффициент вариации;
Коэффициент осцилляции (относительный размах вариации);
Относительное линейное отклонение.
Теперь рассмотрим более подробно технику расчета и смысловое содержание каждого из этих показателей.
Размах вариации (амплитуда вариации) абсолютная разность между максимальным и минимальным значениями признака в изучаемой совокупности. Рассчитывается по следующей формуле:

Среднее линейное отклонение (HYPER13 EMBED Equation.3 HYPER14HYPER15) – это показатель среднего отклонения (модуля отклонения) отдельных значений варьирующего признака от их средней величины по совокупности. В правовой статистике применяется, например, для определения средней величины отклонения по субъектам РФ от соответствующего показателя по стране в целом таких характеристик, как уровень раскрываемости преступлений, число зарегистрированных преступлений на 10000 человек населения, процент женщин среди лиц, совершивших преступления, доля несовершеннолетних среди всех лиц осужденных за совершенные преступления и др.
Используются две формулы. Первая формула применяется для не сгруппированных данных (первичные данные), в качестве знаменателя используется число единиц совокупности (n). Вторая формула применяется для сгруппированных статистических данных (вариационный ряд), поэтому сумма частот по совокупности (
·f) используется в качестве знаменателя. В числителе второй формулы также учитываются частота в качестве весов, в связи с неравномерным распределением единиц совокупности по группам. Единица измерения для показателей размаха вариации, среднего линейного и среднего квадратического отклонения совпадает с единицей измерения у признака Х.

Дисперсия или квадрат среднего квадратического отклонение (HYPER13 EMBED Equation.3 HYPER14HYPER15) – наилучшая мера колеблемости признака по единицам совокупности. По своей величине среднее квадратическое отклонение чуть больше среднего линейного отклонения. Этот показатель оценивает степень однородности совокупности и широко применяется в теории вероятности, а также при измерении связи и использовании выборочного метода. Также как и среднее линейное отклонение может применяться как для не сгруппированных данных (первая формула), так и для сгруппированных (вторая формула).

Для сравнения силы вариации по разным признакам применяются относительные показатели вариации. Например, если необходимо определить, по какому из двух признаков, измеряемых в разных единицах, сильнее различия между субъектами РФ – по числу зарегистрированных преступлений в среднем на 10000 человек населения (измерено в продецимилле) или по показателю суммы ущерба в среднем на одно экономическое преступление (измерено в рублях) необходимо показатели вариации из абсолютной формы перевести в относительную, т.е. рассчитать коэффициенты вариации (HYPER13 EMBED Equation.3 HYPER14HYPER15) в процентах.
Коэффициент вариации (HYPER13 EMBED Equation.3 HYPER14HYPER15) – показатель, применяемый для сравнения силы вариаций различных признаков по совокупности и для характеристики степени однородности совокупности (совокупность считается однородной когда коэффициент вариации не превышает 33%. Если показатель превышает 50%, то совокупность является неоднородной и средними показателями пользоваться нельзя). Коэффициент вариации рассчитывается по формуле:

Коэффициент осцилляции (Ко) – относительная мера колеблемости крайних значений признака вокруг общей средней, рассчитывается по формуле:

Относительное линейное отклонение (линейный коэффициент вариации, HYPER13 EMBED Equation.3 HYPER14HYPER15) – показатель доли усредненного значения абсолютных отклонений (модуля отклонений) от средней величины, т.е. оценивает меру разброса значений изучаемого признака.

Пример:
Имеется вариационный ряд, характеризующий распределение населенных пунктов одного из субъектов РФ (данные условные) по числу совершенных в них за отчетный месяц преступлений. Необходимо рассчитать систему обобщенных показателей вариации с целью оценки степени неоднородности территории области по уровню преступности. Такая информация необходима для планирования деятельности по сокращению преступности в области.
Для облегчения расчетов показателей вариации промежуточные итоги формируются путем построения дополнительных расчетных граф (графы № 2, 4-7) в таблице 4.
Пятая и шестая графы необходимы для расчета среднего линейного отклонения по формуле для сгруппированных данных. Итоговая строка седьмой графы будет использоваться в расчете дисперсии.

Таблица 3. Расчётная таблица для построения системы обобщающих показателей вариации показателя «число преступлений в населенных пунктах области»
Количество преступлений на один населенный пункт
Середина интервала (x)
Кол-во населенных пунктов (f)
xf




1
2
3
4
5
6
7

4-8
6
·
7
42
7
49
343

8-12
10
10
100
3
30
90

12-16
14
7
98
1
7
7

16-20
18
4
72
5
20
100

20-24
22
5
110
9
45
405

Итого:
--------
33
422
------
151
945


Размах вариации. Согласно данным первой графы (таблица 4), минимальное количество, совершенных в населенных пунктах области преступлений за месяц составляет 4, а максимальное количество преступлений - 24.
R=Xmax-Xmin=24-4=20
Абсолютна разность количества преступлений в городах составляет 20 преступлений.

Среднее линейное отклонение.
Рассчитывается по формуле для сгруппированных данных. Используя расчеты, сделанные ранее (см. расчеты по данным табл. 2), находим показатель «число преступлений в среднем на один населенный пункт» – 13.



Используем итоговые значения по 3 и 6 графам расчетной таблицы № 4.
Среднее линейное отклонение от среднего значения составляет 4,58 преступлений.
Дисперсия.
Рассчитывается по формуле для сгруппированных данных. Используя результаты расчетов, сделанных ранее, возьмем среднее значение количества преступлений – 13.
Используем итоговые значения 3 и 7 граф расчетной таблицы №4.



Вычислим среднее квадратическое отклонение, извлекая квадратный корень из дисперсии:


Среднее квадратическое отклонение составляет 5,35 преступлений.
Коэффициент вариации.
Для вычисления коэффициента вариации воспользуемся предыдущими расчетами среднего квадратического отклонения(HYPER13 EMBED Equation.3 HYPER14HYPER15) и среднего количества преступлений на один населенный пункт в области(HYPER13 EMBED Equation.3 HYPER14HYPER15).


Совокупность достаточно однородная, количество преступлений по области распределяется достаточно равномерно. Следовательно, нет необходимости передислокации сил правоохранительных органов для усиления деятельности в отдельных группах населенных пунктов с особо высоким уровнем преступности.
Коэффициент осцилляции:



Относительное линейное отклонение:


Система показателей вариации включает, кроме рассмотренных выше абсолютных и относительных характеристик силы вариации, также три показателя центра распределения – среднюю, моду и медиану. Методика их расчета была рассмотрена в теме 2 при изложении вопроса о средних величинах. Их познавательная ценность состоит в том, что они позволяют оценить характер распределения – степень его симметричности. Выводы делаются на основе сопоставления числовых значений этих трех показателей.
Для строго нормального распределения:
HYPER13 EMBED Equation.3 HYPER14HYPER15
Если распределение имеет правостороннюю асимметрию, то:
HYPER13 EMBED Equation.3 HYPER14HYPER15
При левосторонней асимметрии:
HYPER13 EMBED Equation.3 HYPER14HYPER15
Чем больше различия между числовыми значениями трех показателей центра распределения, тем сильнее выражена асимметрия.
В правовой статистике показатели вариации являются одним из основных методов обобщения и анализа числовой информации. При этом доминируют простейшие приемы обработки данных – построение вариационных рядов и их графиков. Ограниченность применения обобщающих абсолютных и относительных показателей вариации в правовой статистике обусловлена тем, что среди признаков, по которым изучается вариация, преобладают характеристики, не имеющие числового выражения, называемые иногда качественными признаками. Примерами таких используемых в правовой статистике признаков могут служить: виды совершенных преступлений, способы и условия совершения преступлений, состояние в момент совершения преступления, пол преступника, его социальное положение и образование, его семейное положение и гражданства и др.


2.3. Понятие и научные основы выборочного метода.

Под выборочным наблюдением (выборкой) понимается несплошное наблюдение, при котором статистическому наблюдению подвергаются не все единицы совокупности, а лишь некоторая их часть, отобранная в строго случайном порядке, что обеспечивает минимальное смещение структуры полученной выборочной совокупности в сравнении со структурой всей (генеральной) совокупности.
Кроме выборочного, могут быть применены иные виды несплошного наблюдения – анкетное, монографическое, основного массива и др. Но только выборочный метод имеет два преимущества – возможность применения специального математического аппарата для оценки выборочных параметров и возможность на этапе планирования предстоящего обследования предусмотреть обеспечение заданной необходимой степени достоверности итоговых выборочных показателей.
Основные преимущества выборочного наблюдения перед сплошным наблюдением:
значительная экономия ресурсов (материальных, трудовых, финансовых) при сборе первичной информации;
оперативность получения первичной статистической информации;
возможность получения достоверных данных;
возможность получения статистических данных в условиях, когда сплошное наблюдение физически невозможно или экономически неэффективно.
Цель выборочного метода – определение показателей по генеральной совокупности на основе материалов выборочного наблюдения. В связи с тем, что выборочные данные всегда содержат некоторую погрешность (называемую ошибкой выборки или ошибкой репрезентативности), числовые значения показателей по генеральной совокупности не могут быть определены однозначно. С заданной вероятностью гарантируется, что величина показателя по генеральной совокупности не выйдет за пределы расчетного интервала значений.
Особого внимания требует вопрос о системе статистических показателей, получаемой на основе выборочного наблюдения. Как и при сплошном наблюдении, при выборочном наблюдении регистрации подлежат только наиболее существенные признаки единиц совокупности, т.к. именно они служат основой для расчета показателей, раскрывающих важнейшие свойства и закономерности изучаемой совокупности. Система обобщающих показателей (показателей сводки) при сплошном наблюдении включает абсолютные и относительные величины. При выборочном наблюдении система итоговых показателей содержит только относительные величины. Абсолютные показатели подсчитывать по выборке бессмысленно, т.к. их числовые значения определяются размерами совокупности, а выборочная совокупность – лишь часть генеральной совокупности.
Существует много видов относительных величин, которые могут быть определены на основе выборочного наблюдения. Но в теории и на практике основное внимание уделяется двум их видам – средним величинам (например, средний возраст лиц, совершивших преступления) и показателям доли единиц, обладающих определенным свойством (например, доля женщин среди преступников). Для каждого из этих показателей в математической статистике разработаны специальные методы оценки ошибок выборки, которые используются в статистике.
В теории выборочного метода особое значение имеет понятие ошибки выборки (репрезентативности), под которой понимается отклонение выборочного показателя от его истинного значения по генеральной совокупности. Прямой расчет ошибки выборки невозможен, т.к. неизвестно значение показателя по генеральной совокупности. Ошибку выборки рассчитывают косвенным путем на основе учета основных факторов, от которых она зависит. Но все факторы учесть невозможно, поэтому вводится понятие вероятности. С определенной вероятностью (например, 95%) гарантируется, что действительная величина ошибки выборки не превышает ее расчетного значения. В комплексе математических расчетов по выборке используются два вида ошибок выборки – средняя (стандартная) и предельная, о смысле, методике расчета и способах использования которых будет сказано в следующем параграфе.
Научные основы выборочного метода предполагают последовательное соблюдение важнейших его принципов:
- соблюдение принципа случайного отбора при формировании выборочной совокупности;
- достаточность объема выборочной совокупности, при котором сохраняется действие математического закона больших чисел;
- осуществление отбора единиц выборочной совокупности с использованием «основы выборки», т.е. полного списка единиц генеральной совокупности;
- строгая координация и согласованность при решении всех вопросов методологии и организации выборочного исследования.
Соблюдение указанных принципов имеет свою специфику в зависимости от особенностей конкретного проекта выборочного исследования. Выборочное наблюдение может быть осуществлено несколькими различными способами. Соответственно, различают виды выборки, разграничивающиеся по нескольким классификационным признакам (см. рис. 4).
Большая и малая выборки различаются тем, что расчеты выборочных показателей производятся различными методами и малые выборки отличаются большими размерами ошибок выборки. Малой считается выборка, включающая менее 30 единиц совокупности.
Организация случайного отбора предполагает отбор единиц по жребию или по таблице случайных чисел. Механический отбор осуществляется из основы выборки строго через равные интервалы.
Выборочная совокупность может формироваться либо путем отбора единиц совокупности, либо путем отбора серий, т.е. групп единиц (например выборка населения семьями, выборка студентов учебными группами). При серийном отборе обследуются все единицы в отобранных сериях. При серийной выборке менее трудоемким является сбор информации, но резко возрастают ошибки выборки.

Рисунок 1. Основные виды выборочного наблюдения

Формирование типической выборки означает, что отбор единиц из генеральной совокупности производится самостоятельно из каждого социально-экономического типа, что позволяет резко сократить величину ошибок выборки.
Повторная выборка отличается тем, что каждая отобранная единица возвращается в исходную генеральную совокупность и, следовательно, существует потенциальная возможность ее повторного отбора. Этот вид выборки на практике почти не применяется, но ее математические формулы как более простые можно использовать при очень больших объемах генеральной совокупности.
В современной практике выборочных исследований в связи со сложностью структуры и территориального размещения генеральной совокупности, как правило, комбинируются разные виды выборки. В некоторых случаях выборка комбинируется с другими видами несплошного наблюдения.
Важность обоснованного выбора вида выборочного наблюдения и строгого соблюдения соответствующих методик отбора обусловлена тем, что:
а) для каждого вида выборки предусмотрены особые алгоритмы (формулы) расчета выборочных показателей;
б) от вида выборки в значительной мере зависит величина ошибки выборки.
Не в зависимости от вида выборочного наблюдения за счёт несплошного охвата единиц наблюдения возникает ошибка выборки. Понятие ошибки выборки (ошибка репрезентативности) следует отличать от понятия «ошибка регистрации». Ошибка выборки обусловлена отклонением структуры выборочной совокупности от структуры генеральной совокупности. Это никак не связано с качеством регистрации признаков единиц наблюдения при проведении обследования. Ошибки выборки проявляются только в масштабах всей выборочной совокупности.
Ошибки регистрации возникают при проведении обследования и состоят в погрешностях записей данных об учитываемых признаках единиц совокупности. Ошибки регистрации чаще возникают при сплошных наблюдениях, т.к. при большом объеме работ труднее подобрать надежных интервьюеров и контролировать качество их работы. Ошибки регистрации могут быть случайными и систематическими.
Систематическая ошибка – возникает в связи с особенностями принятой системы отбора и обработки данных наблюдения или нарушения правил отбора.
Случайная ошибка – следствие недостаточно равномерного представления в выборке отдельных видов единиц генеральной совокупности. Существует ряд обстоятельств, обусловливающие величину случайной ошибки:
1) способ формирования выборочной совокупности;
2) степень колеблемости изучаемого признака в генеральной совокупности;
3) объем выборки.
Выборочный метод получает все большее применение в статистических исследованиях, включая правовую статистику, а также в самых различных областях научной и практической деятельности. Но его эффективность зависит от профессионализма исполнителей. Требуется строгое соблюдение требований теории и методологии выборочного метода. Одним из ключевых моментов являются полнота, своевременность и качество выполнения всех последовательных этапов и процедур выборочного исследования.
Весь комплекс процедур выборочного исследования подразделяется на три этапа:
1. Проектирование выборочного исследования.
2. Непосредственно выборочное наблюдение – сбор первичной информации по единицам выборочной совокупности.
3. Обобщение, представление и содержательный анализ результатов выборочного наблюдения.
Первый этап является исключительно ответственным, допущенные на этом этапе погрешности проявляются на последующих этапах работ и практически не устранимы. Основным содержанием работ на первом этапе являются:
- определение границ генеральной совокупности;
- составление программы наблюдения (перечня регистрируемых признаков единиц совокупности) и проекта системы итоговых выборочных показателей;
- подбор или формирование основы выборки – полного и достоверного списка единиц генеральной совокупности с их адресными данными;
- выбор и обоснование вида выборочного наблюдения;
- экспертная оценка допустимых размеров ошибок выборки и их вероятностей;
- расчет необходимого объема выборки при заданных условиях;
- проведение отбора – формирование перечня единиц выборочной совокупности;
- составление организационного плана работ: сроки проведения, потребность в кадрах и финансировании, план контрольных мероприятий, порядок проведения наблюдения и обработки результатов, ответственные лица.
Второй этап является наиболее трудоемким и включает в себя заполнение статистической документации первичного учета. Исходя из установленного графика работ, принятой методики и документов для сбора данных организуется распространение, заполнение и сдача в надлежащие органы статистической отчетности.
Третий этап включает:
- проверку качества материалов выборочного наблюдения, исправление ошибок, подготовку материалов к механизированной обработке;
- проведение цикла расчетов обобщающих выборочных показателей, расчет ошибок выборки, расчет значений показателей по генеральной совокупности с использованием ППП;
- оформление итоговых таблиц и графиков, написание аналитических текстов, предоставление полученной информации пользователям.
2.4. Оценка результатов выборочного наблюдения
В выборочном исследовании при расчете обобщающих показателей применяется специальные математические методы, что требует введения фиксированных буквенных символов для обозначения используемых числовых параметров (см. табл. 5).

Таблица 4. Условные обозначения параметров выборочной и генеральной совокупности.
Показатель
Генеральная совокупность
Выборочная совокупность

Число единиц совокупности
N
n

Среднее значение признака



Показатель доли единиц совокупности с определенными свойствами
P
W


В таблице 6 и 7 представлены основные формулы, используемые в расчётах при проведении выборочного исследования с использованием модели случайной простой выборки. Расчёт предельных ошибок выборки и доверительных интервалов значений показателей по генеральной совокупности выполняется по одинаковым формулам как для повторной выборки, так и для бесповторной.
Средняя ошибка выборки ( и ), выражает среднюю величину среднего квадратического отклонения выборочной средней от математического ожидания (средняя по генеральной совокупности) и показывает наиболее вероятную величину отклонения выборочного показателя от соответствующего параметра генеральной совокупности.

Таблица 5. Методика расчета предельных ошибок репрезентативности и определения доверительных интервалов значений показателей по генеральной совокупности
Показатель
Для средних величин
Для показателей доли


Предельная ошибка выборки



Доверительный интервал значений показателя по генеральной совокупности




Условные обозначения:
HYPER13 EMBED Equation.3 HYPER14HYPER15- предельная ошибка репрезентативности выборочной средней;
- средняя ошибка репрезентативности выборочной средней;
HYPER13 EMBED Equation.3 HYPER14HYPER15- предельная ошибка репрезентативности выборочного показателя доли;
t – коэффициент кратности средней ошибки репрезентативности (коэффициент доверия);
- средняя ошибка репрезентативности выборочного показателя доли.

Использование средней ошибки репрезентативности для оценки выборочных показателей является ненадежным, поскольку нет гарантии, что в действительности реализуется именно вариант средней ошибки. Фактическая ошибка репрезентативности может оказаться больше ее среднего значения. Лучше ориентироваться максимально возможное (предельное) значение ошибки с учетом доверительной вероятности F(t), определяющей вероятность того, что оно не будет превышено. В формулах расчета предельной ошибки репрезентативности (HYPER13 EMBED Equation.3 HYPER14HYPER15иHYPER13 EMBED Equation.3 HYPER14HYPER15), используется коэффициент кратности ошибки или нормированное отклонение (t).
Коэффициент (t), или нормированное отклонение, - это отношение ошибки репрезентативности в условиях конкретной выборки к средней квадратической ошибке. Коэффициент (t) определяется по уравнению Лапласа-Гаусса, по специальной таблице значений функции Лапраса для определения вероятности нормированного отклонения t. Обычно задается доверительная вероятность F(t)=0,95 или 0,997, которым соответствуют HYPER13 EMBED Equation.3 HYPER14HYPER15 и HYPER13 EMBED Equation.3 HYPER14HYPER15.
Конечной целью любого выборочного исследования является получение статистических показателей по генеральной совокупности путем распространения выборочных показателей на генеральную совокупность. Для этого рассчитывается доверительный интервал значений показателя по генеральной совокупности - так называемая случайная область значений параметров генеральной совокупности, которая с вероятностью достаточно близкой к 1 содержит истинное значение этого параметра.

Таблица 6. Формулы для расчёта выборочных параметров при повторной и бесповторной выборке.

Повторная выборка
Бесповторная выборка

Определение средней ошибки выборки для средних величин



Определение средней ошибки выборки для показателей доли



Определение необходимого объёма выборки для средних величин



Определение объёма выборки доли для показателя доли






Пример:
В федеральном округе, на территории которого находятся 500 городов, проведена случайная бесповторная 10-процентная выборка (отобрано 50 городов) с целью оценки интенсивности преступности в федеральном округе. В результате проведенного выборочного наблюдения получены данные о распределении 50 городов по числу преступлений, совершаемых в среднем за один день, которые представлены в графах 1, 2 таблицы 8. Используя эти результаты выборочного наблюдения, необходимо:
1. Определить с вероятностью 0,997 (t=3) предельную ошибку выборочной средней и доверительные границы, в которых находится среднее количество преступлений за день по всем 500 городам.
2. C вероятностью 0,954 (t=2) рассчитать предельную ошибку доли городов, в которых совершается более 4 преступлений в день. Каковы границы этой доли по генеральной совокупности?
Для выполнения первого задания необходимо предварительно рассчитать недостающие данные: среднее число преступлений за один день по 50 городам, дисперсию этой средней и среднюю ошибку репрезентативности для данной средней величины. Промежуточные итоги для этих расчетов представлены в графах 3-7 таблицы 8.

Таблица 7. Среднее ежедневное распределение преступлений в области.
Кол-во преступлений в день
Кол-во городов
(f)
X середина интервала
xf




1
2
3
4
5
6
7

До 2
5
1
5
3,5
17,5
61,25

2-4
12
3
36
1,5
18
27

4-6
23
5
115
0,5
11,5
5,75

Более 6
10
7
70
2,5
25
62,5

Итого
50
Х
226
Х
72
156,5

Найдем среднее число преступлений за день (HYPER13 EMBED Equation.3 HYPER14HYPER15) и дисперсию (HYPER13 EMBED Equation.3 HYPER14HYPER15):




Вычислим среднюю ошибку выборочной средней:

Определим предельную ошибку выборочной средней:
HYPER13 EMBED Equation.3 HYPER14HYPER15
Построим доверительные интервалы средней величины по генеральной совокупности:
HYPER13 EMBED Equation.3 HYPER14HYPER15
Таким образом, с вероятностью 0,997 (или 99,7%) можно утверждать, что истинное значение числа преступлений, совершаемых в среднем за один день по 5000 городам составляет не менее 3,78 преступлений и не более 5,22 преступлений. Существует 0,3-процентный риск (100 % - 99,7 %) того, что истинное значение средней по генеральной совокупности выходит за эти границы.
По второму заданию требуется произвести аналогичные расчеты для показателя доли городов, в которых за день совершается 4 и более преступлений.
Определим показатель доли по выборке:


Определим среднюю ошибку репрезентативности для показателя доли:

Определим предельную ошибку показателя доли:
HYPER13 EMBED Equation.3 HYPER14HYPER15

Построим доверительные интервалы показателя доли по генеральной совокупности:






Таким образом, с вероятностью 0,954 ( или 95,4%) подтверждается, что среди всех 500 городов доля таких городов, где за день совершается 4 и более преступлений, не превышает 78,4% и не может быть ниже 53,3%. Риск того, что истинное значение данного показателя по генеральной совокупности выходит за указанные пределы, составляет 4,5% (100% - 95,4%).
В правовой статистике выборочный метод не относится к числу основных. Важнейшие параметры должны формироваться на базе сплошного охвата всех единиц совокупности. Но есть отдельные сферы деятельности правоохранительных органов, где только выборочный метод может обеспечить получение необходимой аналитической информации. В качестве примера можно привести работу пресс-служб, которые призваны, в частности, оценивать уровень доверия граждан к правоохранительным органам, уровень информированности населения по вопросам правопорядка. Информационно-коммуникационная деятельность пресс-служб правоохранительных органов включает изучение общественного мнения по различным вопросам, оценку эффективности деятельности в сфере охраны общественного порядка и профилактики преступности. По таким направлениям деятельности информация может быть получена преимущественно на основе применения выборочного метода. Еще одной областью применения выборочного является сбор дополнительной информации об условиях содержания осужденных в местах лишения свободы, о соблюдении администрацией требований законности и нормативов жизнеобеспечения, медицинской помощи.


Разработал:
доцент кафедры предпринимательского права
к.э.н. Е.С.Янковская



HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15

HYPER13 EMBED Equation.3 HYPER14HYPER15



Root EntryEquation NativeEquation NativeИзображение 1Equation NativeИзображение 1Equation NativeИзображение 1Equation NativeИзображение 1Equation NativeИзображение 1Equation NativeEquation NativeEquation NativeEquation NativeEquation NativeСхема 1Изображение 1Equation NativeEquation NativeEquation NativeEquation NativeEquation NativeИзображение 1Equation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation Native6Equation Native

Приложенные файлы

  • doc Delo32fondl
    Размер файла: 2 MB Загрузок: 0