logo
статистика экономическая - 2003

Вариационный ряд, полигон и гистограмма

Рядами распределения называются числовые ряды, характеризующие структуру совокупности по некоторому признаку. Ряд распределения может быть получен в результате структурной группировки. Ряд распределения, образованный по количественному признаку (вариационный ряд), может быть дискретным (признак принимает ограниченное число возможных значений, например 2,3,4,5) или интервальным (значения признака выражены вещественными числами или число возможных значений признака достаточно велико).

Характеристиками ряда являются:

xi варианта (отдельное возможное численное значение признака)

(i=1,k);

ni частота (численность отдельных групп);

n − общее число элементов совокупности;

qi частость (доля отдельных групп во всей совокупности).

Вариационный ряд оформляется в виде таблицы, где в первой графе указываются варианты (интервалы) значений признака, а в следующих − частота и частость.

Ряд распределения в целом характеризует структуру совокупности по данному признаку. Однако могут использоваться и кумулятивные ряды, т.е. ряды накопленных частот (частостей).

Накопленная частота (частость) − это число (доля) элементов совокупности, у которых значения признака не превышают данного.

Обозначим

F(x) − накопленная частота для данного значения x;

G(x) − накопленная частость для данного значения x.

Эти характеристики обладают следующими свойствами:

Рассмотрим интервал с номером i : [xi xi+1]

Накопленная частота на конец i-го интервала определяется по формуле

Вариационный ряд можно изобразить в виде графика.

Изображением дискретного ряда является полигон. При его построении по оси абсцисс откладываются варианты (xi), а по оси ординат − частоты или частости − fi. Затем точки с координатами (xi;fi) последовательно соединяются отрезками прямой.

Изображением интервального ряда является гистограмма. При ее построении по оси абсцисс откладываются интервалы ряда. Над осью абсцисс строится прямоугольник, основанием которого является интервал, а высотой − значение частоты или частости.

Изображением ряда накопленных частот является кумулята. Накопленные частоты откладываются по оси ординат для границ интервалов и соединяются отрезками прямых.

Пример 1. Распределение квартир дома по числу жителей приведено в таблице. Построить полигон и кумуляту.

Число живущих в квартире

xi

Число квартир

(частота)

ni

Накопленная частота

Fi

1

2

2

2

3

5

3

10

15

4

23

38

5

9

47

6

2

49

7

1

50

ВСЕГО

50

Пример 2. Распределение банков по степени риска приведено в таблице. Построить гистограмму и кумуляту.

Степень риска, %

Доля банков

(частость)

qi

Накопленная частость

Gi

0-10

0,61

0,61

10-20

0,04

0,65

20-30

0,35

1,00

ВСЕГО

1,00

  1. СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ

  1. Средняя арифметическая

,

,

где xi −варианта или середина интервалаi-й группы;

ni − частота i-й группы;

k − количество групп.

  1. Медиана Ме(x)

Медиана представляет собой такое значение признака, которое делит объем совокупности пополам в том смысле, что число элементов совокупности со значениями признака, меньшими медианы, равно числу элементов совокупности со значениями признака, большими медианы.

Численное значение медианы можно определить по ряду накопленных частот. Накопленная частота для медианы равна половине объема совокупности:

.

Для интервального ряда сначала определяется интервал, в котором будет находиться медиана. Само же значение Ме(x) может быть приближенно определено с помощью интерполяции

,

где x0 − начало интервала, содержащего медиану;

 − величина интервала, содержащего медиану;

F(x0) − накопленная частота на начало интервала, содержащего медиану;

n − объем совокупности;

n0 − частота интервала, в котором расположена медиана.

  1. Мода Мо(Х) – наиболее часто встречающееся значение признака в совокупности.

Для дискретного ряда это то значение признака, которому соответствует наибольшая частота распределения.

Для интервального ряда вначале определяется интервал, содержащий моду (с наибольшей частотой). Затем приближенно вычисляется значение моды по формуле

где х0 – начало интервала, содержащего моду;

− величина интервала;

n0 – частота интервала, в котором расположена мода;

n-1 – частота интервала, предшествующего модальному;

n1 – частота интервала, следующего за модальным.

  1. СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ ВАРИАЦИИ

  1. Выборочная дисперсия () – это среднее значение квадратов отклонений индивидуальных значений признака от средней величины:

- для несгруппированных данных:

,

- для сгруппированных данных

.

Если ряд интервальный, то в качестве xi берется середина i-го интервала.

Более удобны следующие формулы вычислений:

(для несгруппированных данных)

(для сгруппированных данных),

  1. Среднее квадратическое отклонение () представляет собой квадратный корень из дисперсии

.

Этот показатель является средним квадратическим отклонений значений признака от средней.

  1. Коэффициент вариации характеризует относительную величину варьируемости признака в данной совокупности (по отношению к среднему значению)

.

Пример.

Имеются сгруппированные данные по зарплате

Зарплата, тыс. р.

Середина интервала xi

Частоты ni

Накопленные частоты Fi

8,6 − 9,4

9,0

2

2

9,4 − 10,2

9,8

6

8

10,2 − 11,0

10,6

15

23

11,0 − 11,8

11,4

23

46

11,8 − 12,6

12,2

25

71

12,6 − 13,4

13,0

17

88

13,4 − 14,2

13,8

7

95

14,2 −15,0

14,6

5

100

Итого

100

Найдем медиану. В данном случае . Эта величина больше 46, но меньше 71, следовательно, медиана находится в интервале (11,8 - 12,6). Рассчитаем ее значение

Найдем моду по этим данным. Мода находится в том же интервале, так как максимальная частота (25) приходится на этот интервал.

.

Средняя арифметическая

.

Выборочная дисперсия

.

Среднее квадратическое отклонение

Коэффициент вариации

%.

Задание 2.

  1. На основе структурной группировки по второму показателю, полученной в задании 1, построить гистограмму и кумуляту.

  2. Вычислить по сгруппированным данным:

  1. АБСОЛЮТНЫЕ И ОТНОСИТЕЛЬНЫЕ СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ. ВЫЧИСЛЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ ОТНОСИТЕЛЬНЫХ ПОКАЗАТЕЛЕЙ.

Под абсолютными показателями в статистике понимают исходные показатели статистического наблюдения (объем продукции, количество населения и т. д.). Они могут быть как моментными (на определенный момент времени), так и интервальными (за определенный период). Любая абсолютная величина (показатель) имеет присущую ей единицу измерения (штуки, килограммы, метры и т. д.). Часто в качестве абсолютных показателей используют стоимостные показатели (в рублях).

Под относительными показателями в статистике понимают показатели, характеризующие соотношение двух абсолютных показателей (ВНП на душу населения, производительность труда, себестоимость продукции и т. д.).

Различают относительные величины структуры, координации, динамики, сравнения и интенсивности.

Относительные величины структуры показывают долю каждой группы в общей численности совокупности. Их получают путем деления численности каждой группы на численность всей совокупности.

Относительные величины координации получают как соотношение между частями одной совокупности. Например, это может быть отношение числа мужчин к числу женщин.

Относительные величины динамики – это результат сопоставления уровней одного и того же показателя в разные моменты или периоды времени. Например, сопоставляя объем добычи нефти в России в 2009 г. и 2008 г., получим относительную величину динамики.

Относительные величины сравнения получают в результате сопоставления двух одноименных показателей, относящихся к разным совокупностям. Например, при сравнении величины основных фондов двух разных регионов.

Относительные величины интенсивности получают, сопоставляя разноименные признаки одной совокупности. Например, коэффициент рождаемости равен отношению числа родившихся детей к числу жителей, а себестоимость продукции равна отношению полных затрат к объему выпуска продукции.

Для расчета средних значений относительных величин используются формулы различных взвешенных средних в зависимости от экономического смысла показателей. В статистике используются различные виды средних величин.

Наиболее часто применяются следующие средние величины:

- средняя арифметическая;

- средняя гармоническая;

- средняя геометрическая;

- средняя квадратическая.

Все указанные средние величины можно рассчитать по общей формуле степенной средней

Если данные сгруппированы, то

Последние две формулы позволяют получить различные виды средних при разных значениях m (см. таблицу).

Вид степенной средней

m

Формула расчета простой средней

Формула расчета взвешенной средней

Гармоническая

-1

Геометрическая

Арифметическая

1

Квадратическая

2

Средняя арифметическая, средняя гармоническая, средняя геометрическая и средняя квадратическая, рассчитанные для одних и тех же исходных данных, отличаются друг от друга. При этом всегда выполняется следующее соотношение:

Приведем несколько примеров использования средних взвешенных зависимостей.

Пример 1. Найдем средний коэффициент выполнения плана по предприятиям отрасли.

Пусть – план i-го предприятия;

относительный показатель выполнения плана (в долях);

n – число предприятий отрасли.

Тогда фактический объем выпуска продукции составит

Плановый объем выпуска продукции по отрасли

Средний показатель выполнения плана по отрасли

Этот показатель представляет собой средневзвешенное арифметическое показателей с весами, соответствующими плану производства - .

Пример 2. Найдем среднюю скорость движения автомобиля, если он проехал расстояние S1 со скоростью v1, а затем расстояние S2 со скоростью v2. Для нахождения средней скорости надо разделить суммарное расстояние S1 + S2 на суммарное время, затраченное на этот путь. Суммарное время в пути будет равно

Таким образом, средняя скорость составит

В общем случае при наличии n участков с различной скоростью

Нетрудно видеть, что средняя скорость представляет собой средневзвешенное гармоническое из скоростей на отдельных участках пути с весами, равными длине участков пути.