logo
Анализ поведения финансовых индексов с помощью методов математической статистики на примере курса Центрального банка валютной пары евро/рубль

1.2 Построение интервального статистического ряда и гистограммы

Полученный первичный статистический материал подлежит дальнейшей обработке, прежде всего упорядочению. Результаты наблюдений над случайной величиной, необходимо расположить в порядке возрастания, т.е. проранжировать выборку.

Интервальный статистический ряд - это таблица, в которой приведены интервалы значений признака и относительные частоты попадания признака в эти интервалы(См.[1]).

Интервальный статистический ряд строится для непрерывных случайных величин и для дискретных случайных величин с большим числом вариант, в нем определены границы для непрерывно варьируемого признака (См.[4]). Интервалы будем брать с одинаковой длиной, число интервалов рассчитывается по формуле Стерджеса:

k = 1+1.4 ln (n) , (1.2)

где k - число интервалов, n - объем выборки.

Длина интервала определяется по формуле

. (1.3)

Находим наименьшее и наибольшее значение в выборке, а также число интервалов и длину интервалов (Рисунок 3). Отступаем на полшага h от наименьшего значения выборки. Промежуточные интервалы получаем прибавляя к концу предыдущего интервала длину частичного интервала h (в данном случае h=0,0304095) (См.[2]).

Рисунок 3. Интервалы карманов

Таблица частот при этом имеет вид (Рисунок 4):

Рисунок 4. Интервальный статистический ряд

Первый столбец полученной таблицы -- это квантиль данного для распределения доходностей/убытков, второй- частота попадания доходностей в тот или иной интервал.

Для наглядного изображения интервального ряда распределения построим гистограмму доходностей, с помощью всторенного модуля Анализ данных/ Гистограмма (Рисунок 5). Гистограмма доходностей представлена на Рисунке 6 (См.[2]).

Рисунок 5. Модуль Анализ данных

Рисунок 6. Гистограмма