Анализ и прогноз величин, распределенных по закону Парето

курсовая работа

1.4 Применение распределения Парето в теории катастроф

При внимательном анализе статистических данных по крупнейшим катастрофам выясняется, что они проявляют весьма необычные особенности, плохо укладывающиеся в привычные представления. Так, при Тянь-Шанском землетрясении 28.07.1976 г. в Китае погибло (по разным источникам) от 240 до 650 тыс. чел., что в десятки тысяч раз превосходит число погибших при обычном, "рядовом" разрушительном землетрясении.

Эта же закономерность наблюдается для наводнений. При наводнении 1931 г. на реке Янцзы в Китае погибло около 1,3 млн чел. Наводнение 1970 г. в Бангладеш вызвало гибель более 500 тыс. чел. Гигантские экстраординарные значения наблюдаются и для стоимостных характеристик ущерба, что типично для наиболее экономически развитых стран. При этом перечисленные катастрофы (происшедшие в нашем столетии), по-видимому, не являются максимально возможными. Во всяком случае, летописные источники и древнейшие памятники человечества описывают еще более разрушительные катаклизмы.

Таким образом, в ряду ущербов от катастроф изредка встречаются суперэкстремальные значения, несоизмеримые по величине со значениями для подавляющей части событий. Ущерб от этих суперэкстремальных событий сравним с суммарным ущербом от всех катастроф за тот же период времени.

Рисунок 1.4 - Кумулятивная гистограмма распределения 30_ти природных катастроф за 1970-1995 гг. с наибольшим количеством жертв, подобранная кривая Парето с

На рисунке 1.4 приведена накопленная гистограмма хвоста выборочного распределения для 30 наихудших, в смысле количества человеческих жертв, природных катастроф (землетрясения, ураганы, наводнения) за 1970-1995 гг. Здесь N (xi > x) - количество событий с числом жертв xi, большим заданного аргумента x. На рисунке 1.3 изображена кривая Парето с , построенная по данным о катастрофах, по которой видно, что в логарифмическом масштабе хвост распределения хорошо приближается к прямой с угловым коэффициентом около - 0,7. Таким образом, количество событий с числом жертв, превышающим x, убывает очень медленно при x . И если при анализе "привычных" статистических зависимостей мы обыкновенно пренебрегаем возможностью очень крупных событий, лежащих на быстро убывающем "хвосте" распределения, то здесь мы этого сделать не можем. Более того, по причинам, которые будут указаны далее, можно рассматривать только "хвост", отвлекаясь от поведения распределения при малых x. Подобные распределения называются распределениями с тяжелыми хвостами. В литературе можно найти различные трактовки этого термина, суть их всех состоит в следующем: распределение с тяжелым хвостом - это распределение, хвост которого нельзя "отрезать", т.е. нельзя пренебречь крупными, но редкими событиями. Основная проблема, связанная с такими распределениями, состоит в том, что моменты достаточно высокого порядка у них расходятся. Как было показано выше, для распределения Парето с , бесконечно уже математическое ожидание. Очевидно, что на расходимость моментов влияет только тяжелый хвост распределения, "перевешивающий голову", описывающую вероятность наиболее частых, но небольших событий. Вид "головы" при этом оказывается не очень существенным, а решающую роль играет только асимптотика хвоста.

Рассмотрим распределение Парето с и . Сумма Sn накопленных эффектов событий с ростом n растет нелинейно как n1/a. Этот вывод можно получить следующим способом. Рассмотрим максимальный член mmax выборки x1, x2,… xn:

(1.18)

Распределение mmax выписывается следующим образом:

. (1.19)

Уравнение для медианы med mmax (медианой распределения называется такое число, что ровно в половине случаев случайная величина принимает значения меньше него и, соответственно, ровно в половине случаев - больше) имеет вид F n (x) = 0,5. Отсюда находим:

. (1.20)

Из этого выражения следует, что характерная величина максимального члена mmax, если в качестве этой величины взять медиану med mmax, растет с точностью до множителя как n1/a. Поскольку для неотрицательных величин Sn mmax, то мы снова убеждаемся в том, что Sn должна возрастать с ростом n нелинейно, а именно, не медленнее, чем n1/a.

На самом деле можно доказать что для распределений неотрицательных величин с тяжелыми хвостами величины Sn и mmax имеют одинаковый порядок и, более того, математическое ожидание их отношения:

(1.21)

Это свойство распределений с тяжелыми хвостами выглядит парадоксально: сумма положительных эффектов с точностью до множителя порядка 1/ (1 - ) определяется одним, максимальным членом mmax, причем этот факт справедлив для сколь угодно больших выборок. В обычной ситуации, когда у случайной величины имеются конечные моменты, отношение Sn/mmax, естественно, стремится к бесконечности с ростом n. В этой ситуации вклад любого отдельного слагаемого (в том числе и максимального) в сумму Sn стремится к нулю.

Кроме приведенных ранее можно найти другие примеры распределений с тяжелыми хвостами. Они относятся к ущербам от ураганов и землетрясений, а также к максимальным расходам воды в реках. С большой долей уверенности можно предполагать, что распределения с тяжелыми хвостами характерны не только для потерь от природных катастроф, но также и для потерь от техногенных катастроф типа Чернобыльской аварии, разливов нефти в морях в результате аварий танкеров, аварий химических предприятий, пожаров, разрушений нефтепроводов, аварий глобальных компьютерных сетей и т.п. Этот вопрос требует дальнейшего тщательного изучения.

Ниже будет теоретически показано, что в случае распределений с тяжелыми хвостами выборочные средние неустойчивы и малоинформативны из-за неприменимости закона больших чисел. Покажем неустойчивость и слабую информативность средних значений ущерба на конкретных примерах. По данным ЮНЕСКО за 1947_1960 гг. от тайфунов, ураганов, наводнений погибло 900 тыс. чел., что за год в среднем составило 64300 жертв. Если сравнить это среднегодовое значение с числом жертв от отдельных катастроф, то оказывается, что эти последние могут быть в десятки раз больше. Так, при наводнениях в Китае в 1931 г. погибло около 1 300 тыс. чел., а в 1938 г. - 500 тыс. чел., в 1970 г. в Бангладеш жертвами наводнения стали более 500 тыс. чел. Ясно, что среднегодовые показатели не дают представления о возможности таких гигантских катастроф. О неустойчивости среднегодового значения числа жертв говорит следующий факт. По материалам каталога, подготовленного в рамках Международной программы Десятилетия борьбы со стихийными бедствиями, среднегодовое число жертв за 1962 - 1992 годы от тех же катастроф составило 36000. Уменьшение среднегодового числа жертв, по сравнению с периодом 1947-1960 гг., почти в два раза было бы большим успехом, если бы оно не носило случайного характера.

Случайность уменьшения числа жертв продемонстрируем на примере землетрясений - наиболее изученного вида катастроф. Согласно подборке данных проф. Н.В. Шебалина (Институт физики Земли РАН) в 1947_1970 гг. от землетрясений погибло 151 тыс. чел., что дает среднегодовое число жертв 6300. В то же время, по данным за 1962_1992 гг. число жертв от землетрясений составило 577 600 чел., т.е., несмотря на успехи сейсмостойкого строительства, среднегодовое число погибших увеличилось до 18600 чел. Таким образом, среднегодовые показатели разнятся втрое, причем оба показателя много меньше максимальных потерь от единичного события (при землетрясении 28.07.1976 в Китае погибло, по меньшей мере, 240 тыс. чел.). Из приведенных примеров безо всякого специального анализа видно, что среднегодовые значения весьма неустойчивы и потому неинформативны.

Делись добром ;)