logo
Стохастическое моделирование и прогноз загрязнения атмосферы с использованием нелинейной регрессии

1. ОБЗОР И ПОСТАНОВКА ЗАДАЧИ

Основная задача данной работы краткосрочный прогноз максимальных концентраций загрязняющих примесей. Рабочая гипотеза состоит в том, что формирование опасного загрязнения воздуха на достаточно большой территории города обусловлено процессами рассеивания антропогенных выбросов, то есть, процессами, регулярно встречающихся при обычных технологических режимах работы промышленных источников или в суточном ходе изменения в интенсивности движения автотранспорта. Задача прогноза последствий аварийных выбросов вредных веществ в атмосферу вследствие нарушения технологических процессов на предприятиях в данной работе не рассматривается.

Количественной оценкой наибольшего загрязнения может служить максимальная (CМАХ) из измеренных за день концентраций на посту. Измеренные на каком-то конкретном посту концентрации значительно варьируются в течение суток за счет изменчивости:

- выбросов,

- «внешних» метеорологических условий,

- локальных флуктуаций концентраций, связанных с флуктуациями локальных метеопараметров, определяющих перенос и рассеивание примесей.

При переходе к дневным максимумам влияние локальных флуктуаций сильно уменьшается, уменьшается также роль систематических изменений выбросов в течение суток, так что связь с внешними метеорологическими условиями становится более устойчивой.

Решение основной задачи работы сводится к разработке метода прогноза максимальной за день концентрации в точке наблюдения. При такой постановки задачи необходимо выполнение следующего требования: разрабатываемый метод должен быть эффективным как для области часто наблюдаемых значений, так и для высоких квантилей (экстремумов) функции распределения CМ.

При наличии многолетних рядов наблюдения за загрязнением атмосферы для этой цели можно применить хорошо разработанный математический аппарат регрессионного анализа. Он позволяет на основе статистического анализа зависимостей между переменными прогнозировать одну из них, если известны значения других.

Воспользуемся для решения поставленной задачи методом регрессионного анализа с определенными преобразованиями - достаточно простым и удобным математическим аппаратом.

В рамках регрессионного анализа модель представляется в виде:

, (1)

где СМАХ - предиктант (в нашем случае максимальная концентрация рассматриваемой примеси за сутки), xi - предикторы (в качестве предикторов используют различные метеорологические характеристики), а bi - коэффициенты регрессии, которые требуется оценить.

вектор ошибки (остатка). Предполагается, что независимая случайная величина, имеющая нормальное распределение N(0, 2).

Уравнение решается методом наименьших квадратов, т.е. из условия минимума среднего квадрата ошибок. После того как определены параметры bi, получаем прогностическое уравнение, которое отличается от исходного модельного уравнения тем, что не содержат случайной ошибки.

Успешное применение выбранного математического аппарата требует обеспечить выполнение следующих условий: двумерное (совместное) распределение плотности вероятности переменных (предиктанта с каждым из предикторов) подчиняется нормальному закону; форма связи между переменными должна быть близкой к линейной. При этом, однако, заранее известно, что экстремумы случайной величины обычно не распределены нормально, и что связи между предикторами и предиктантом могут оказаться нелинейными. Поэтому перед тем, как строить уравнение регрессии, необходимо преобразовать переменные таким образом, чтобы линеаризовать и нормализовать соответствующие связи.

После соответствующих преобразований переменных, включающих нормализацию предиктанта и предварительное исключение нелинейности связей, получаем рабочее уравнение:

, (2)

Задача с преобразованными предикторами решается методом пошагового регрессионного анализа. Данный вид анализа позволяет включать в схему только те факторы, которые имеют значимую корреляцию с показателями загрязнения. Применение такого аппарата обусловлено тем, что нет никакой гарантии, что между используемыми предикторами отсутствует тесная корреляционная связь. Если же такая связь существует, то соответствующая система уравнений метода наименьших квадратов, используемая для определения коэффициентов в уравнении регрессии, оказывается плохо обусловленной, а ее решение может привести к накоплению вычислительных ошибок.

После того как определены параметры bi, получаем прогностическое уравнение. По этому уравнению рассчитываются прогностические значения максимальной концентрации загрязняющей примеси. Применимость этого уравнения проверяется его испытанием на независимой выборке.

Из значений СМАХ и СМАХПРОГ, полученных с использованием прогностических уравнений по зависимому и независимому рядам, формируется таблица результатов прогноза и рассчитываются статистические характеристики эффективности прогноза максимальной концентрации примеси.

Исходные данные для разработки стохастических моделей были предоставлены ГУ «ГГО» по таким городам, как Санкт-Петербург, Обнинск, Милан, Мадрид, Новосибирск и др.