logo search
Вероятностно-статистический анализ продаж автомобилей BMW

1.2 Основные функции MathCad, предназначенные для решения задач математической статистики

Познакомимся с основными функциями Mathcad, предназначенными для решения задач математической статистики, а также с методами ввода данных для последующей статистической обработки.

Ввод и вывод файлов данных.

При решении практических задач статистического анализа данных чаще всего приходится иметь дело с большими объемами исходной информации. Зачастую такие данные представляют собой заранее введенные в файл аппаратными средствами экспериментальные данные, подготовленные специальными приложениями и сохраненные в файле таблицы чисел. Ниже будет рассказано о том, как в Mathcad можно генерировать последовательности случайных чисел. Такие последовательности позволяют имитировать результаты реальных измерений той или иной случайной величины. При многократном использовании больших массивов данных их удобно хранить в файлах на диске.

Mathcad предоставляет пользователю специальные функции ввода данных из файла на диске и вывода данных в файл, т.е. функции доступа к файлам - READ, WRITE, APPEND, READPRN, WRITEPRN, APPENDPRN. Подробное описание этих функций и правила работы с ними можно найти в литературе по пакету, во встроенном в систему справочнике, в руководстве пользователя.

Познакомимся подробнее с функциями READ(file) и WRITE(file), предназначенными соответственно для чтения и записи числового значения. Файл данных для Mathcad - это файл чисел, записанных в формате ASCII, разделенных пробелом, запятой или символом концах строки. Числа могут быть целыми или с плавающей запятой, записанными с десятичной точкой или в экспоненциальной форме. При обращении к файлу Mathcad по умолчанию обращается в ту папку (каталог, директорию), из которой загружался рабочий документ или в которую документ последний раз загружался. Однако можно работать с файлами из любых папок, указывая полное имя файла.

Функция READ(file) считывает значение из файла и присваивает его переменной. Поскольку чаще всего читаются массивы чисел, обращение к функции записывается следующим образом: Xi:= READ(fiie).

Функция WRITE(file) записывает в файл на диске числовое значение

переменной. Поскольку, как правило, записываются массивы чисел, то чаще всего она указывается следующим образом: WRITE(file):= хi. Если файла с указанным именем не существует, то он будет создан; если такой файл есть, то при записи предыдущая информация будет потеряна.

Функции вычисления выборочных характеристик.

Первичная обработка данных состоит обычно в отыскании максимального x max и минимального x min значений выборки, а также в построении вариационного ряда - массива выборочных значений занумерованных (записанных) в порядке возрастания. Для выполнения этих вычислений в Mathcad предназначены соответственно функции max(A), min(A) и sort(A).

Кроме того, Mathcad имеет шесть функций, вычисляющих точечные оценки параметров распределения случайной величины. В последующих разделах главы даны все необходимые определения и описаны методы получения оценок. Здесь приведем только определения функций и правила обращения к ним. Следующие четыре функции вычисляют числовые характеристики выборки, cодержащейся в массиве А размерности т х п.

Функция mean(A) вычисляет значение выборочного среднего.

Функция var(A) вычисляет смещенную точечную оценку дисперсии называемую выборочной дисперсией.

Функция stdev(A) определяет среднеквадратичное отклонение.

Функция median(A) вычисляет медиану - величину, меньше и больше которой в выборке содержится одинаковое количество элементов.

Еще две функции предназначены для вычисления числовых харак-. теристик двумерного случайного вектора, выборочные значения двух компонент которого расположены соответственно в массивах А и В размерности т х n. Функция cvаr(A,B) вычисляет значение выборочной ковариации.

Построение эмпирических распределений.

Наиболее наглядной формой графического представления выборок является гистограмма. В Mathcad для построения гистограмм предназначена функция hist(?,A). Для того чтобы построить гистограмму, нужно сначала сгруппировать выборочные данные, записанные в массиве A, и сохранить граничные точки интервалов группировки в векторе ?, размерность которого равна числу интервалов. Результат вычислений функции hist(?,A) - вектор, каждый элемент которого равен количеству выборочных значений, попадающих в соответствующий интервал группировки.

Размерность вектора hist(?,A) совпадает с размерностью вектора ? и равна числу интервалов группировки. Если д 1,…,д m -длины интервалов группировки, a x1,…,xm их середины и hj =nj /n относительные частотыпопадания наблюдений в J-Й интервал группировки, то можно построить изображение ступенчатой функции f(x) = hj /дj в виде столбчатой диаграммы, которая называется гистограммой.

Используя функцию hist(?,A), можно построить полигон частот - ломаную линию, соединяющую точки с абсциссами, равными серединам интервалов группировки, и ординатами, равными соответствующим частотам.

Моделирование выборок из стандартных распределений.

Mahtcad обладает богатой библиотекой встроенных функций, предназначенных для генерирования выборок из генеральных совокупностей с наиболее распространенными стандартными распределениями. Например, для генерации нормального распределения предназначена функция rnorm(k,µ,у), значением которой является вектор, содержащий k выборочных значений нормально распределенной случайной величины с математическим ожиданием Mо=µ и дисперсией Dо=у2. Ниже приведен список функций Mathcad, генерирующих выборки:

* Бета-распределение: rbeta(k,s1,s2).

* Биномиальное распределение: rbinom(k,n,p).

* Распределение Коши: rcauchy(k,l,s)

* ч2- распределение: rchisq(k,d)

* Экспоненциальное распределение: rexp(k,r).

* Распределение Фишера (F-распределение): rF(k,m,n).

* Гамма-распределение: rgamma(k,s).

* Геометрическое распределение: rgeom(k,p).

* Логнормальное распределение: rlnorm(k,µ,у).

* Логистическое распределение: rlogis(k,l,s).

* Отрицательное биномиальное распределение: rnbinom(k,n,p).

* Нормальное распределение: rnorm (k,µ,у).

* Распределение Пуассона: rpois(k,л).

* Распределение Стьюдента: rt(k,d).

* Равномерное распределение: runif(k,a,b)

* Распределение Вейбулла: rweibull(k,s).