logo search
Вероятностно-статистический анализ продаж автомобилей BMW

1.3 Способы решения задач математической статистики в MS Excel с помощью встроенных формул и используя меню «Анализ данных»

Математические функции.

СЧЕТЕСЛИ - количество непустых ячеек в указанном диапазоне, удовлетворяющем заданному критерию. Позволяет рассчитать количество ячеек внутри указанного интервала, которые удовлетворяют заданному критерию. СЧЕТЕСЛИ(интервал, критерий). где интервал - интервал, в котором подсчитывается количество ячеек; критерий - критерий в форме числа, выражения или текста, который определяет, какие ячейки необходимо подсчитывать. Например, критерий может быть выражен следующим образом: 25, «25», >25, «дома». Пример. Пусть ячейки В3:И6 содержат 32, 54, 76, 86 соответственно: СЧЕТЕСЛИ (В3:В6;”>55?) равняется 2. ЧИСЛОКОМБ - количество комбинаций для заданного числа объектов. Рассчитывает количество комбинаций для заданного числа объектов. Функция ЧИСЛОКОМБ может использоваться для определения числа всех возможных сочетаний объектов. Пример. Необходимо сформировать группу из четырех человек, при условии, что имеется десять кандидатов. Тогда общее число различных групп составит: ЧИСЛОКОМБ(10;4) равняется 210. СУММЕСЛИ - сумма ячеек, определенных по заданному критерию. Позволяет просуммировать ячейки, определенные заданным критерием. СУММЕСЛИ(интервал;критерий; сумм_интервал) где интервал - интервал вычисляемых ячеек; критерий - критерий в форме числа, выражения или текста, который определяет, какая ячейка суммируется с другими. Например, критерий может быть выражен как 25, «25», >25, «дома»; сумм_интервал - ячейки для суммирования. Эти ячейки суммируются в том случае, если соответствующие им ячейки в аргументе интервал удовлетворяют критерию. Если аргумент сумм_интервал опущен, то суммируются ячейки в аргументе интервал. Пример. Пусть ячейки А2:А6 содержат величины стоимости для пяти объектов: 100000 руб., 200000 руб., 300000 руб., 400000 руб., 500000 руб. соответственно. Пусть ячейки С1:С4 содержат величины комиссионных при продаже объектов: 9000 руб., 15000 руб., 22000 руб., 29000 руб., 36000 руб. СУММЕСЛИ(А2:А6;”>210000?;С1:С4) равняется 66000 руб.

Статистические функции.

КОРЕЛЛ - связь между двумя множествами данных. Данная функция позволяет рассчитать коэффициент корреляции между двумя интервалами ячеек. Коэффициент корреляции обычно используется для определения взаимосвязи между двумя свойствами объекта. КОРЕЛЛ (массив1;массив2) где массив1 - первый интервал ячеек; массив2 - второй интервал ячеек. Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа. Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки с нулевыми значениями учитываются. Функция КОРЕЛЛ выдает значение ошибки #Н/Д в том случае, если массив1 и массив2 имеют различное количество данных и значение ошибки #ДЕЛ/0! в том случае, если массив1 или массив2 пуст, или, если отклонение их значений равно нулю. Пример. КОРЕЛЛ({3;2;4;5;6};{9,7,12,15,17} равняется 0,997054. МАКС - максимальное значение из списка чисел. Позволяет рассчитать наибольшую величину из набора числовых значений. МАКС(число1;число2;…) где число1, число2,… - до 30 чисел, среди которых ищется максимальное значение. Можно задавать аргументы, которые являются числами, пустыми ячейками, логическими значениями или текстовыми представлениями чисел. Аргументы, которые являются значениями ошибки или текстами, не преобразуемыми в числа, вызывают ошибку. Если аргумент является массивом или ссылкой, то в нем учитываются только числа. Пустые ячейки, логические значения или текст в массиве или ссылке игнорируются. Если логические значения или текст не должны игнорироваться, следует использовать функцию МАКСА. Пример. Определить максимальное значение, если ячейки А1:А5 содержат числа 12,5,6,29 и 3. МАКС(А1:А5) равняется 29. МАКСА (А1:А5;40) равняется 40. Если аргументы не содержат чисел, то функция МАКС выдает 0 (ноль). СРЗНАЧ - среднее арифметическое. Позволяет рассчитать среднее (арифметическое) двух чисел. СРЗНАЧ (число1;число2;…) где число1, число2,… - до 30 аргументов, для которых вычисляется среднее арифметическое. Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа. Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения, учитываются. Вычисляя средние значения ячеек, следует учитывать различие между пустыми ячейками и ячейками, содержащими нулевые значения, особенно если не установлен флажок Нулевые Значения на панели Вид в диалоговом окне Параметры. Пустые ячейки не учитываются, но нулевые ячейки учитываются. Чтобы открыть диалоговое окно Параметры, надо выбрать команду Параметры в меню Сервис. Пример: Пусть ячейки А1:А5 имеют имя Баллы и содержат числа 10, 7, 9, 27 и 2, тогда СРЗНАЧ(А1:А5) равняется 11 СРЗНАЧ(Баллы) равняется 11 СРЗНАЧ(А1:А5;5) равняется 10 СРЗНАЧ(А1:А5 равняется СУММ(А1:А5)/СЧЕТ(А1:А5) и равняется 11. МОДА - наиболее часто встречающееся значение. Функция позволяет рассчитать наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных. МОДА(число1;число2;…) где число1, число2,… - до 30 аргументов, среди которых вычисляется наиболее часто встречающееся значение. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой. Аргументы должны быть числами, именами, массивами или ссылками, которые содержат числа. Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения, учитываются. Функция МОДА выдает значение ошибки #Н/Д! в том случае, если множество данных содержит не однотипные данные. Пример. МОДА({5;6;4;4;3;2;4}) равняется 4.

Выборка и анализ данных в Excel.

В Excel имеется набор инструментов для анализа данных, называемый пакет анализа, который может быть использован для решения статистических или экономических задач. Для использования одного из этих инструментов необходимо указать входные данные и выбрать параметры. Анализ будет проведен с помощью подходящей статистической или инженерной макрофункции, и результаты будут представлены в выходном диапазоне. Некоторые инструменты позволяют представить результаты анализа в графическом виде. Статистический пакет анализа данных. Для его установки в меню Сервис выбирается команда Надстройки и далее в списке Пакет анализа. Для использования инструментов анализа, анализируемые данные следует представить в виде строк или столбцов. Совокупность ячеек, содержащих эти данные, называется входным диапазоном. В меню Сервис выбирается команда Анализ данных. В списке Инструменты анализа выбирается необходимая строка. Далее вводятся входной и выходной диапазоны. Корреляционный анализ. Используется для количественной оценки взаимосвязи двух наборов данных, представленных в безразмерном виде. Корреляционный анализ дает возможность установить: ассоциированы ли наборы данных по величине, то есть, большие значения из одного набора данных связаны с большими значениями другого набора (положительная корреляция), или, наоборот, малые значения одного набора связаны с большими значениями другого (отрицательная корреляция), или данные двух диапазонов никак не связаны (корреляция близка к нулю). Для вычисления коэффициента корреляции между двумя наборами данных используется статистическая функция КОРЕЛ. Ковариационный анализ. Ковариация является мерой связи между двумя диапазонами данных. Используется для вычисления среднего произведения отклонений точек данных относительно средних.

Ковариационный анализ дает возможность установить, ассоциированы ли наборы данных по величине, то есть, большие значения из одного набора данных связаны с большими значениями другого набора (положительная ковариация), или, наоборот, малые значения одного набора связаны с большими значениями другого (отрицательная ковариация), или данные двух диапазонов никак не связаны (ковариация близка к нулю). Вычисления ковариации для отдельной пары данных производятся с помощью статистической функции КОВАР. Экспоненциальное сглаживание. Предназначается для предсказания значения на основе прогноза для предыдущего периода, скорректированного с учетом погрешностей в этом прогнозе. Использует константу сглаживания, по величине которой определяет, насколько сильно влияют погрешности на прогнозы в предыдущем прогнозе. Скользящее среднее. Используется для расчета значений в периоде прогнозирования на основе среднего значения переменной для указанного числа предшествующих периодов. Скользящее среднее, в отличие от простого среднего для всей выборки, содержит сведения о тенденциях изменения данных. Процедура может использоваться для прогноза сбыта, инвентаризации и других процессов. Генерация случайных чисел. Используется для заполнения диапазона случайными числами, извлеченными из одного или нескольких распределений. С помощью данной процедуры можно моделировать объекты, имеющие случайную природу, по известному распределению вероятностей. Например, можно использовать нормальное распределение для моделирования совокупности данных по арифметическим ошибкам в бухгалтерском учете. Чтобы в результате выполнения вычислений вернуть равномерно распределенное случайное число, большее или равное 0 и меньшее 1, используется функция СЛЧИС(). Чтобы вернуть случайное число, лежащее между произвольными заданными значениями, используется функция СЛУЧМЕЖДУ(). Ранг и персентиль. Используется для вывода таблицы, содержащей порядковый и процентный ранги для каждого значения в наборе данных. Данная процедура может быть применена для анализа относительного взаимораспределения данных в наборе. Регрессия. Линейный регрессионный анализ заключается в подборе графика для набора наблюдений с помощью метода наименьших квадратов. Регрессия используется для анализа воздействия на отдельную зависимую переменную значений одной или более независимых переменных. Например, на объем реализации влияют несколько факторов, включая цену, выпуск и сезонность. Регрессия пропорционально распределяет меру реализации по этим трем факторам на основе данных функционирования организации. Результаты регрессии впоследствии могут быть использованы для предсказания объема реализации. Выборка. Создает выборку из генеральной совокупности, рассматривая входной диапазон как генеральную совокупность. Если совокупность слишком велика для обработки или построения диаграммы, можно использовать представительную выборку. Кроме того, если предполагается периодичность входных данных, то можно создать выборку, содержащую значения только из отдельной части цикла. Например, если входной диапазон содержит данные для квартальных продаж, создание выборки с периодом 4 разместит в выходном диапазоне значения продаж из одного и того же квартала.