The logo of Jsoft
Архив
Бесплатные книги

Среднее значение, медиана и мода

Эти три термина являются основными показателями в статистическом анализе. Если 20 лет назад в нашей стране они интересовали только экономистов и работников статистики, то теперь почти каждый, кто имеет хоть какое-либо отношение к коммерции, следит за этими данными. Это работники банковского сектора, торговли, сервиса о больше всех брокеры.

В последние годы все чаще появляются такие заумные термины, как Бизнес-аналитика (Business Analytics или Business Intelligence), Система поддержки принятия решений (Decision Support System или DSS), Аналитическая обработка данных в реальном времени (Online Analytical Processing, OLAP), нейронные сети. Последние 2 года еще один “модный” термин добавился к их числу. Это Предсказательная аналитика (Predictive Analytics) .

Но в этой статье мы не будем подробно объяснять каждый из этих терминов. Их достаточно распиарили и без нас. Вместо этого остановимся на объяснении этих трех терминов: среднее значение, медиана и мода. Все три термина объясним с примерами.

Среднее значение

Часто так называют среднеарифметическое значение выборки (или множества чисел). Это, пожалуй, самый распространенный термин, из вышеперечисленных трех. Хотя бы потому, что почти каждый день мы слышим это слово в СМИ. Значение его тоже объясняет само название. Тем не менее, для тех, кому непонятен смысл этого слова, объясним “на пальцах”.

Это сумма данных чисел, деленное на количество. Если написать в виде формулы, это выглядит так.

среднее арифметическое = (a1+a2+a3+…+an)/n

Если у Вас имеется 5 чисел {10, 12, 5, 20, 8}, то их сумма 10+12+3+20+8=55. Так как количество равно 5, то делим 55/5=11. Это и есть среднеарифметическое значение.

Пример из практики

Допустим, у вас есть магазин, и вы торгуете чем то. В день, выручка составляет от 600 до 1,200 у.е. По итогам месяца вы наторговали на сумму 30,000 у.е. Если условное количество дней в месяце 30, значит, ваша средняя ежедневная выручка составляет 1,000 у.е. (30000/30 = 1000).

Медиана

Медиана – число, характеризующее выборку, т.е. если взять все элементы множества, то это число ровно делит множество пополам. Одна половина множества равна или больше этого число, а другая меньше или равна этому числу.

Объясним это на примере. Допустим, дано следующее множество: {2, 5, 10, 8, 7}. Здесь число 7 делит это множество пополам. 2 и 5 меньше, а 10 и 8 больше этого числа. Для удобства нахождения медианы сначала нужно отсортировать выборку в возрастающем или убывающем порядке {2, 5, 7, 8, 10}. Тогда элемент, стоящий ровно посередине, будет медианой. Как видите, это число 7.

А как быть, если во множестве четное количество чисел? Например {2, 5, 6, 8, 10, 15}. Тогда берем среднеарифметическое значение двух чисел, которые стоят посередине. У нас эти числа 6 и 8. Значит (6+8)/2=14/2=7. Среднее значение этих двух чисел, а значит медиана равна 7.

Пример из практики

Допустим, в стране 1% взрослого населения зарабатывает 1 млн. у.е. в год (может быть больше, но для примера ограничимся этим числом), 10% населения зарабатывает по 20,000 у.е. в год. Остальные живут за чертой бедности, зарабатывая всего 100 у.е. в год. Тогда, несмотря на большие заработки 11% населения, медиана все равно будет равна 100 у.е. Потому что подавляющее большинство получает всего 100 у.е. в год. Теперь вычислим среднее значение.

1% получает 1,000,000 у.е. = 1 x 1,000,000 = 1,000,000 у.е.
10% получают 20,000 у.е. = 10 x 20,000 = 200,000 у.е.
90% получают 100 у.е. = 90 x 100 = 9,000 у.е.

Значит, среднее значение в год составляет

(1,000,000 + 200,000 + 9,000) / 100 = 1,209,000 / 100 = 12,090 у.е.

Зная соотношение неработающих людей, на каждого работающего, и поделив полученное на это число, получим доход на душу населения (с учетом детей, стариков и больных без пенсии).

Итак, такая статистика показывает, что народ живет припеваючи, зарабатывая примерно 1,000 у.е. в месяц, а действительность другая. Как раз, так и вычисляется доход на душу населения. Берется национальный доход и делится на численность населения. Теперь вы понимаете, почему в сводках всегда называют эту цифру, потому что она никоим образом не отображает благосостояние большинства, а только является показателем экономического благосостояния страны.

Мода

Название этого термина само говорит за себя. Это значение, которое больше всего встречается в выборке. Чего больше, то и “в моде”. Например, {5, 3, 1, 3, 7, 5, 3, 10}. В этом множестве больше всего встречается число 3. Это число является модой данного множества. Если выборка имеет несколько мод, т.е. несколько часто встречающихся элементов, число повторений которых равно, то эта выборка мультимодальна. Например, рассмотрим множество {1, 3, 10, 3, 1, 2}. Здесь числа 1 и 3 встречаются больше всех. В статистике мода применяется больше по отношению к нечисловым данным.

Пример из практики

Если постоять на проспекте и в течение 10 минут и посчитать все проезжающие автомобили и классифицировать их по цветам, то можно определить моду для цвета автомобилей этого города. Допустим, насчитали 95 белых, 45 черных, 12 красных, 38 серых и 70 других цветов. Значит, модой в этом городе являются автомобили белого цвета. Это хорошая информация для дистрибьюторов автомобилей.

Надеемся, что нам удалось “на пальцах” объяснить значение терминов среднеарифметическое значение, медиана и мода. Если кто-то из Ваших знакомых до сих пор в недоумении, просвещайте их, поделившись данной статьей в соц. сетях.

© Все права защищены

Все статьи этого сайта написаны Джафаром Н.Алиевым. Перепечатывание любой статьи на стороннем ресурсе должно сопровождаться именем автора и ссылкой на данный ресурс. Сам автор следует этим правилам.