Навигатор


Архив

201139
201230
201312
20151
201633
201755
201865
201955

Дата создания:

Типы данных в статистике

Диаграмма

Такие выражения, как минимум, максимум, медиана и процентиль имеют значение лишь для порядковых данных, то есть если данные могут быть отсортированы с малого до большого значения.  Высота, ширина, вес, количество голосов избирателей, уровень глюкозы в крови и вообще любые показатели лабораторных анализов являются порядковыми данными. А ответ на вопрос “Ваше отношение к политике Трампа?” не является порядковым. Если, конечно не даны готовые варианты ответов из нескольких значений.

Порядковые (ordinal) данные делятся на метрические (metric) и неметрические (nonmetric).

Метрические (количественные) данные

Метрические данные также называют количественными. Говоря количественные данные, не имеется в виду, что эти данные можно считать натуральными числами. Просто эти данные можно измерять двумя способами. Одним из способов является измерение с помощью интервальной шкалы, разделенной на равные промежутки. Количественно равные промежутки этой шкалы отображают равные промежутки значений, измеряемых характеристик. Если проведение такого измерения не представляется возможным, то можно измерять с помощью шкалы отношений. В таком случае кроме расстояния определяется и порядок значений.

Метрические данные сами делятся на непрерывные (continuous) и дискретные (discrete). Рост или масса детей в классе считаются непрерывными данными, а вот их количество является дискретным значением.

Неметрические (категориальные) данные

Другое название неметрических данных, это категориальные (categorical) данные. Эти данные имеют ограниченное число значений. Они, скорее всего, представляют собой “качественные” данные. В литературе вы можете встретить все эти три названия. Все классификаторы являются категориальными данными. Примером таких данных являются почтовый индекс, пол людей, должность, чин, цвет глаз, и т.д.

Для анализа этих данных иногда им присваивается определенный “вес”. Например, если проводится опрос, то каждому ответу присваивается определенное значение, чтобы потом можно было им оперировать и придавать статистическое значение.

Читайте также

Переменные потока и запасы

Все экономические переменные, которые имеют временное измерение, т.е. величины которых можно измерить по истечении времени называем переменными потока. А запас не имеет временное измерение.

Показатели вариации

Чтобы знать, насколько далеко значение совокупности простирается от центральной тенденции, вычисляют вариацию (на английском dispersion или variability, но не путайте с variation). Есть несколько показателей вариации. Это размах, межквартильный размах, среднее линейное отклонение, дисперсия и стандартное отклонение.

Типы выборки

Для расследования генеральной совокупности применяют два вида выборки. Случайную и неслучайную выборку. Простая, систематическая, стратифицированная и кластерная выборка являются случайными выборками. Стихийная, удобная и квотная выборка являются примером неслучайной выборки.

Скользящее среднее значение

Среди наиболее популярных технических индикаторов чаще всего, скользящее среднее значение используются для измерения направления текущего тренда. Самая простая формула скользящей средней, известна как Простое Скользящее Среднее значение.

Генеральная совокупность и выборка

Генеральной совокупностью называют всё исследуемое множество. На английском языке этот термин называется популяцией (population). Выборкой (на английском sample) называют некоторое случайно отобранное подмножество из генеральной совокупности.

Нулевая гипотеза

Нулевая гипотеза утверждает, что между исследуемыми данными никакой закономерности нет. Пока нулевая гипотеза не опровергнута, она в силе. Альтернативная гипотеза является обратной нулевой гипотезе.

Что такое тренд?

Термины тренд и тенденция используются в различных целях. Люди часто говорят о тенденции относительно роста цен и падения курса какой-то валюты. Здесь мы раскроем статистическое значение этих терминов.

Ошибка репрезентативности

Стандартная ошибка (standard error) и ошибка репрезентативности часто употребляются, как взаимозаменяемые термины. Ошибка репрезентативности показывает, насколько результаты, полученные при выборочном наблюдении отличаются от результатов, полученных при исследовании генеральной совокупности.

Среднее значение, медиана и мода

Все чаще встречаем такие термины, как Бизнес-аналитика, Система поддержки принятия решений, Предсказательная аналитика. Но их уже достаточно распиарили и без нас. Поэтому остановимся на объяснении этих трех терминов: среднее значение, медиана и мода.

© Все права защищены

Все статьи этого сайта написаны Джафаром Н.Алиевым. Перепечатывание любой статьи на стороннем ресурсе должно сопровождаться именем автора и ссылкой на данный ресурс. Сам автор следует этим правилам.