По какой формуле определяется количество групп при разбиении статистической совокупности?
Подробное объяснение
Для определения числа групп (интервалов) при группировке статистической совокупности обычно применяется формула Стерджеса: k = 1 + 3,322·lg n, где n — объём совокупности. Коэффициент 3,322 возникает при переходе от двоичного логарифма к десятичному: log2 n = lg n / lg 2 ≈ 3,322·lg n. Эта формула позволяет выбрать оптимальное количество интервалов для построения гистограммы или группировки данных.
Часто задаваемые вопросы (FAQ)
1
Что такое формула Стерджеса?
Формула Стерджеса — это эмпирическое правило для определения числа интервалов при построении гистограммы: k = 1 + 3,322·lg n, где n — количество наблюдений.
2
Почему в формуле Стерджеса используется коэффициент 3,322?
Коэффициент 3,322 равен 1 / lg 2 ≈ 1 / 0,3010, что позволяет перейти от двоичного логарифма (log2) к десятичному (lg).
3
Для каких целей применяется число групп, полученное по формуле Стерджеса?
Число групп используется для разбиения статистической совокупности на интервалы при построении гистограмм, полигонов частот и других статистических графиков.
Типичные ошибки
1
Путают lg n с ln n
В формуле Стерджеса используется десятичный логарифм (lg), а не натуральный (ln). Использование ln приводит к неверному числу групп.
2
Забывают прибавить единицу
Формула k = 1 + 3,322·lg n, и без единицы результат будет занижен на 1, что может привести к недостаточному числу интервалов.
3
Используют n в качестве числа групп
Некоторые ошибочно считают, что число групп равно объёму совокупности n, но это неверно: число групп обычно значительно меньше n.