Как называется показатель, который показывает, какую долю разброса зависимой переменной объясняет регрессионная модель?
Подробное объяснение
Искомый показатель — коэффициент детерминации (R²). Он вычисляется как отношение объясненной суммы квадратов к общей сумме квадратов и принимает значения от 0 до 1. Чем ближе R² к 1, тем лучше модель объясняет вариацию эндогенной переменной. Таким образом, R² отражает долю дисперсии зависимой переменной, учтенную регрессией.
Часто задаваемые вопросы (FAQ)
1
Что такое коэффициент детерминации R²?
Коэффициент детерминации — это статистическая мера, показывающая, какая доля вариации зависимой переменной объясняется независимыми переменными в регрессионной модели.
2
Как интерпретировать значение R², равное 0.8?
R² = 0.8 означает, что 80% дисперсии зависимой переменной объясняется моделью, а 20% приходится на случайные факторы или неучтенные переменные.
3
Чем отличается R² от скорректированного R²?
Скорректированный R² учитывает количество предикторов в модели и штрафует за их избыточность, что позволяет сравнивать модели с разным числом факторов.
Типичные ошибки
1
Путать R² с коэффициентом корреляции r.
Коэффициент корреляции r измеряет силу линейной связи между двумя переменными, а R² — долю объясненной дисперсии зависимой переменной. Для парной регрессии R² = r², но это разные концепции.
2
Считать, что высокий R² всегда означает хорошую модель.
Высокий R² может быть следствием переобучения, особенно при большом числе предикторов. Важно также проверять значимость модели и остатков.
3
Интерпретировать R² как долю объясненной дисперсии независимой переменной.
R² показывает долю объясненной дисперсии зависимой (эндогенной) переменной, а не независимых переменных.