Преодоление мультиколлинеарности при построении модели регрессии.
Мультиколлинеарность – совокупное воздействие факторов друг на друга, когда >2 факторов связ. между собой лин. зависимостью.
Если факторы мультиколлинеарны, следует:
1). Изменить состав факторов, исключить один или несколько факторов.
2). Преобразовать факторы, чтобы ↓корреляцию между ними:
- модель на основе рядов динамики ∆y=yt-yt-1.
- метод главных компонент.
3). Перейти к совмещенному уравнению регрессии, к-е учитывает взаимодействие факторов:
y = a + bx + cz + d(xz) + ε.
y = f (x1, x2, x3).
y = a + b1x1 + b2x2 + b3x3 + b12x1x2 + b13x1x3 + b23x2x3.
Возможно включение взаимодействия более высоких порядков b123x1x2x3 и т.д., однако часто включение даже первого порядка несущественно. Тогда, например, если значимо только взаимодействие х1 и х3:
y = a + b1x1 + b2x2 + b3x3 + b13x1x3 + ε.
Пример: влияние удобрений на урожайность.
Факторы взаимодействуют друг с другом, если влияние одного из них на рез-т зависит от уровня другого фактора.
4). Перейти к ур-иям приведенной формы.
y = a + b1x1 + b2x2 + ε.
х1 и х2 сильно коррелированны. Предположим, что . Можно оставить оба фактора, но использовать ур-ие совместно с др. ур-ями, где x2 рассматривается как зависимая переменная.
→
ŷ2 = a + b1x1 + b2(a + By + Cx3)
ŷx(1 - b2B) = (a + b2A) + b1x1 + Cb2x3
, φ – остаток. ŷx = a’ + b1’x1 + b3’x3.
4). Включаемые во множ. регр. факторы должны ↑R2.