Відповідь – ні: метод оцінки, що використовується в лінійній регресії, звичайний метод найменших квадратів (МНК), не потребує припущення нормальності. Отже, якщо ви бачите, що змінна не розподіляється нормально, не засмучуйтесь і продовжуйте: намагатися все нормалізувати абсолютно марно.3 березня 2020 р.
Залежні та незалежні змінні в регресійній моделі не потребують нормального розподілу самостійно–тільки помилки передбачення мають бути нормально розподілені. (Насправді незалежні змінні навіть не обов’язково повинні бути випадковими, як у випадку з тенденцією чи фіктивною змінною, чи змінною ціноутворення.)
Ні, це означає, що існують інші фактори, не у вашій регресії, які також впливають на вашу залежну змінну.
Автокореляція виникає, коли залишки не є незалежними один від одного. Іншими словами, коли значення y(x+1) не залежить від значення y(x). У той час як діаграма розсіювання дозволяє перевірити наявність автокореляції, ви можете перевірити модель лінійної регресії на автокореляцію за допомогою тесту Дарбіна-Ватсона.
Залежна змінна має бути лише безперервною. Незалежна змінна може бути неперервною або дискретною. Якщо залежна змінна є дискретною, то проблема стане проблемою класифікації, а не регресією.
Коротше кажучи, коли залежна змінна не розподілена нормально, лінійна регресія залишається статистично надійною технікою в дослідженнях великих розмірів вибірки. На рисунку 2 наведено відповідні розміри вибірки (тобто >3000), де методи лінійної регресії все ще можна використовувати, навіть якщо припущення про нормальність порушується.