Дисперсійний аналіз – це інструмент аналізу, що використовується в статистиці, який розділяє спостережувальну сукупну мінливість, виявлену в наборі даних, на дві частини: систематичні та випадкові чинники. Систематичні фактори мають статистичний вплив на набір даних, в той час, як випадкові чинники – не мають. Аналітики використовують тест ANOVA для визначення впливу незалежних змінних на залежну змінну в регресійному дослідженні.
Методи t- і z-критеріїв, розроблені в 20-му столітті, використовувалися для статистичного аналізу до 1918 року, коли Рональд Фішер створив метод дисперсійного аналізу. ANOVA також називається дисперсійним аналізом Фішера і є розширенням t- і z-критеріїв. Цей термін став широко відомий в 1925 році, після згадки в книзі Фішера «Статистичні методи для науковців». Він використовувався в експериментальній психології, а потім був поширений на більш складні предмети.
Що показує дисперсійний аналіз?
Тест ANOVA – це початковий крок в аналізі чинників, які впливають на набір даних. Після завершення тесту аналітик виконує додаткове тестування методичних чинників, які роблять суттєвий внесок в неузгодженість набору даних. Аналітик використовує результати тесту ANOVA в f-тесті для генерації додаткових даних, які узгоджуються з запропонованою регресійною моделлю.
Дисперсійний аналіз дозволяє порівнювати більше двох груп одночасно, щоб визначити, чи існує між ними зв'язок. ANOVA, F-статистика (F-відношення) дозволяє аналізувати декілька груп даних для визначення варіабельності між вибірками та всередині вибірок.
Приклад використання ANOVA
Наприклад, дослідник може протестувати студентів з декількох коледжів, щоб переконатися, що студенти одного з коледжів постійно перевершують студентів з інших коледжів.
Тип використовуваного тесту ANOVA залежить від ряду факторів. Він застосовується, коли дані повинні бути експериментальними. Дисперсійний аналіз використовується, якщо немає доступу до статистичного програмного забезпечення, що призводить до ручного обчислення ANOVA. Він простий у використанні та найкраще підходить для невеликих зразків. В багатьох експериментальних планах розміри вибірки повинні бути однаковими для різних комбінацій рівнів факторів.
ANOVA є корисним для тестування трьох або більше змінних. Він схожий на множинний двовибірковий t-тест, групує відмінності, порівнюючи середні значення кожної групи, і включає розподіл дисперсії за різними джерелами.