Критерій узгодженості Колмогорова — Вікіпедія

У статистиці критерій узгодженості Колмогорова (також відомий, як критерій узгодженості Колмогорова — Смирнова) використовується для того, щоб визначити, чи підпорядковуються два емпіричних розподіли одному закону, або визначити, чи підпорядковується емпіричний розподіл певній моделі.

Означення критерію[ред. | ред. код]

Нехай X=(X1,…, Xn) — вибірка з розподілу . Перевіряється проста гіпотеза проти складної альтернативи . Якщо розподіл має неперервну функцію розподілу F1, можна користуватися критерієм Колмогорова. Хай: .

Якщо гіпотеза H1 хибна, то Xi мають якийсь розподіл , відмінний від . За теоремою Гливенка — Кантеллі[en]: для будь-якого y коли . Оскільки , то знайдеться таке y0 що . Але

.

Множимо на і отримуємо, що при значення .

Нехай випадкова величина має розподіл з функцією розподілу Колмогорова:

.

Цей розподіл табульований, так що за заданим легко знайти C таке, що .

Критерій Колмогорова виглядає так:

.

Якщо досить велике, то можна приблизно розрахувати за формулою:

Асимптотична потужність критерію дорівнює 1.

Додаток[ред. | ред. код]

Критерій Узгодженості Колмогорова λ використовується при визначенні максимальної розбіжності між частотами емпіричного і теоретичного розподілу, обчислюється за формулою

,

де D — максимальне значення різниці між накопиченими емпіричними і теоретичними частотами;

 — сума емпіричних частот.

За таблицями значень ймовірності λ-критерію можна знайти величину λ, відповідну ймовірності Р. Якщо величина ймовірності Р значуща відносно знайденої величини, то можна передбачити, що розбіжності між теоретичним і емпіричним розподілами несуттєві. Необхідною умовою при використанні критерію узгодженості Колмогорова є велике число спостережень (не менше ста). Часто при перевірці гіпотез про розподіл тих або інших даних недостатньо застосувати якийсь один критерій, особливо, коли дані спостережень не показують значимого відхилення від гіпотези, і ситуація представляється сумнівною. У цих випадках доцільно скористатися іншими критеріями, заснованими на інших імовірнісних ідеях, щоб при їх допомозі піддати аналізу ті ж дані. Таким чином, дуже поважно мати широкий арсенал методів для статистичної обробки даних.

Див. також[ред. | ред. код]

Джерела[ред. | ред. код]