Теорія статистики — Вікіпедія

Теорія статистики є основою для численного діапазону методів, що займаються вивченням будови та аналізу поданої інформації, які використовує практична статистика.[1][2] Теорія статистики містить у собі проблеми підходів до статистичних рішень та статистичних висновків, також дії та висновки, що задовольняють основним принципам, встановленим для цих підходів. У межах вибраного підходу теорія статистики надає способи порівнювання статистичних процедур, з метою обрання найкращої у випадку конкретної статистичної проблеми. Також статистична теорія надає рекомендації щодо вибору методу з рівнозначних процедур.[2][3]

Окрім філософських міркувань про те, як робити статистичні висновки та рішення, вагома частина відомостей із теорії статистики складається з математичної статистики, а також є тісно пов'язаною з теорією ймовірності, теорією корисності на оптимізації.

Використання[ред. | ред. код]

Теорія статистики надає логічне пояснення та забезпечує надійну основу для вибору методології, що використовується у прикладній статистиці.

Моделювання[ред. | ред. код]

Статистичні моделі описують джерела інформації, та можуть мати різну будову, залежно від джерела формування та проблеми, що вивчається в конкретному випадку. Такими  проблемами можуть бути:

  • Вибірка зі скінченної сукупності
  • Вимір похибок спостереження та процедур вдосконалення результату
  • Вивчення статистичних зв'язків

Зазначені вище статистичні моделі можуть бути перевірені, щоб побачити, чи пропонують вони корисні висновки для нових наборів даних. Перевірка гіпотези за допомогою інформації, що вже була використана для визначення моделі є помилковою, згідно з природним законом Бекона та науковим методом Пірса.[джерело?]

Збір даних[ред. | ред. код]

Теорія статистики подає інструкції с порівнянь методів збору даних, де проблема полягає в створенні інформативних даних, використовуючи оптимізований та випадковий підходи, у той же час вимірюючи та контролюючи похибки спостереження.[4][5][6] Оптимізація збору даних знижує їх вартість[7][8], в той час як рандомізація дозволяє отримати достовірні висновки. Теорія статистики надає основу для гарного збору даних та структурування таких досліджень за темами:

  • Побудова експериментів з метою визначення ефективності опрацювання, для тестування гіпотез та оптимізації відповідей.[7][9][10]
  • Випадкове обстеження з метою характеризування населення.[11][12][13]

Узагальнення даних[ред. | ред. код]

Завдання, що полягає в узагальненні статистичних даних у загальноприйнятих формах (також відоме як описова статистика) розглядається в теоретичній статистиці як проблема визначення того, що потрібно, щоб описати аспекти статистичних вибірок, а також наскільки добре вони можуть бути описані зі зазвичай обмеженою вибіркою даних. Таким чином, проблеми теоретична статистика містить у собі наступне:

  • Опис зведених статистичних даних для опису вибірки;
  • Узагальнення ймовірності розподілу даних вибірки, обмежуючи припущення про форму розподілу, що зустрілася;
  • Підсумування співвідношення між різними величинами, що були виміряні на однакових питаннях вибірки.

Інтерпретування даних[ред. | ред. код]

Окрім філософських аспектів, що лежать в основі статистичних припущень, теорія статистики ставить перед собою завдання розглянути типи питань, які необхідні спеціалістам, що вивчають аналітичні методи обробки даних. Деякими з яких є:

  • Узагальнення сукупності;
  • Узагальнення співвідношення між змінними, використовуючи певний тип регресійного аналізу;
  • Прогнозування результату випадкової величини, обумовленого іншими спорідненими даними;
  • Розглядання можливості зменшення кількості змінних, що розглядаються в межах конкретного завдання (Завдання скорочення розміру).

Для статистичної процедури, вказаної в протоколі дослідження, статистична теорія надає цілком визначені значення ймовірності щодо методу, стосовно всіх даних, які могли з'явитися під час рандомізованого підходу їх отримання. Це забезпечує об'єктивний спосіб оцінювання параметрів, оцінювання інтервалів впевненості, перевірка гіпотез, і вибір найкращої. Навіть для даних спостережень, статистична теорія дає спосіб обчислення значення, яке може використовуватися для інтерпретації вибірку даних із сукупності. Вона може слугувати засобом визначення того, наскільки добре значення визначене вибіркою. Таким чином, засоби, що кажуть про відповідних значень, отримані з різних сукупностей, є настільки різними, наскільки можуть такими здатися, однак достовірність висновків з апостеріорних даних спостережень часто гірше, ніж з планованого рандомізованому покоління даних.

Прикладні статистичні висновки[ред. | ред. код]

Статистична теорія дає основу для цілого ряду аналітичних даних методів, які є загальними для всіх наукових і соціальних досліджень. Інтерпретація даних є важливим завданням статистичного дослідження. Ось деякі з них:

  • Оцінка параметрів;
  • Перевірка статистичних гіпотез;
  • Подання діапазон значень замість точкової оцінки;
  • Регресійний аналіз.

Багато із стандартних методів для виконання цих завдань спираються на деякі статистичні припущення (зроблені при виведенні методології), що насправді проводяться на практиці.  Статистична теорія вивчає наслідки відступу від цих припущень. Крім того, вона надає ряд надійних статистичних методів, які в меншій мірі залежать значення припущень, і забезпечує методами перевірки того, чи правильно піддавати конкретні припущення для певного набору даних.

Див. також[ред. | ред. код]

Примітки[ред. | ред. код]

  1. Cox & Hinkley (1974, p.1)
  2. а б Rao, C. R. (1981). Foreword. У Arthanari, T. S.; Dodge, Yadolah (ред.). Mathematical Programming in Statistics. New York: John Wiley & Sons. с. vii–viii. ISBN 0-471-08073-X. MR 0607328. 
  3. Lehmann & Romano (2005)
  4. Charles Sanders Peirce and Joseph Jastrow[en] (1885). On Small Differences in Sensation. Memoirs of the National Academy of Sciences. 3: 73–83. Архів оригіналу за 9 червня 2019. Процитовано 2 грудня 2016.  http://psychclassics.yorku.ca/Peirce/small-diffs.htm [Архівовано 9 червня 2019 у Wayback Machine.]
  5. Hacking, Ian (September 1988). Telepathy: Origins of Randomization in Experimental Design. Isis. 79 (3): 427–451. doi:10.1086/354775. JSTOR 234674. MR 1013489. 
  6. Stephen M. Stigler[en] (November 1992). A Historical View of Statistical Concepts in Psychology and Educational Research. American Journal of Education. 101 (1): 60–70. doi:10.1086/444032. 
  7. а б Atkinson et al. (2007)
  8. Kiefer, Jack Carl (1985). Brown, Lawrence D.; Olkin, Ingram; Sacks, Jerome та ін. (ред.). Jack Carl Kiefer: Collected papers III—Design of experiments. Springer-Verlag and the Institute of Mathematical Statistics. с. 718+xxv. ISBN 0-387-96004-X. 
  9. Hinkelmann & Kempthorne (2008)
  10. Bailey (2008).
  11. Kish (1965)
  12. Cochran (1977)
  13. Särndal et al. (1992)

Посилання[ред. | ред. код]

Для подальшого читання[ред. | ред. код]