T STATISTIC: значення, приклад, формула та як її обчислити

T Статистика
Автор зображення: eduCBA

Якщо ви намагаєтеся дізнатися суттєву різницю між двома середніми вибірковими наборами даних, оскільки вони стосуються заданих змінних, вам слід перевірити t-статистику. Будь то освіта, наука чи навіть щось пов’язане з бізнесом, ми всі колись намагаємося перевірити свої гіпотези та припущення. Цікаво, що t-статистика є одним із інструментів, який використовується для перевірки нашої оцінки даних. Т-статистика, часто відома як значення, описує відношення набору вибірок до сукупності. Він використовується для зменшення величезних обсягів даних до одного значення. У цьому посібнику описано формулу, типи, способи інтерпретації її значення, а також використання t-статистики.

Що таке Т-статистика?

Т-статистика вимірює, наскільки значущою є різниця між двома вибірковими середніми значеннями відносно мінливості даних. Це стандартний інструмент для оцінки гіпотез щодо значущості відмінностей між вибірками. T Статистична формула

Формула для розрахунку T-статистики:

t = (x̄1 – x̄2) / (s√((1/n1)+(1/n2)))

де:

x̄1 і x̄2 є вибірковими середніми для двох вибірок

s - об'єднане стандартне відхилення двох зразків

n1 і n2 — розміри двох вибірок

Т-статистика обчислюється шляхом віднімання середнього значення одного зразка від середнього значення іншого зразка. Потім ви повинні розділити це на стандартну помилку різниці між двома середніми. Помилка оцінюється додаванням стандартних відхилень зразків.

Приклад розрахунку T-статистики

Припустимо, ми хочемо перевірити, чи однакова середня вага яблук із двох садів. Ми беремо пробу з 10 яблук з кожного саду і записуємо їх вагу. Дані такі:

Фруктовий сад 1: 100г, 110г, 120г, 130г, 140г, 150г, 160г, 170г, 180г, 190г

Фруктовий сад 2: 90г, 100г, 110г, 120г, 130г, 140г, 150г, 160г, 170г, 180г

Ми можемо розрахувати вибіркове середнє значення та стандартні відхилення наступним чином:

x̄1 = 150 г

x̄2 = 130 г

s1 = 36.06 г

s2 = 36.06 г

Тепер ми можемо обчислити статистику t за формулою:

t = (150 – 130) / (36.06√((1/10)+(1/10))) = 2.79

Щоб визначити, чи є ця t-статистика значущою, ми б порівняли її з критичним значенням t-розподілу з 18 ступенями свободи (10 + 10 – 2). Нульову гіпотезу про те, що середні ваги садів однакові, можна відхилити. Але це за умови, що t-статистика більша за критичне значення.

Загалом t-статистика є корисним інструментом для перевірки гіпотез. Це пояснюється тим, що загалом це допомагає нам визначити, чи відмінності, які ми спостерігаємо в наших даних, є статистично значущими.

Розуміння Т-статистики

Т-статистика — це відношення різниці між оціненими та прогнозованими значеннями параметра, поділеного на стандартну помилку оцінки. Зазвичай це стосується перевірки студентських гіпотез у дослідницькій роботі та результатів. Як правило, вони використовуються для визначення того, чи прийняти нульову гіпотезу. Якщо розмір вибірки невеликий або стандартне відхилення сукупності невідоме, замість z-показника використовується t-статистика. Якщо стандартне відхилення генеральної сукупності невідоме, t-статистику можна використати для оцінки середньої генеральної сукупності за вибірковим розподілом вибіркових середніх. Він також використовується в поєднанні зі значенням p для визначення статистичної значущості результату перевірки гіпотези.

Критичне значення t-статистики залежить від розміру вибірки, рівня значущості та ступенів свободи. Більше значення t-статистики вказує на більшу різницю між середніми значеннями двох порівнюваних груп, а менше значення p вказує на вищий рівень значущості.

Загалом, якщо розраховане значення t-статистики перевищує критичне значення t-розподілу, тоді нульова гіпотеза відхиляється на користь альтернативної гіпотези. Точне обмеження для «хорошого» значення t-статистики залежить від рівня значущості та ступенів свободи, але, як правило, t-статистика з абсолютним значенням більше 2 вважається статистично значущою на рівні значущості 5%.

Важливо зазначити, що інтерпретація значення t-статистики також залежить від конкретного контексту дослідження та розміру ефекту. Велика t-статистика може бути значущою в одному контексті, але не в іншому, залежно від величини досліджуваного ефекту. Тому завжди важливо враховувати контекст і розмір ефекту під час інтерпретації значущості значення t-статистики.

Що таке T-статистика проти P-значення?

T-значення є інструментом для кількісної оцінки різниці між середніми сукупностями для кожного тесту, а p-значення оцінює ймовірність знайти t-значення з абсолютним значенням, щонайменше таким же великим, як те, що спостерігається у вибіркових даних, якщо нульова гіпотеза дійсна.

Що говорить вам статистика T у регресії?

Статистику Т-тесту можна використовувати для дослідження зв’язку між результатом і змінними, які використовуються для його прогнозування. Щоб визначити, чи дорівнює нулю нахил або коефіцієнт у аналізі лінійної регресії, виконується t-критерій для однієї вибірки. Під час виконання лінійної регресії t-критерій однієї вибірки використовується для відхилення нульової гіпотези про те, що нахил або коефіцієнт дорівнює 0.

Як розрахувати T статистику

Визначити t-критерій відносно легко, якщо виконати наступні кроки;

  • Знайдіть вибіркове середнє значення вашого набору даних
  • Далі визначте шляхом розрахунку середнє значення сукупності.
  • Використовуючи правильну формулу, обчисліть стандартне відхилення вибіркових даних
  • Обчисліть t-статистику, використовуючи дані з кроків 1-3, і розмір вибірки, використовуючи обчислення вище.

Як дізнатися, чи показник T є значущим?

Статистична значущість вказується, коли t-показник значно відрізняється від середнього. Тобто, воно має сильно відрізнятися від середнього значення розподілу, що навряд чи станеться випадково, якщо вони не пов’язані між собою.

Які є три типи t-тестів у статистиці?

Для порівняння середніх значень використовуються три типи статистики t-критерію: t-критерій однієї вибірки, t-критерій двох вибірок і парний t-критерій. 

Про що говорить велика Т-статистика?

Якщо t має високе значення (високе співвідношення), то спостережувана розбіжність між даними та гіпотезою є більшою, ніж те, що можна було б передбачити, якби лікування не мало ефекту. У статистичному аналізі t-показник (або t-значення) найчастіше використовується, щоб показати, наскільки різні або схожі дві групи.

Що таке хороше статистичне значення T?

Найчастіше прийнятними вважаються значення Т від +2 до -2. Чим більше t-значення, тим більше ми впевнені, що цей коефіцієнт є хорошим провісником. Якщо t-значення низьке, прогностична сила коефіцієнта слабка.

Яка різниця між Z і T статистикою?

Z-тест і Т-тест є статистичними процедурами для аналізу даних; обидва мають застосування в науці, бізнесі та інших сферах; однак вони відрізняються один від одного. Коли відомі як середнє (або середнє), так і дисперсія (або стандартне відхилення) генеральної сукупності (як зазвичай), Т-тест можна використовувати для перевірки нульової гіпотези про те, що вони істотно не відрізняються один від одного. Навпаки, Z-тест є звичайним одностороннім аналізом дисперсійного тесту.

Z-тест

Коли розмір вибірки великий, дисперсії відомі, і Z-тест використовується для визначення того, чи відрізняються два середні сукупності, тест вважається надійним і дійсним.

Припущення тесту Z

Загалом Z-тести ґрунтуються на наступних припущеннях;

  • Результати кожного експерименту можна розглядати окремо.
  • Що стосується розмірів, то розмір проб повинен бути до 30
  • Припускаючи, що середнє значення дорівнює нулю, а дисперсія дорівнює одиниці, розподіл Z є нормальним.

T-тест

Т-критерій використовується в статистиці, і він переважно використовується, коли дисперсія недоступна. Т-тест можна використовувати, щоб визначити, чи мають два набори даних різні значення.

Т-тести разом із t-розподілом використовуються, коли розміри вибірки обмежені, а стандартне відхилення сукупності невідоме. Т-розподіл набуває форми, яка дуже чутлива до ступеня свободи. Термін «ступінь свободи» використовується для позначення кількості окремих точок даних, які складають певний набір даних.

Термін «ступінь свободи» використовується для позначення кількості окремих точок даних, які складають певний набір даних. 

Припущення Т-тесту

Т-тест базується на наступних припущеннях:

  • Невеликий розмір вибірки
  • Точки даних слід вважати незалежними.
  • Необхідно точно задокументувати кількість зразків.

Використання Т-статистики

Двома найпоширенішими способами використання t-статистики є t-критерії Стьюдента, які є типом статистичної перевірки гіпотез, і для обчислення довірчих інтервалів.

Статистика t є важливим числом, тому що, незважаючи на те, що вона надається в термінах вибіркового середнього, її розмір вибірки не залежить від параметрів генеральної сукупності.

Нижче наведено деякі поширені способи використання t-статистики

#1. Перевірка гіпотез про популяцію означає:

Т-критерій зазвичай використовується, щоб перевірити, чи суттєво відрізняються середні значення двох сукупностей. Наприклад, дослідник може використовувати t-критерій, щоб порівняти середню вагу двох груп людей, щоб визначити, чи є значна різниця у вазі між двома групами.

Порівняння вибіркового середнього з відомим середнім для генеральної сукупності: у деяких випадках дослідник може захотіти перевірити, чи суттєво відрізняється вибіркове середнє від відомого середнього для генеральної сукупності. Для цієї мети можна використовувати t-критерій, порівнюючи середнє значення вибірки із середнім по сукупності та обчислюючи t-статистику.

#2. Довірчі інтервали

t-статистика використовується для розрахунку довірчих інтервалів для середніх сукупностей. Довірчий інтервал надає діапазон значень, у межах якого ми можемо бути достатньо впевнені, що справжня сукупність означає брехню.

#3. Перевірка значущості коефіцієнтів регресії:

T-критерій використовується для перевірки того, чи оцінені коефіцієнти регресії в моделі лінійної регресії значно відрізняються від нуля. Це важливо для визначення того, чи мають незалежні змінні в моделі значний вплив на залежну змінну.

Загалом, t-статистика є широко використовуваним інструментом у статистичному висновку, зокрема у перевірці гіпотез та оцінці параметрів сукупності.

Інший статистичний тест

Окрім t-статистики, існують інші підходи до вимірювання автентичності

висновків гіпотез, деякі з них наведено нижче;

#1. F-значення

Першим у нашому списку є значення F. Це найкраще працює під час аналізу дисперсії. F-значення демонструє статистичну значущість середніх відмінностей і, отже, показує, чи існує кореляція між дисперсіями груп. Цей статистичний аналіз порівнює середні значення двох або більше зразків, які можна обробляти окремо. Зі значенням f результати можуть бути прийняті або відхилені на двох підставах;

По-перше, нульова гіпотеза приймається, якщо f-значення більше або дорівнює міжгруповій дисперсії. По-друге, нульова гіпотеза відхиляється, якщо f-значення менше, ніж дисперсія в групах вибірки. 

 #2. Z-значення

Окрім тесту t-статистики, ще одним відповідним підходом, який кожен може використовувати для вимірювання гіпотез, є тест Z-значення. Якщо порівнювати дві сукупності, де середнє значення вважається однаковим, це чудовий вибір. Професіонал може віддати перевагу цьому над t-тестом, оскільки він дає більш точний результат. 

Значення Z можна отримати за наведеною нижче формулою;
z = (X – μ) / σ

#3. Р-значення

Наступним за видами підходів до перевірки гіпотез є тест P value. Цей самий має одну мету, а саме відхилити або прийняти нульову гіпотезу. Нижче значення p більше свідчить про відхилення нульової гіпотези, тоді як більше значення p більше свідчить про підтвердження нульової гіпотези.

Перевірка p-значення – це показник статистичної значущості, який обчислюється за допомогою ступеня свободи тесту та оцінки на основі альфа-значення тесту. Ступінь свободи можна обчислити, взявши розмір вибірки n і віднявши 1. (n – 1). P-значення можна оцінити шляхом порівняння результату з певним альфа-рівнем.

посилання

залишити коментар

Ваша електронна адреса не буде опублікований. Обов'язкові поля позначені * *

Вам також може сподобатися