Калькулятор Chi-Square
Рассчитайте статистику хи-квадрата и p-значение для ваших наблюдаемых и ожидаемых значений.
Введите свои данные
Таблица содержимого
Оригинальное название: Chi-Square Tests
Тест Chi-Square является одним из наиболее важных и широко используемых статистических инструментов для анализа категориальных данных. Это помогает исследователям определить, существует ли значительная связь между категориальными переменными или наблюдаемые частоты отличаются от ожидаемых частот.
Типы тестов Chi-Square
Чи-квадрат Тест на независимость
Используется для определения наличия значительной связи между двумя категориальными переменными. Например, проверить, связан ли пол с предпочтениями при голосовании.
Оригинальное название: Goodness of Fit Test
Используется для определения того, соответствуют ли данные выборки гипотетическому распределению. Например, тестирование, если распределение групп крови в образце соответствует ожидаемым пропорциям населения.
Математический фонд
Статистика Chi-Square основана на сравнении наблюдаемых частот с ожидаемыми частотами в разных категориях. Формула измеряет сумму квадратов различий между наблюдаемыми и ожидаемыми значениями, нормализованных ожидаемыми значениями.
Ши-квадрат распределения
Ши-квадратное распределение представляет собой семейство правых вероятностных распределений с одним параметром: степенями свободы (df). Для проверки независимости в таблице непредвиденных обстоятельств степени свободы рассчитываются как:
где r - число строк, а c - число столбцов в таблице непредвиденных обстоятельств.
Ключевые предположения
- Случайная выборка:Данные должны быть случайным образом отобраны из интересующего населения.
- Независимость:Наблюдения должны быть независимыми друг от друга.
- Размер выборки:Ожидаемые частоты должны составлять не менее 5 из не менее 80% Ни одна клетка не должна иметь ожидаемую частоту менее 1.
- Исчерпывающие категории:Категории должны быть взаимоисключающими и коллективно исчерпывающими.
Применение в различных областях
Медицинская помощь
Связь между лечением и результатами, распространенность заболевания среди населения или эффективность медицинских вмешательств.
Социальные науки
Анализ взаимосвязи между демографическими переменными, моделями голосования, уровнями образования или ответами на опросы.
Бизнес и маркетинг
Изучение потребительских предпочтений, сегментации рынка, оценки удовлетворенности продуктом или результатов A / B тестирования.
Распространенные заблуждения
- Причинность:Тесты Chi-Square показывают связь, а не причинно-следственную связь.
- Маленькие образцы:Тест может быть ненадежным с небольшими ожидаемыми частотами.
- Отрицательные значения:Цифровые значения всегда неотрицательны.
- Непрерывные данные:Chi-Square предназначен для категориальных данных, а не для непрерывных переменных.
Шаг за шагом Процедура тестирования Chi-Square
-
Формулировать гипотезы
Нулевая гипотеза (H0):Переменные являются независимыми или наблюдаемыми частотами, соответствующими ожидаемым частотам.
Альтернативная гипотеза (H1):Переменные связаны или наблюдаемые частоты отличаются от ожидаемых частот.
-
Создать резервную таблицу наблюдаемых значенийОрганизуйте категориальные данные в таблицу, показывающую частоты для каждой комбинации категорий.
-
Рассчитать ожидаемые частотыДля каждой ячейки: Ожидаемое количество = (Row total × Column total)
-
Расчет статистики Chi-Squareχ2 = Σ((O - E)2/E) по всем ячейкам
-
Определение степеней свободы (df)Для таблиц непредвиденных расходов: df = (r - 1) × (c - 1)
-
Найти критическое значение или p-значениеИспользуйте таблицы распределения Chi-Square или статистическое программное обеспечение для определения значимости.
-
Примите решениеЕсли p-значение< α (typically 0.05), reject H₀.
Визуализация теста Chi-Square

Ши-квадратные кривые распределения вероятностей для различных степеней свободы (df)
Продвинутые темы
Исправление Йейтса
Для таблиц 2×2 с малыми ожидаемыми частотами может быть применена коррекция Йейтса для снижения риска ошибки типа I.
Альтернативы для небольших образцов
Точный Фишер Тестирование часто предпочтительнее, когда размеры выборки малы, а ожидаемые частоты меньше 5.
Формула Chi-Square
Для определения существенной разницы между ожидаемой и наблюдаемой частотами в одной или нескольких категориях используется тест хи-квадрата.
Где:
- χ2 - это статистика хи-квадрата
- O - наблюдаемое значение
- E - ожидаемая величина
- Σ - сумма всех категорий
Как рассчитать Chi-Square
Чтобы рассчитать хи-квадрат, выполните следующие действия:
-
1Сбор наблюдаемых и ожидаемых значений для каждой категории
-
2Расчет (O - E)2/E для каждой категории
-
3Суммируйте все значения, чтобы получить статистику хи-квадрата
-
4Вычислите p-значение, используя распределение chi-квадрата
Толкование результатов Chi-Square
Понимание того, что тест chi-square говорит вам о ваших данных:
-
1Маленький Chi-Square Значение:
Указывает, что наблюдаемые значения близки к ожидаемым.
-
2Большой Chi-Square Значение:
Указывает на значительную разницу между наблюдаемыми и ожидаемыми значениями.
-
3Интерпретация ценностей:
P-значение< 0.05 suggests rejecting the null hypothesis.
Практические примеры
Пример 1Генетический крест
Наблюдение: 30, 20, 20, 30
Ожидаемые: 25, 25, 25, 25
Чи-квадрат = 4.0
P-значение = 0,2615
Результаты не являются статистически значимыми.
Пример 2Результаты опроса
Наблюдение: 40, 60, 30, 70
Ожидаемые: 50, 50, 50, 50
Чи-квадрат = 20,0
P-значение = 0,0002
Результаты являются статистически значимыми.
Пример 3Дис Ролл
Наблюдение: 18, 17, 16, 19, 15, 15
Ожидаемые: 17, 17, 17, 17, 17, 17, 17
Чи-квадрат = 0,941
P-значение = 0,967
Смерть кажется справедливой.