チースクエア計算機
あなたの観察値と期待値のchi-square統計値とp値を計算します。
データを入力
Chi-Squareテストの包括的なガイド
Chi-Squareテストは、分類データを分析するための最も重要で広く使用されている統計ツールの一つです。 研究者は、分類変数と観察頻度が予想される頻度と異なるかどうかの重要な関連付けがあるかどうかを判断するのに役立ちます。
チスクエアテストの種類
シースクエア 独立性のテスト
2つの分類変数間の重要な関係があるかどうかを判断するために使用される。 例えば、性別が投票の好みに関連付けられているかどうかのテスト。
フィットテストのチスクエアの良さ
標本データが細分分布と一致しているかどうかを判断するために使用される。 たとえば、サンプルの血液タイプの分布が予想される人口の割合と一致するかどうかのテスト。
数学財団
Chi-Squareの統計は、さまざまなカテゴリにわたって予想される周波数の比較に基づいています。 式は、観察値と期待値の間の四角形の差の合計を測定し、期待値で正規化します。
チスクエア分布
Chi-Square分布は、1つのパラメータで右スキュード確率分布の家族です:自由度(df)。 大陸テーブルにおける独立性のテストのために、自由度は次のように計算されます。
r は行数と c は、コンピテンシーテーブルの列数です。
主な前提
- ランダムサンプリング:データは、関心のある人口からランダムにサンプルされる必要があります。
- 独立性:観察は、互いに独立したものでなければなりません。
- サンプル サイズ:予想される周波数は少なくとも5少なくとも80% 細胞の、そして細胞に期待される頻度が1.よりよりより少しあるべきではないです。
- 排気カテゴリー:カテゴリーは、相互に排他的かつ集団的に排出されなければならない。
各種分野への応用
ヘルスケア
治療と結果、集団の病気の蔓延、または医療介入の有効性に関する関連付けのテスト。
社会科学
人口統計変数、投票パターン、教育レベル、または調査応答間の関係を分析します。
事業・マーケティング
消費者の嗜好、市場セグメンテーション、製品満足度スコア、またはA / Bテスト結果を見極めます。
一般的な誤解
- 死亡率:Chi-Squareテストでは、認証ではなく、関連付けを表示します。
- 小さいサンプル:試験は、予期せぬ頻度で信頼性が低い場合があります。
- 負の値:Chi-Square は、常に非負の値です。
- 連続的なデータ:Chi-Squareは、連続変数ではなく、分類データ用に設計されています。
ステップバイステップ チースクエアテスト手順
-
定形仮説
Null ヒポシス (H0):変数は独立したか観察された頻度は予想される頻度に一致します。
代替仮説 (H1):変数は、予想される周波数とは異なる関係または観察された周波数です。
-
観察値のコンポジションテーブルを作成する分類データを各カテゴリの組み合わせごとに周波数を示すテーブルに整理します。
-
予想される頻度を計算する各細胞のため: 予想数 = (合計×列合計) / グランド合計
-
チスクエア統計を計算するη2 = Σ((O - E)2 / E) 全セル全体
-
自由度(df)の決定対立表:df = (r - 1) × (c - 1))
-
重要な値またはp-valueの検索Chi-Square分布表または統計ソフトウェアを使用して、意義を決定します。
-
決定を下すp-value の場合< α (typically 0.05), reject H₀.
Chi-Squareテストの可視化
さまざまな自由度(df)のためのチスクエア確率分布曲線
高度なトピック
Yatesの修正
予想される頻度が小さい2×2のコンテンシブルテーブルでは、I型誤差のリスクを低減するためにYates'補正を適用することがあります。
小型サンプルの代替品
漁業の実例 サンプルサイズが小さく、予想される頻度が5未満の場合、テストはしばしば好まれる。
チースクエアフォーミュラ
chi-squareテストは、期待された周波数と観察頻度の重要な違いが1つ以上のカテゴリにあるかどうかを決定するために使用されます。
所在地:
- ε2 は chi-square 統計学
- O は観察値です
- E は期待値です
- Σ は全てのカテゴリーの合計
チスクエアを計算する方法
chi-squareを計算するには、次の手順に従ってください。
-
1各カテゴリの観察値と期待値を集める
-
2各カテゴリの計算(O - E)2 / E
-
3chi-square の statistic を取得するすべての値を Sum
-
4chi-square分布を使用してp値を計算する
Chi-Squareの検索結果の解釈
chi-squareテストがあなたのデータについてあなたに伝えているかを理解する:
-
1小さなチースクエア 価値:
観察値が期待値に近いものを示す。
-
2大知スクエア 価値:
観察値と期待値の大きな違いを示す。
-
3P-Valueの解釈:
P-値< 0.05 suggests rejecting the null hypothesis.
実用的な例
例1遺伝クロス
観察: 30, 20, 20, 30
期待値: 25, 25, 25, 25 25
チースクエア = 4.0
P-値 = 0.2615
結果は統計的に有意ではありません。
例2調査結果
観察: 40、60、30、70
期待される: 50、50、50、50
チースクエア = 20.0
P-値 = 0.0002
結果は統計的に有意である。
例3ダイス ロール
観察: 18、17、16、19、15
期待値: 17, 17, 17, 17, 17, 17
チースクエア = 0.941
P-値 = 0.967
死ぬことは公正であるように見えます。