DATA SCIENCE - p값 : 27
eISSN 0000-0000

모수 가설검정

모평균 Z검정 : 모평균($\mu$)와 주어진 평균($\mu_0$)의 비교 - 정규분포 가정 - 모분산을 아는 경우

귀무가설($H_0$)검정통계량대립가설($H_1$)귀무가설 기각역
$$\mu=\mu_0$$$$\dfrac{\bar{X}-\mu_0}{\dfrac{\sigma_X}{\sqrt{n}}}$$$$\mu\gt\mu_0$$$$\dfrac{\bar{X}-\mu_0}{\dfrac{\sigma_X}{\sqrt{n}}}\gt z_{\alpha}$$
$$\mu\lt\mu_0$$$$\dfrac{\bar{X}-\mu_0}{\dfrac{\sigma_X}{\sqrt{n}}}\lt -z_{\alpha}$$
$$\mu\neq\mu_0$$$$\left|\dfrac{\bar{X}-\mu_0}{\dfrac{\sigma_X}{\sqrt{n}}}\right|\gt z_{\frac{\alpha}{2}}$$

모분산 카이제곱($\chi^2$)검정 : 모분산($\sigma^2$)과 주어진 분산($\sigma_0^2$)의 비교 - 정규분포 가정

귀무가설($H_0$)검정통계량대립가설($H_1$)귀무가설 기각역
$$\sigma^2=\sigma^2_0$$$$(n-1)\dfrac{S^2}{\sigma_0^2}$$$$\sigma^2\gt\sigma^2_0$$$$(n-1)\dfrac{S^2}{\sigma_0^2}\gt\chi_{n-1\ ;\ \alpha}^2$$
$$\sigma^2\lt\sigma^2_0$$$$(n-1)\dfrac{S^2}{\sigma_0^2}\lt\chi_{n-1\ ;\ \alpha}^2$$
$$\sigma^2\ne\sigma^2_0$$$$(n-1)\dfrac{S^2}{\sigma_0^2}\gt\chi_{n-1\ ;\ \frac{\alpha}{2}}^2$$
$$(n-1)\dfrac{S^2}{\sigma_0^2}\lt\chi_{n-1\ ;\ 1-\frac{\alpha}{2}}^2$$

모비율 Z검정 : 모비율($p$)과 주어진 비율($p_0$)의 비교 - 표본크기가 큰 경우

귀무가설($H_0$)검정통계량대립가설($H_1$)귀무가설 기각역
$$p=p_0$$$$\dfrac{\hat{p}-p_0}{\sqrt{\dfrac{p_0(1-p_0)}{n}}}$$$$p\gt p_0$$$$\dfrac{\hat{p}-p_0}{\sqrt{\dfrac{p_0(1-p_0)}{n}}}\gt z_\alpha$$
$$p\lt p_0$$$$\dfrac{\hat{p}-p_0}{\sqrt{\dfrac{p_0(1-p_0)}{n}}}\lt -z_\alpha$$
$$p\ne p_0$$$$\left|\dfrac{\hat{p}-p_0}{\sqrt{\dfrac{p_0(1-p_0)}{n}}}\right|\gt z_{\frac{\alpha}{2}}$$

대응된 두 집단의 모평균 차이 t검정 (대응표본 t검정) : 대응된 두 집단의 모평균 비교 - 정규분포 가정 - 등분산가정

귀무가설($H_0$)검정통계량대립가설($H_1$)귀무가설 기각역
$$\mu_1-\mu_2=D_0$$$$\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}$$$$\mu_1-\mu_2\gt D_0$$$$\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}\gt t_{n-1\ ;\ \alpha}$$
$$\mu_1-\mu_2\lt D_0$$$$\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}\lt-t_{n-1\ ;\ \alpha}$$
$$\mu_1-\mu_2\ne D_0$$$$\left|\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}\right|\gt t_{n-1\ ;\ \frac{\alpha}{2}}$$

독립된 두 집단의 모평균 차이 t검정 (독립표본 t검정) : 독립된 두 집단의 모평균 비교 - 정규분포 가정 - 등분산 가정

귀무가설($H_0$)검정통계량대립가설($H_1$)귀무가설 기각역
$\mu_{X_2} – \mu_{X_1}=D_0$

$$\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_P^2}{n_1}+\dfrac{S_P^2}{n_2}}}$$

여기서,  $S_p^2=\dfrac{(n_1-1)S_{X_1}^2+(n_2-1)S_{X_2}^2}{n_1+n_2-2}$

$\mu_{X_2} – \mu_{X_1} \gt D_0$$t \lt -t_{n-2\ ;\  \alpha}$
$\mu_{X_2} – \mu_{X_1} \lt D_0$$t \gt t_{n-2\ ;\ \alpha}$
$\mu_{X_2} – \mu_{X_1} \ne D_0$$\mid {t} \mid \gt t_{n-2\ ;\ \frac{\alpha}{2}}$

독립된 두 집단의 모평균 차이 웰치 t검정 : 모분산이 다른 독립된 두 집단의 모평균 비교 - 정규분포 가정

귀무가설($H_0$)검정통계량대립가설($H_1$)귀무가설 기각역
$\mu_{X_2} – \mu_{X_1}=D_0$

$$\dfrac{(\bar{X}_2-\bar{X}_1)}{\sqrt{\dfrac{S_{X_1}^2}{n_1}+\dfrac{S_{X_2}^2}{n_2}}}$$

여기서, 지유도는 $\phi$

$\phi=\dfrac{\left(\dfrac{S_{X_1}^2}{n_1}+\dfrac{S_{X_2}^2}{n_2}\right)^2}{\dfrac{{\left(\dfrac{S_{X_1}^2}{n_1}\right)}^2}{n_1-1}+\dfrac{{\left(\dfrac{S_{X_2}^2}{n_2}\right)}^2}{n_2-1}}$

$$\mu_{X_2}-\mu_{X_1}\gt D_0$$$$\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}\gt t_{n_1+n_2-2\ {\rm or}\ \phi\ ;\ \alpha}$$
$$\mu_{X_2}-\mu_{X_1}\lt D_0$$$$\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}\lt t_{n_1+n_2-2 \,\, {\rm or} \,\,  \phi\ ;\ \alpha}$$
$$\mu_{X_2}-\mu_{X_1}\ne D_0$$$$\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}\gt t_{n_1+n_2-2 \,\, {\rm or} \,\,  \phi\ ;\ \frac{\alpha}{2}}$$

독립된 두 집단의 모분산 비 F검정 : 독립된 두 집단의 모분산 비교 - 정규분포 가정 

귀무가설($H_0$)검정통계량대립가설($H_1$)귀무가설 기각역
$$\sigma_1^2=\sigma_2^2$$$$\dfrac{s_1^2}{s_2^2}$$$$\sigma_1^2\gt\sigma_2^2$$$$\dfrac{s_1^2}{s_2^2}\gt F_{n_1-1,\ n_2-1\ ;\ \alpha}$$
$$\sigma_1^2\lt\sigma_2^2$$$$\dfrac{s_1^2}{s_2^2}\lt\ F_{n_1-1,\ n_2-1\ ;\ \alpha}$$
$$\sigma_1^2\ne\sigma_2^2$$$$\dfrac{s_1^2}{s_2^2}\gt F_{n_1-1,\ n_2-1\ ;1-\frac{\alpha}{2}}$$ $$\dfrac{s_1^2}{s_2^2}\lt F_{n_1-1,\ n_2-1\ ;\ \frac{\alpha} {2}}$$

독립된 두 집단의 모비율 Z검정 : 한 개체가 속하는 두 집단의 비율 비교 (이분형 변수의 확률검정)

귀무가설($H_0$)검정통계량대립가설($H_1$)귀무가설 기각역
$$ p_1=p_2$$$$\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}$$$$p_1\gt p_2$$$$\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}\gt z_{\alpha}$$
$$p_1\lt p_2$$$$\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}\lt -z_{\alpha}$$
$$p_1\ne p_2$$$$\left|\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}\right|\gt z_{\frac{\alpha}{2}}$$

집단간분산과 집단내분산 비 F검정 (일원분산분석 F검정) : 독립된 여러 집단의 모평균 비교 - 정규분포 가정 - 등분산 가정

귀무가설$(H_0)$검정통계량대립가설$(H_1)$귀무가설 기각역

독립된 여러 집단의 모평균($\mu_i$)는 같다.
$\mu_{1}=\mu_{2}=\cdots=\mu_{k}=\mu_0$
$\beta_{0,1}=\beta_{0,2}=\cdots=\beta_{0,k}=\beta_0$

여기서, $\mu_i$는 $i$번째 집단의 모평균
$\beta_{0,i}$는 $i$번째 집단의 모평균
$k$는 표본내 집단의 수
$\alpha$는 유의수준

$F=\dfrac{MS_{B}}{MS_{W}}$적어도 한 $\mu_{i}$는 $\mu_0$보다 크다.
적어도 한 $\beta_{0,i}$는 $\beta_0$보다 크다.
검정통계량으로 한 $\mu_{i}$가 $\mu_0$보다 큰 지 알 수 없다.
검정통계량으로 한 $\beta_{0,i}$가 $\beta_0$보다 큰 지 알 수 없다.
적어도 한 $\mu_{i}$는 $\mu_0$보다 작다.
적어도 한 $\beta_{0,i}$는 $\beta_0$보다 작다.
검정통계량으로 $\mu_{i}$가 $\mu_0$보다 작은 지 알 수 없다.
검정통계량으로 한 $\beta_{0,i}$가 $\beta_0$보다 작은 지 알 수 없다.
적어도 한 $\mu_{i}$는 $\mu_0$이 아니다.
적어도 한 $\beta_{0,i}$는 $\beta_0$이 아니다.

$F>F_{k-1,\ n-k\ ;\ \alpha}$

여기서, $k$는 표본내 집단의 수
$n$은 표본내 개체의 수: 표본크기

원인 A의 주효과 F검정 (이원분산분석 원인A의 F검정)

귀무가설$(H_0)$검정통계량대립가설$(H_1)$귀무가설 기각역
$\beta_{1,1}=\beta_{1,2}=\cdots=\beta_{1,k}=\beta_1$$F_1=\dfrac{MS_A}{MS_E}$적어도 한 $\beta_{1,k}$는 $\beta_1$보다 크다.검정통계량으로 $\beta_{1,k}$가 $\beta_1$보다 큰 지 알 수 없다.
적어도 한 $\beta_{1,k}$는 $\beta_1$보다 작다.검정통계량으로 $\beta_{1,k}$가 $\beta_1$보다 작은 지 알 수 없다.
적어도 한 $\beta_{1,k}$는 $\beta_1$이 아니다.$F_1\gt F_{a-1,\ n-ab\ ;\ \alpha}$

원인 B의 주효과 F검정 (이원분산분석 원인B의 F검정)

귀무가설($H_0$)검정통계량대립가설($H_1$)귀무가설 기각역
$$\beta_{2,1}=\beta_{2,2}=\cdots=\beta_{2,l}=\beta_2$$$F_2=\dfrac{MS_B}{MS_E}$적어도 한 $\beta_{2,l}$는 $\beta_2$보다 크다.검정통계량으로 $\beta_{2,l}$가 $\beta_2$보다 큰 지 알 수 없다.
적어도 한 $\beta_{2,l}$는 $\beta_2$보다 작다.검정통계량으로 $\beta_{2,l}$가 $\beta_2$보다 작은 지 알 수 없다.
적어도 한 $\beta_{2,l}$는 $\beta_2$이 아니다.$F_2\gt F_{b-1,\ n-ab\ ;\ \alpha}$

상호작용(교호작용)효과 F검정 (이원분산분석 상호작용의 F검정)

귀무가설$(H_0)$검정통계량의 값대립가설$(H_1)$귀무가설 기각역
$\gamma_{ij}=0$$F_3=\dfrac{MS_{AB}}{MS_E}$$\gamma_{ij} > 0$검정통계량으로 $\gamma_{ij}$가 0보다 큰 지 알 수 없다.
$\gamma_{ij} < 0$검정통계량으로 $\gamma_{ij}$가 0보다 작은 지 알 수 없다.
$\gamma_{ij}\neq0$$F_3\gt  F_{(a-1)(b-1),\ n-ab\ ;\ \alpha}$

카이제곱($\chi^2$)검정

귀무가설($H_0$)검정통계량대립가설($H_1$)귀무가설 기각역
$\chi_{obs}^2=0$$\chi_{obs}^2=\sum\limits_{i=1}^{r}\sum\limits_{j=1}^{c}\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}$$\chi_{obs}^2<0$$\chi_{obs}^2<-\chi^2_{(r-1)(c-1)\ ;\ \alpha}$
$\chi_{obs}^2>0$$\chi_{obs}^2>\chi^2_{(r-1)(c-1)\ ;\ \alpha}$
$\chi_{obs}^2\neq0$$\left|\chi_{obs}^2\right|>\chi^2_{(r-1)(c-1)\ ;\ \frac{\alpha}{2}}$

회귀직선과 잔차의 분산비  F검정 (단순선형회귀분석 F검정)

귀무가설$(H_0)$검정통계량대립가설$(H_1)$귀무가설 기각역
$$ \beta_1=\beta_{1,0}$$$F=\dfrac{MS_{Reg}}{MS_{Res}}$$$\beta_1<\beta_{1,0}$$검정통계량으로 $\beta_1$이 $\beta_{1,0}$보다 작은 지 알 수 없다. 
$$\beta_1>\beta_{1,0}$$검정통계량으로 $\beta_1$이 $\beta_{1,0}$보다 큰 지 알 수 없다. 
$$ \beta_1 \ne \beta_{1,0}$$$F\gt F_{1,\ n-2\ ;\ \alpha}$

모절편(모평균) t검정 (단순선형회귀분석 t검정)

귀무가설$(H_0)$검정통계량대립가설$(H_1)$ 귀무가설 기각역
$ \beta_0=\beta_{0,0}$

$t=\dfrac{\hat{\beta_0}-\beta_0}{\mathrm{SE}(\hat{\beta_0})}$

여기서, $SE(\beta_0) = s \sqrt{\dfrac{1}{n} + \frac{\bar{x}^2}{\sum\limits_{i=1}^{n} (x_i – \bar{x})^2}}$

$s$는 잔차표준편차
$n$은 표본크기
$\bar x$는 독립 변수 $x$의 평균값
$x_i$는 각 관측치의 독립변수값
$\sum\limits_{i=1}^{n}(x_i-\bar x)^2$는 각 $x_i$값과 $x$의 평균값($\bar x$) 차이의 제곱합

$\beta_0<\beta_{0, 0}$$t<-t_{n-2\ ;\ \alpha}$
$\beta_0>\beta_{0,0}$$t>t_{n-2\ ;\ \alpha}$
$\beta_0\ne\beta_{0,0}$$\mid {t} \mid \gt t_{n-2\ ;\ \frac{\alpha}{2}}$

모상관계수($\rho$) t검정 (상관분석 t검정): 모상관계수와 0비교 - 모상관계수를 $0$으로 아는 경우

귀무가설$(H_0)$검정통계량대립가설$(H_1)$귀무가설 기각역
$\rho=0$$$t=\dfrac{r}{\dfrac{\sqrt{1-r^2}}{\sqrt{n-2}}}$$$\rho<0$$t \lt -t_{n-2\ ;\ \alpha}$
$\rho>0$$t \gt t_{n-2\ ;\ \alpha}$
$\rho\neq0$$\mid {t} \mid \gt t_{n-2\ ;\ \frac{\alpha}{2}}$

모상관계수$(\rho)$ t검정 (상관분석 t검정): 모상관계수와 0비교 - 모상관계수를 $\rho_0$로 아는 경우

귀무가설$(H_0)$검정통계량대립가설$(H_1)$귀무가설 기각역
$\rho=\rho_0$

$$t=\dfrac{r-\rho_0}{\dfrac{\sqrt{1-r^2}}{\sqrt{n-2}}}$$

여기서,  $\rho_0$는 귀무가설일때 모상관계수 : 상관이 없으면 $\rho_0=0$
$r$은 표본상관계수

$\rho<\rho_0$$t<-t_{n-2\ ;\ \alpha}$
$\rho>\rho_0$$t>t_{n-2\ ;\ \alpha}$
$\rho\neq \rho_0$$\mid{t}\mid>t_{n-2\ ;\ \frac{\alpha}{2}}$

모기울기($\beta_1$} F검정 (단순선형회귀분석 F검정): 모기울기와 주어진 값 비교 - 모기울기를 $\beta_{1,0}$로 아는 경우

귀무가설$(H_0)$검정통계량대립가설$(H_1)$귀무가설 기각역
$$ \beta_1=\beta_{1,0}$$$F=\dfrac{MS_{Reg}}{MS_{Res}}$$\beta_1<\beta_{1,0}$검정통계량으로 $\beta_1$이 $\beta_{1,0}$보다 작은 지 알 수 없다. 
$\beta_1>\beta_{1,0}$검정통계량으로 $\beta_1$이 $\beta_{1,0}$보다 큰 지 알 수 없다. 
$$ \beta_1 \ne \beta_{1,0}$$$F\gt F_{1,\ n-2\ ;\ \alpha}$

모기울기($\beta_1$) t검정 (단순선형회귀 t검정): 모기울기와 주어진 값 비교 - 모기울기를 $\beta_{1,0}$로 아는 경우

귀무가설$(H_0)$검정통계량대립가설$(H_1)$귀무가설 기각역
$$ \beta_1=\beta_{1,0}$$

$$t=\dfrac{\hat{\beta_1}-\beta_{1,0}}{\mathrm{SE}(\hat{\beta_1})}$$

여기서, ${\rm SE}(\beta_1)$는 기울기의 표준오차: ${\rm SE}(\beta_1) = \sqrt{\dfrac{\sum\limits_{i=1}^{n}{(y_i – \hat{y}_i)^2} / (n-2)}{\sum\limits_{i=1}^{n}{(x_i – \bar{x})^2}}}$

$y_i$는 종속변수값

$\hat y_i$는 회귀선에 의해 예측된 종속 변수 값

$x_i$ 는 $i$번째 독립변수값

$ \bar x$는 독립변수값의 평균

$n$은 표본크기

$ \beta_1\lt\beta_{1,0}$$t\lt -t_{n-k-1\ ;\ \alpha}$
$ \beta_1\gt\beta_{1,0}$$t\gt t_{n-2\ ;\ \alpha}$
$ \beta_1\ne\beta_{1,0}$$\mid {t} \mid \gt t_{n-2\ ;\ \frac{\alpha}{2}}$

모기울기($\beta_i$) t검정 (다중선형회귀분석 t검정): 모기울기와 주어진 벡터 비교 - 모기울기를 $\beta_{i,0}$로 아는 경우

귀무가설$(H_0)$검정통계량대립가설$(H_1)$귀무가설 기각역
$ \beta_i=\beta_{i,0}$

$t=\dfrac{\hat{\beta_i}-\beta_{i,0}}{\mathrm{SE}(\hat{\beta_i})}$

여기서, ${\rm SE}(\beta_i)$는 $i$번째 독립변수와 원인변수의 기울기의 표준오차: ${\rm SE}(\beta_i) = \sqrt{\dfrac{\sum\limits_{i=1}^{k}\sum\limits_{j=1}^{n_i}{(y_{ij} – \hat{y}_{ij})^2} / (n-2)}{\sum\limits_{i=1}^{k}\sum\limits_{j=1}^{n_i}{(x_{ij} – \bar{x_i})^2}}}$

$y_{ij}$는 종속변수값

$\hat y_{ij}$는 회귀선에 의해 예측된 종속변수값

$x_{ij}$ 는 $i$번째 독립변수에서 $j$번째 값

$ \bar x_{i}$는 $i$번째 독립변수의 평균

$k$는 독립변수의 수

$n_i$은 $i$번째 독립변수값의 개수

$ \beta_i\lt\beta_{i,0}$$t\lt -t_{n-k-1\ ;\ \alpha}$
$ \beta_i\gt\beta_{i,0}$$t\gt t_{n-k-1\ ;\ \alpha}$
$ \beta_i\ne\beta_{i,0}$$\mid {t} \mid \gt  t_{n-k-1\ ;\ \frac{\alpha}{2}}$