DATA SCIENCE - p값 : 27
eISSN 0000-0000

변동, 자유도, 분산

표본변동(sample variation)의 구성요소(components of variance)

표본변동의 구성요소제곱합 표기다른 표기영문개념
$X$변수 편차제곱합$SS_{X}$$SSX$Sum of Squares for X

$SS_{X}$는 내적(inner product)

$X$변수 편차의 제곱의 합

$Y$변수 편차제곱합$SS_{Y}$$SSY$Sum of Squares for Y

$SS_{Y}$는 내적(inner product)

$Y$변수 편차의 제곱의 합

대응된 $X$변수와 $Y$변수의 편차곱합$SP_{XY}$$SPXY$Sum of the Products of Deviations of X and Y variables

$SP_{XY}$는 외적(cross product)

대응된 $X$변수와 $Y$변수의 편차의 곱의 합

총제곱합$SS_T$$SST$Sum of Squares Total

 표본내 개체 편차의 제곱의 합

$SS_{T}=SS_{B}+SS_{W}$

$SS_{T}=SS_{Tr}+SS_{E}$

$SS_{T}=SS_{Reg}+SS_{Res}$

집단간변동$SS_{B}$$SSB$Sum of Squares Between groups집단성분의 제곱의 합: 처리성분의 제곱의 합
집단내변동$SS_{W}$$SSW$Sum of Squares Within groups집단의 평균을 기준으로한 편차의 제곱의 합: 오차성분의 제곱의 합
처리제곱합$SS_{Tr}$$SSTr$Sum of Squares Treatment 처리성분의 제곱의 합
오차제곱합$SS_{E}$$SSE$Sum of Squares Error오차성분의 제곱의 합
회귀제곱합$SS_{Reg}$$SSR$Sum of Squares Regression회귀성분의 제곱의 합
잔차제곱합$SS_{Res}$$SSE$Sum of Squares Residual잔차성분의 제곱의 합 

표본자유도(sample degree of freedom)의 구성요소(components of variance)

표본자유도 구성요소표본자유도 표기

표본자유도

표본크기(n)=데이터포인트 수

영문개념
$X$변수 자유도$df_{X}$$n-1$ degree of freedom for X$X$변수 편차의 제곱의 합의 개체의 자유도
$Y$변수 자유도$df_{Y}$$n-1$degree of freedom for Y$Y$변수 편차의 제곱의 합 개체의 자유도
대응된 $X$변수와 $Y$변수의 자유도$df_{XY}$$n-1$degree of freedom for X and Y variables대응된 $X$변수와 $Y$변수의 편차곱의 합의 개체의 자유도
총자유도$df_{T}$$n-1$degree of freedom of Total 표본내 개체 편차의 제곱의 합의 집단과 개체의 자유도
집단간 자유도
(표본내 집단의 자유도)
$df_{B}$

$k-1$

여기서, $k$는 집단수

degree of freedom of Between-groups집단평균(집단성분)의 제곱의 합: 처리성분의 제곱의 합의 집단의 자유도
집단내 자유도
(표본내 개체의 자유도)
$df_{W}$

$n-k$

여기서, $n$은 표본크기

$k$는 집단수

degree of freedom of Within-groups집단의 평균을 기준으로한 편차의 제곱의 합: 오차성분의 제곱의 합 개체의 자유도
처리 자유도$df_{Tr}$

$a-1$

여기서, $a$는 처리의 개수

degree of freedom of Treatment 처리성분의 제곱의 합 집단의 자유도
오차 자유도$df_{E}$

$n-a$

여기서, $n$은 표본크기

$a$는 처리의 개수

degree of freedom of Error오차성분의 제곱의 합 개체의 자유도
회귀 자유도$df_{Reg}$

$k-1$

여기서, $k$는 집단수: $k=2$

degree of freedom of Regression회귀성분의 제곱의 합의 집단의 자유도
잔차 자유도$df_{Res}$

$n-k$

여기서, $n$은 표본크기

$k$는 집단수: $k=2$

degree of freedom of Residual잔차성분의 제곱의 합 개체의 자유도

표본분산(sample variance)의 구성요소(components of variance)

표본분산 구성요소 제곱평균 표기 다른 표기 분산 표기 영문 개념
$X$변수 편차제곱평균 $MS_{X}$ $MSX$ $s_{X}^2$ Mean Squared Deviation of X $X$변수 편차의 제곱의 평균: $X$변수 편차제곱합을 자유도로 나눈 값
$Y$변수 편차제곱평균 $MS_{Y}$ $MSY$ $s_{Y}^2$ Mean Squared Deviation of Y $Y$변수 편차의 제곱의 평균: $Y$변수 편차제곱합을 자유도로 나눈 값
대응된 $X$변수와 $Y$변수의 편차곱의 평균 $MP_{XY}$ $\text{Cov}[X, Y]$ $s_{XY}$ Mean of the Product of Deviations of X and Y variables
Covariance of X and Y variables

$X$와 $Y$의 편차곱의 평균: $X$변수와 $Y$변수의 편차곱의 합을 자유도로 나눈 값

$s^2_{X – Y} \leq s^2_{X} + s^2_{Y} + 2 \cdot |s_{XY}|$

$ r=\dfrac{s_{XY}}{s_Xs_Y}$

총제곱평균 $MS_{T}$ $MST$ $s_{T}^2$ Mean Squared Total 표본내 개체 편차의 제곱의 평균: 총제곱합을 표본의 자유도로 나눈 값
집단간분산 $MS_{B}$ $MSB$ $s_{B}^2$ Mean Squared Between-groups 집단의 편차의 제곱의 평균: 표본내 집단평균성분의 제곱합을 표본내 집단의 자유도로 나눈 값
집단내분산 $MS_{W}$ $MSW$ $s_{W}^2$ Mean Squared Within-groups 집단내 개체의 편차의 제곱의 평균: 집단내 개체의 편차제곱의 합을 표본내 개체의 자유도로 나눈 값
처리제곱평균 $MS_{Tr}$ $MSTr$ $s_{Tr}^2$ Mean Square for Treatment 처리성분의 제곱의 평균: 처리성분 제곱의 합을 자유도로 나눈 값
오차제곱평균 $MS_{E}$ $MSE$ $s_{E}^2$ Mean Squared Error 오차성분의 제곱의 평균: 오차성분 제곱의 합을 자유도로 나눈 값
회귀제곱평균 $MS_{Reg}$ $MSR$ $s_{Reg}^2$ Mean Squared Regression 회귀성분의 제곱의 평균: 회귀성분 제곱의 합을 자유도로 나눈 값
잔차제곱평균 $MS_{Res}$ $MSE$ $s_{Res}^2$ Mean Squared Residuals

잔차성분의 제곱의 평균: 잔차성분 제곱의 합을 자유도로 나눈 값

$s_{Reg}^2 \leq s_{Res}^2$

표본변동과 표본자유도와 표본분산의 구성요소의 관계식

표본변동의 구성요소제곱합 표기표본자유도의 구성요소표본자유도 표기

표본자유도

표본크기(n)=데이터포인트 수

표본분산의 구성요소제곱평균 표기표본분산 표기관계식
$X$변수 편차제곱합$SS_{X}$$X$변수 자유도$df_{X}$$n-1$$X$변수 편차제곱평균$MS_{X}$$s_{X}^2$

$MS_{X}=\dfrac{SS_{X}}{df_{X}}$

$SS_{X}=(n-1) \cdot s_{X}^2$

$Y$변수 편차제곱합$SS_{Y}$$Y$변수 자유도$df_{Y}$$n-1$$Y$변수 편차제곱평균$MS_{Y}$$s_{Y}^2$

$MS_{Y}=\dfrac{SS_{Y}}{df_{Y}}$

$SS_{Y}=(n-1) \cdot s_{Y}^2$

대응된 $X$변수와 $Y$변수의 편차곱합$SP_{XY}$대응된 $X$변수와 $Y$변수의 자유도$df_{XY}$$n-1$대응된 $X$변수와 $Y$변수의 편차곱의 평균$MP_{XY}$$s_{XY}$

$MP_{X}=\dfrac{SP_{X}}{df_{XY}}$

$SP_{XY}=(n-1) \cdot s_{XY}^2$

총제곱합$SS_{T}$총자유도$df_{T}$$n-1$총제곱평균$MS_{T}$$s_{T}^2$

$MS_{T}=\dfrac{SS_{T}}{df_{T}}$

$SS_{T}=(n-1) \cdot s_{T}^2$

집단간변동$SS_{B}$집단간 자유도
(표본내 집단의 자유도)
$df_{B}$

$k-1$

여기서, $k$는 집단수

집단간분산$MS_{B}$$s_{B}^2$

$MS_{B}=\dfrac{SS_{B}}{df_{B}}$

$SS_{B}=(k-1) \cdot s_{B}^2$

집단내변동$SS_{W}$집단내 자유도
(표본내 개체의 자유도)
$df_{W}$

$n-k$

여기서, $n$은 표본크기

$k$는 집단수

집단내분산$MS_{W}$$s_{W}^2$

$MS_{W}=\dfrac{SS_{W}}{df_{W}}$

$SS_{W}=(n-k) \cdot s_{W}^2$

처리제곱합$SS_{Tr}$처리 자유도$df_{Tr}$

$a-1$

여기서, $a$는 처리의 개수

처리제곱평균$MS_{Tr}$$s_{Tr}^2$

$MS_{Tr}=\dfrac{SS_{Tr}}{df_{Tr}}$

$SS_{Tr}=(a-1) \cdot s_{Tr}^2$

오차제곱합$SS_{E}$오차 자유도$df_{E}$

$n-a$

여기서, $n$은 표본크기

$a$는 처리의 개수

오차제곱평균$MS_{E}$$s_{E}^2$

$MS_{E}=\dfrac{SS_{E}}{df_{E}}$

$SS_{E}=(n-a) \cdot s_{E}^2$

회귀제곱합$SS_{Reg}$회귀 자유도$df_{Reg}$

$k-1$

여기서, $k=2$

회귀제곱평균$MS_{Reg}$$s_{Reg}^2$

$MS_{Reg}=\dfrac{SS_{Reg}}{df_{Reg}}$

$SS_{Reg}=(2-1) \cdot s_{Reg}^2$

잔차제곱합$SS_{Res}$잔차 자유도$df_{Res}$

$n-k$

여기서, $n$은 표본크기

$k=2$

잔차제곱평균$MS_{Res}$$s_{Res}^2$

$MS_{Res}=\dfrac{SS_{Res}}{df_{Res}}$

$SS_{Res}=(n-2) \cdot s_{Res}^2$