분산분석

일원분산분석표 : 집단을 구분하는 한 범주형 원인변수에 의해 집단간분산(신호. signal) 생성, 신호의 비교 대상은 집단내분산(노이즈, noise)   변동: 편차제곱합 (Sum of Squared deviations) 자유도 (degree of freedom) 분산: 편차제곱평균 (Mean of Squared deviations) 검정통계량 (test statistic) 집단간(Between) $SS_{B}$ $k-1$ 여기서, $k$는 표본내 집단수 ${MS}_{B}=dfrac{SS_{B}}{k-1}$ 집단간분산(Between variance) $F=dfrac{MS_{B}}{MS_{W}}$ 집단내(Within) $SS_{W}$ $n-k$ 여기서, $n$은 표본크기(표본의 개체수) $k$는 […]

변동과 자유도, 그리고 분산

표본변동(sample variation)의 구성요소(components of variance) 표본변동의 구성요소 제곱합 표기 다른 표기 영문 개념 $X$변수 편차제곱합 $SS_{X}$ $SSX$ Sum of Squares for X $SS_{X}$는 내적(inner product) $X$변수 편차의 제곱의 합 $Y$변수 편차제곱합 $SS_{Y}$ $SSY$ Sum of Squares for Y $SS_{Y}$는 내적(inner product) $Y$변수 편차의 제곱의 합 대응된 $X$변수와 $Y$변수의 편차곱합 $SP_{XY}$ $SPXY$ Sum of the Products […]

모수 가설검정

모평균 Z검정 : 모평균($mu$)와 주어진 평균($mu_0$)의 비교 – 정규분포 가정 – 모분산을 아는 경우 귀무가설($H_0$) 검정통계량 대립가설($H_1$) 귀무가설 기각역 $$mu=mu_0$$ $$dfrac{bar{X}-mu_0}{dfrac{sigma_X}{sqrt{n}}}$$ $$mugtmu_0$$ $$dfrac{bar{X}-mu_0}{dfrac{sigma_X}{sqrt{n}}}gt z_{alpha}$$ $$multmu_0$$ $$dfrac{bar{X}-mu_0}{dfrac{sigma_X}{sqrt{n}}}lt -z_{alpha}$$ $$muneqmu_0$$ $$left|dfrac{bar{X}-mu_0}{dfrac{sigma_X}{sqrt{n}}}right|gt z_{frac{alpha}{2}}$$ 모분산 카이제곱($chi^2$)검정 : 모분산($sigma^2$)과 주어진 분산($sigma_0^2$)의 비교 – 정규분포 가정 귀무가설($H_0$) 검정통계량 대립가설($H_1$) 귀무가설 기각역 $$sigma^2=sigma^2_0$$ $$(n-1)dfrac{S^2}{sigma_0^2}$$ $$sigma^2gtsigma^2_0$$ $$(n-1)dfrac{S^2}{sigma_0^2}gtchi_{n-1 ; alpha}^2$$ $$sigma^2ltsigma^2_0$$ $$(n-1)dfrac{S^2}{sigma_0^2}ltchi_{n-1 ; alpha}^2$$ $$sigma^2nesigma^2_0$$ […]

확률분포

이산균등분포 – Discrete uniform distribution 표기 Support Parameter 확률분포도 확률질량함수 모멘트생성함수 엔트로피 $f(k , ; a, b)$ $K sim U{a,b}$ $k in {a,a+1,ldots, b-1,b}$ $k$는 $a$이상이고 $b$이하인 정수 $a$와 $b$ $a$와 $b$는 정수 $b geq a$ $therefore n=b-a+1$ $f(k , ;  a, b)=dfrac{1}{n}$ for $aleq kleq b$ $f(k , ; a, b)=0$ if not $aleq […]

도수분포표와 교차표

1차원 관찰도수분포표 – 한 범주형 확률변수의 관찰도수분포표   범주형 확률변수 $A$의 변수값 관찰도수 합 $A_{1}$ $A_{2}$ $cdots$ $A_{c}$ 관찰도수 $O_{j}$ $O_{1}$ $O_{2}$ $cdots$ $O_{c}$ $sumlimits_{j=1}^{c}O_{j}=n$   1차원 기대도수분포표 – 한 범주형 확률변수의 상대도수분포표   범주형 확률변수 $A$의 변수값 상대도수 합 $A_{1}$ $A_{2}$ $cdots$ $A_{c}$ 상대도수 $P_{j}$ $P_{1}=dfrac{O_1}{n}$ $P_{2}=dfrac{O_2}{n}$ $cdots$ $P_{c}=dfrac{O_c}{n}$ $sumlimits_{j=1}^c {P_j}=1$   2차원 관찰도수분포표 […]

분위와 분위수

표준정규분포에서의 4분위 : 4분위는 같은 확률(기대빈도수)을 가지는 4개의 이어진 범주 분위 속성 표준정규분포 4분위 1/4분위 2/4분위 3/4분위 4/4분위 확률 0.25 0.25 0.25 0.25 4분위수 1/4분위수 $approx -0.67449$ 2/4분위수 $= 0$ 3/4분위수 $approx 0.67449$ 4/4분위수$ =  infty $ 100분위수 25/100분위수$ approx -0.67449$ 50/100분위수$ = 0$ 75/100분위수$ approx 0.67449$ 100/100분위수$ = infty$ 정규분포에서의 4분위 : 4분위는 같은 […]

교차분석 카이제곱검정

데이터 모델링 모델링 데이터분석 프로그래밍 표본종류: 대응표본 확률변수가정: 등분산성, 독립성, 정규성 새확률변수: 각 Cell의 표본확률차이의 합 표집분포: 표본카이제곱 중심극한정리 검정확률분포: 카이제곱분포 검정통계량: 표본카이제곱과 표준오차의 비 귀무가설: 유전자형 별 마블링스코어의 확률분포는 같다. 가설검정: 유의확률과 유의수준을 비교 정규분포 $$f(x , ; mu_X, sigma_X^2)=dfrac{1}{sqrt{2pi}sigma_X} mathrm{exp} left(-dfrac{(x-mu_X)^2}{2sigma_X^2}right)$$ 여기서, $x$는 정규분포를 나타내는 확률변수, $X$의 값(변량) $mu_X$는 확률변수, $X$의 기대값: 집단의 […]

단순선형회귀분석 F검정

데이터 모델링 모델링 데이터분석 프로그래밍 표본종류: 대응표본 확률변수가정: 선형성, 등분산성, 독립성, 정규성 새확률변수: 결정계수(공분산제곱과 분산곱의 비) 표집분포: 결정계수 중심극한정리 검정확률분포: F분포 검정통계량: 표본결정계수와 표준오차의 비 귀무가설: 마블링스코어로 설명되는 등심지방함량은 0 가설검정: 유의확률과 유의수준을 비교 정규분포 $$f(y , ; mu_Y, sigma_Y^2)=dfrac{1}{sqrt{2pi}sigma_Y} mathrm{exp} left(-dfrac{(y-mu_Y)^2}{2sigma_Y^2}right)$$ 여기서, $y$는 정규분포를 나타내는 확률변수, $Y$의 값(변량) $mu_Y$는 확률변수, $Y$의 기대값: 집단의 모평균 […]

상관분석 t검정

데이터 모델링 모델링 데이터분석 프로그래밍 표본종류: 대응표본 확률변수가정: 선형성, 정규성 새확률변수: 상관계수(공분산/표준편차곱) 표집분포: 상관계수 중심극한정리 검정확률분포: t분포 검정통계량: 표본상관계수와 표준오차의 비 귀무가설: 마블링스코어와 등심지방함량의 상관계수는 0 가설검정: 유의확률과 유의수준을 비교 정규분포 $$f(y , ; mu_Y, sigma_Y^2)=dfrac{1}{sqrt{2pi}sigma_Y} mathrm{exp} left(-dfrac{(y-mu_Y)^2}{2sigma_Y^2}right)$$ 여기서, $y$는 정규분포를 나타내는 확률변수, $Y$의 값(변량) $mu_Y$는 확률변수, $Y$의 기대값: 집단의 모평균 $sigma_Y^2$는 확률변수, $Y$의 모분산: […]

일원분산분석 F검정

데이터 모델링 모델링 데이터분석 프로그래밍 표본종류: 독립표본(여러 집단) 확률변수가정: 등분산성, 독립성, 정규성 새확률변수: 집단간분산/집단내분산 표집분포: 표본분산 중심극한정리 검정확률분포: F분포 검정통계량: 신호(집단분산)와 노이즈(개체분산)의 비 귀무가설: 도체중의 지역에 의한 신호는 0 가설검정: 유의확률과 유의수준을 비교 정규분포 $$f(y , ; mu_Y, sigma_Y^2)=dfrac{1}{sqrt{2pi}sigma_Y} mathrm{exp} left(-dfrac{(y-mu_Y)^2}{2sigma_Y^2}right)$$ 여기서, $y$는 정규분포를 나타내는 확률변수, $Y$의 값(변량) $mu_Y$는 확률변수, $Y$의 기대값: 집단의 모평균 $sigma_Y^2$는 […]