고정효과를 추정(estimaion)한다면 랜덤효과는?
목차 예측(prediction)합니다. 혼합선형모델(LLM)에서 고정효과는 모델의 구조를 설명하는 상수이고, 랜덤효과는 각 집단의 편차를 예측한 확률변수값이며 모델을 보정합니다. 혼합선형모델에서 고정효과인 모수를 BLUE로 추정하고 랜덤효과인 확률변수값을 BLUP로 예측합니다. 혼합선형모델에서 고정효과와 랜덤효과는 함께 작동하며, 고정효과를 추정한 후 랜덤효과를 예측하여 전체 모델이 완성됩니다. 1. 고정효과 선형모델 고정효과(fixed effects) 선형모델(linear model)은 모든 효과를 고정된 상수(모수)로 간주하여 구성된 선형모델입니다. 이 모델은 집단 […]
순서형 변수의 수준과 계층구조의 수준은 같은 것?
목차 순서형 변수의 수준(level)과 계층구조의 수준(level)은 개념적으로 다릅니다. 1. 순서형 변수에서의 수준(level) 순서형 변수의 변수값인 범주명을 수준(level)이라고 부릅니다. 순서형 변수인 “교육수준”의 변수값(수준, level)은 다음과 같습니다. 고졸, 대졸, 대학원졸 순서형 변수에서의 수준의 특징은 다음과 같습니다. 1. 순서 존재: 수준 간에는 명확한 서열(순서)이 존재 예: 고졸 < 대졸 < 대학원졸 2. 간격 불균등: 수준 간 간격은 동일하다고 가정할 수 […]
집단에서의 개체는 전체집단에서는 무엇?
목차 집단입니다. 계층구조에서는 집단도 하나의 개체처럼 취급합니다. 계층구조에서는 전체 변동성을 서로 다른 계층(hierarchy, 수준, level)에서의 변동성으로 분해해서 봅니다. 이를 분산의 계층적 분해 (hierarchical variance decomposition) 라고 합니다. 등분산가정 2계층 모델 $$Y_{ij}=mu+u_j+epsilon_{ij}$$ 여기서, $ Y_{ij}$는 $j$번째 집단에 속한 $i$번째 개체의 관측값 $mu$는 전체평균 $u_j$는 $j$번째 집단의 오차: $u_j sim mathcal{N}(0, sigma_u^2)$ (등분산가정) $epsilon_{ij}$는 $j$번째 집단의 $i$번째 […]
평균없는 분산이 있을 수 있나?
목차 없습니다. 분산은 평균이라는 기준이 있어야 정의되는 퍼짐의 정도입니다. 특별히, 평균이 상수값이고 분산이 0인 경우는 축소분포(degenerate distribution)입니다. 이산형일 때, 축소분포는 사건의 확률로 표현합니다 $$P(X=c)=1$$ 연속형일 때, 축소분포는 Dirac delta 함수로 표현합니다. $$delta(x – c)$$ 또한, 평균이 0이고 분산이 무한대인 경우는 자유도가 $1 < nu leq 2$인 t분포입니다. 자유도가 1인 t분포는 Cauchy분포라고도 합니다. 1. 집단의 평균과 […]
정수, 유리수, 무리수, 실수 중에서 연속인 수체계는?
목차 실수입니다. 연속성의 필요성: 연속성이 보장된 실수 함수 위에서만 미분과 적분이 성립됩니다. 시간, 거리, 온도 등의 연속적인 양은 실수로 표현되어야 합니다. 극값을 정의하고 분석하기 위해서는 함수가 연속적이어야 하며, 이러한 연속성은 실수 공간에서 보장됩니다. 1. 수체계 수체계(Number System)는 수학적 연산과 논리 체계 내에서 수의 집합들을 공리적으로 정의하고, 그 위상 및 대수적 구조에 따라 분류한 계층적 구조입니다. […]
정규분포를 따르는 확률변수의 벡터가 생성하는 표현공간에서의 결합확률분포는 무엇?
목차 다변량 정규분포(multivariate normal distribution)입니다. 변량은 확률변수의 실제 관측값을 의미합니다. 어떤 확률공간 $(Omega, mathcal{F}, P)$ 위에 정의된 정규분포 확률변수 벡터 $ mathbf{X} = (X_1, ldots, X_n)^top $가 있을 때, 그 벡터가 표현공간 $ mathbb{R}^n $에서 따르는 결합확률분포 $ P_{mathbf{X}} $는 다변량 정규분포 $mathcal{N}(boldsymbol{mu}, boldsymbol{Sigma})$입니다. 확률변수는 항상 어떤 확률공간 ($Omega$, $mathcal{F}$, $P$) 상에 정의됩니다. 정규분포를 나타내는 […]
다변량 정규분포는 여러 개의 정규분포를 합친 것인가?
목차 아니요, 변량(확률변수값) 간의 상관이 있어야 합니다. 다변량 정규분포는 정규성과 상관이 있는 확률변수들을 원소로 하는 벡터의 확률분포입니다. 개체의 속성이 정규분포를 나타내고 개체의 속성이 서로 상관을 가질 때 개체가 이루는 집단의 속성의 분포는 확률변수 벡터로 표현되며 그 벡터는 다변량 정규분포를 나타냅니다. 다변량 정규분포를 나타내는 대표적인 확률변수 벡터로는 집단의 육종가 벡터가 있습니다. [mathbf{a} = begin{pmatrix}a_1 \a_2 \vdots […]
정규분포는 표본의 평균과 분산이 독립인 유일한 확률분포인가요?
목차 네, 정규분포의 표본평균과 표본분산은 확률변수이고 독립입니다. 정규분포 $mathcal{N}(mu, sigma^2)$ 에서 추출된 모든 $n geq 2$의 표본에서 표본평균($ bar{X}$)과 표본분산$(S^2)$은 독립입니다. $$bar{X} perp S^2$$ 표본의 평균과 분산이 독립이라는 것은 어느 표본의 평균값을 알아도 분산값을 예측할 수 없고 반대도 마찬가지라는 것입니다. 1. 정규분포 정규분포 $X sim mathcal{N}(mu, sigma^2)$의 확률밀도함수는 다음식으로 표현됩니다.$$f(x) = frac{1}{sqrt{2pi sigma^2}} expleft( -frac{(x […]
상대도수는 모비율 추정량의 실현값인가?
목차 네. 상대도수(relative frequency)는 모비율 추정량의 실현값입니다. $$hat{p}_{mathrm{obs}} = dfrac{x}{n}$$ 여기서, $hat{p}_{mathrm{obs}}$은 관측된 표본의 상대도수 $x$는 실현된 성공회수 $n$은 표본크기 모비율은 특정 사건이 일어나는 데 성공하는 비율이며 알 수 없는 상수입니다. $$pi = P(text{특정사건})$$ 모비율 추정량은 표본비율(sample proportion)이며 분포를 가지는 확률변수입니다. $$hat{p} = dfrac{X}{n}, quad X sim mathrm{Binomial}(n, pi)$$ 여기서, $hat{p}$은 모비율 추정량 1. […]
회귀를 중심극한정리의 확장으로 볼 수 있나?
목차 네. 회귀는 중심극한정리의 개념확장으로 볼 수 있습니다. 회귀계수는 중심극한정리의 결과로 정규분포를 따르는 추정량입니다. 중심극한정리는 “표본 평균이 반복 표집을 통해 확률변수로 표현되며 정규분포로 수렴”한다는 내용을 담고 있습니다. 회귀분석에서는 회귀계수가 표본에 따라 변하는 추정량(확률변수)이며, 이 역시 정규분포로 수렴합니다. 이건 다변량 중심극한정리의 적용 결과입니다. 회귀는 중심극한정리의 수학적 확장은 아니지만, “평균을 확률적으로 추정한다”는 통계적 사고의 다차원적·함수적 확장으로 이해할 […]