연속확률분포에서 분위수와 누적분포함수의 관계는?
CONTENTS 역함수 관계입니다. 분위수(Quantile, $Q(p)$)는 주어진 누적확률값($p$) 보다 큰 누적확률을 가지는 확률변수값 중 가장 작은 값($x$)을 변환하는 함수입니다. $ x=Q(p)$ 누적분포함수(CDF, $F(x)$)는 $-infty$에서 주어진 확률변수값($x$)까지의 누적확률($p$)을 반환하는 함수입니다. $p=F(x)$ 분위수 분위수 $Q(p)$는 누적확률 $p$에 해당하는 확률변수값 $x$를 반환합니다. 즉, 분위수는 분위수(Quantile, $Q(p)$)는 주어진 누적확률값($p$) 보다 큰 누적확률을 가지는 확률변수값 중 가장 작은 값($x$)을 변환하는 함수입니다. […]
조건부사건(A|B)과 곱사건(A$\cap$B)의 표본공간은 같은가?
CONTENTS 조건부사건과 곱사건은 표본공간이 다릅니다. 조건부사건(A|B)의 표본공간은 조건이 되는 사건(B)입니다. 곱사건(A$cap$ B)의 표본공간은 전체 표본공간($Omega$)입니다. 조건부사건의 표본공간 조건부사건 $A|B$는 어떤 기준 사건 $B$가 이미 발생했음을 전제로 합니다. 즉, 조건부사건 $A|B$는 원래의 표본공간 $Omega$가 아니라, 조건이 되는 사건 $B$에 의해 제한되어 새로운 표본공간 $B$에서 정의됩니다. 즉, 조건부사건 $A|B$의 표본공간은 원래의 전체 표본공간 $Omega$에서 부분집합인 $B$로 축소됩니다. […]
두 확률변수가 독립이면 두 확률변수의 사건간 모든 조합도 독립인가?
CONTENTS 네 그렇습니다. 그 역도 성립합니다. 두 확률변수가 독립이면 결합확률분포는 주위확률분포의 곱으로 표현됩니다. 두 확률변수 사이의 관계 두 확률변수 사이의 관계는 확률변수 간의 종속성(dependency), 독립성(independence), 상관성(correlation), 조건부 관계(conditional relationship) 등을 통해 설명됩니다. 독립 관계 두 확률변수가 독립(independent)이라면, 하나의 확률변수 값이 다른 확률변수 값에 영향을 미치지 않습니다. 종속 관계 두 확률변수가 독립이 아니라면, 하나의 확률변수 값이 […]
관계는 대응을 전제로 하나?
CONTENTS 네, 관계는 대응의 형태를 필요로 합니다. 대응의 대상에는 개체 또는 집단의 속성이 있습니다. 대응시키는 연결고리를 대응요소라고 합니다. 개체 또는 집단의 속성을 변수로 표현 개체 또는 집단은 대응의 대상입니다. 개체 또는 집단의 속성(attribute)은 변수함수로 표현되며 실현된 변수값은 데이터입니다. 속성을 수치적 또는 범주형 데이터로 변환하여 모델이나 분석에 활용할 수 있도록 만듭니다. Table 1. 대응 대상의 속성을 […]
조건부기대값의 분산과 조건부분산의 기대값의 합은?
CONTENTS 종속변수의 전체분산입니다. 전체분산법칙(Law of total variance) $$text{Var}left[Yright]=text{Var}left[text{E}[Y|X]right]+text{E}left[text{Var}[Y|X]right]$$ 전체분산법칙 전체분산법칙(Law of total variance)은 다음과 같이 표현됩니다. $$text{Var}left[Yright]=text{Var}left[text{E}[Y|X]right]+text{E}left[text{Var}[Y|X]right]$$ 여기서, $text{Var}[Y]$는 종속변수($Y$)의 전체분산 $text{Var}left[text{E}[Y|X]right]$는 독립변수($X$)로 인한 종속변수($Y$)의 기대값 변동 $text{E}left[text{Var}[Y|X]right]$는 독립변수($X$)로 인한 종속변수($Y$)의 분산의 기대값: 모델이 설명하지 못하는 변동 선형회귀모델에서의 전체분산법칙 선형회귀모델은 다음과 같습니다. $$Y=beta_0+beta_1X+epsilon$$ 여기서 $Y$는 종속변수 $X$는 독립변수 $beta_0$는 기울기(회귀계수) $epsilon$은 오차항 : $epsilon sim […]
배타적 사건은 독립사건인가, 종속사건인가?
CONTENTS 일반적으로, 배타적 사건은 종속사건입니다. 배타적 사건은 한 사건이 일어나면 또 다른 사건은 일어나지 않도록 영향을 주므로 종속사건입니다. 특별히, 적어도 하나의 사건의 확률이 0이면 배타적 사건은 독립사건입니다. 배타적 사건 배타적 사건 (mutually exclusive events)이란 동시에 발생할 수 없는 사건을 말합니다. 즉, 한 사건이 발생하면 다른 사건은 반드시 발생하지 않습니다. 확률로 표현 두 사건 $A$와 $B$가 […]
연속형 확률변수가 유리수로 실현될 확률은?
CONTENTS 연속형 확률변수가 유리수로 실현될 확률은 0입니다. 연속형 확률변수가 무리수로 실현될 확률은 1입니다. 실수의 확률공간 실수는 유리수와 무리수로 구성됩니다. $$mathbb{R} = mathbb{Q} cup (mathbb{R} setminus mathbb{Q})$$ 여기서, $mathbb{R}$은 실수 $mathbb{Q}$는 유리수 $(mathbb{R} setminus mathbb{Q})$은 무리수: $mathbb{R}$집합에서 $ mathbb{Q}$집합을 뺀 집합 유리수와 무리수는 서로소(disjoint) 관계인 배타적인 집합입니다. $$mathbb{Q} cap (mathbb{R} setminus mathbb{Q}) = emptyset$$ 여기서, $emptyset$은 […]
확률이론에서 표본공간과 벡터공간을 연결하는 함수는?
CONTENTS 양적 확률변수(quantitative random variable) 또는 양적 확률벡터(quantitative random vector)입니다. 확률변수 또는 확률벡터를 함수라고 하는 이유는 표본공간의 원소를 벡터공간의 점 또는 점의 집합으로 변환하는 기능을 하기 때문입니다. 확률변수를 기호로 표현하면 다음과 같습니다. $$X : Omega to mathbb{R}$$ 여기서, $X$는 양적(수치형) 확률변수 $Omega$는 표본공간 $mathbb{R}$는 $1$차원 벡터공간 확률벡터를 기호로 표현하면 다음과 같습니다. $$X : Omega to […]
확률이론에서의 표본과 통계학에서의 표본은 의미가 같은가?
CONTENTS 아니오, 용어는 같지만 의미는 다릅니다. 확률이론에서의 표본은 표본공간의 원소로서 더 이상 나눌 수 없는 사건의 결과입니다. 통계학에서의 표본은 모집단의 부분집합으로서 모집단의 특성을 추정합니다. 확률이론에서의 표본 확률이론(probability theory)에서는 확률공간(probability space)으로 확률(probability)을 설명합니다. 확률공간의 3요소는 표본공간(sample space), 시그마대수($sigma$-algebra), 확률측도(probility measure) 입니다. 표본공간에서 나올 수 있는 단일 결과를 표본(sample)이라고 합니다. 이는 더 이상 나눌 수 없는 개별적인 […]
모든 집단의 평균이 같을 때, 모집단내 “집단간분산”과 “집단내분산”이 같은 이유는?
[ QA ] CONTENTS “집단내변동”만으로 두 분산이 정해지기 때문입니다. 모든 집단의 평균이 같다면 “집단간변동”은 없습니다. 분산분석(ANOVA)의 기본 개념 총변동($SS_T$)은 전체 데이터의 변동성을 나타내며, 집단간변동($SS_B$)과 집단내변동($SS_W$)의 합으로 표현됩니다. $$SS_T=SS_B+SS_W$$ $MS_B$은 집단간분산이며 집단평균의 변동입니다. 집단간변동과의 관계는 다음식으로 표현됩니다 $$MS_B = dfrac{SS_B}{text{집단간 자유도}}$$ $MS_W$은 집단내분산이며 각 집단내에서 데이터의 변동입니다. 집단내변동과의 관계는 다음식으로 표현됩니다. $$MS_W = dfrac{SS_W}{text{집단내 자유도}}$$ 등분산 […]