DISTRIBUTION

이산확률분포 - Discrete Probability Distribution

이산균등분포 – Discrete uniform distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(k \, | a, b)$

$K \sim U\{a,b\}$

$K$

$k \in \{a,a+1,\ldots, b-1,b\}$

$k$는 $a$이상이고 $b$이하인 정수

$a$와 $b$

$a$와 $b$는 정수

$b \geq a$

$\therefore n=b-a+1$

$f(k \, | a, b)=\dfrac{1}{n}$

for $a\leq k\leq b$

$f(k \, ; a, b)=0$

if not $a\leq k\leq b$

$M_{K}(t)=\dfrac{e^{at}-e^{(b+1)^t}}{n(1-e^t)}$

$\text{E}[K]=\dfrac{a+b}{2}$

$\text{Var}[K]=\dfrac{n^2-1}{12}$

$\mathrm{ln}(n)$

베르누이분포 – Bernoulli distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(k \, | p)$

$K \sim \text{Bern}(p)$

$K$

$k \in \{0, 1\}$

성공이면 $k=1$, 실패면 $k=0$

$p$

$p$는 성공확률

$0 < p < 1$

$q$는 실패확률

$q=1-p$

$f(k \, | p) = p^k(1-p)^{(1-k)}$

$f(1 \, | p)=\text{Pr}(K=1)=p$

$f(0 \, | p)=\text{Pr}(K=0)=1-p$

$M_{K}(t)=(1-p)+pe^t$

$\text{E}[K]=p$

$\text{Var}[K]=pq$

$$- \left[ p \ln p + (1 – p) \ln (1 – p) \right]$$

기하분포 - Geometric distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(k \, | p)$

$K \sim \text{Geom}(p)$

$K$

$k\in \{1,2,\ldots\}$

$k$는 실패할 때까지 시행횟수

$p$

$p$는 성공확률

$0＜ p ≤ 1$

$f(k \, | p)=(1-p)^{k-1}p$

$M_{K}(t)=\dfrac{pe^t}{1-(1-p)e^t}$

여기서, $t < \mathrm{ln}(1-p)$

$\text{E}[K]=\dfrac{1}{p}$

$\text{Var}[K]=\dfrac{1-p}{p^2}$

$\dfrac{-(1-p)\mathrm{log}_2 (1-p)-p\ \mathrm{log}_2 p}{p}$

이항(二項)분포 - Binomial distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(k \, | n,p)$

$K \sim \text{Bin}(n,p)$

$K$

$k \in \{0, \ldots , n\}$

$k$는 성공횟수

$n$과 $p$

$n$은 시행횟수

$n \geq 0$

$p$는 성공확률

$0 \leq p \leq 1$

$q$는 실패확률

$q=1-p$

$f(k \, | n,p)=\dbinom{n}{k}p^k q^{n-k}$

$M_{K}(t)=(1-p+pe^t)^n$

$\text{E}[K]=np$

$\text{Var}[K]=npq$

$\dfrac{1}{2}\mathrm{ln}(2\pi nep(1-p))+O\left(\dfrac{1}{n}\right)$

음이항분포 - Negative Binomial distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

Method of moment

$f(k \, | r,p)$

$K \sim \text{NB}(r,p)$

$K$

$k \in \{0,1,2,\ldots\}$

$k$는 시행이 끝날 때까지 실패횟수

$r$과 $p$

$r$은 시행이 끝날 때까지 성공횟수

$r > 0$

$p$는 성공확률

$p \in [0,1]$: $0 \leq p \leq 1$

$f(k \, | r,p)=\dbinom{k+r-1}{k} (1-p)^k p^r$

$M_{K}(t)=\left(\dfrac{p}{1-(1-p)e^t}\right)^r$

여기서, $t<-\mathrm{log}(1-p)$

$\text{E}[K]=\dfrac{r(1-p)}{p}$

$\text{Var}[K]=\dfrac{r(1-p)}{p^2}$

$r=\dfrac{{\rm E}[X]^2}{{\rm Var}[X]-E[X]}$

$p=1-\dfrac{{\rm E}[X]}{{\rm Var}[X]}$

포아송분포 - Poisson distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(k \, | \lambda)$

$K \sim \text{Poisson}(\lambda)$

$K$

$k \in \{0,1,2,\ldots\}$

$k$는 사건발생 횟수

$\lambda$

$\lambda$는 단위시간 또는 단위공간에서 발생하는 사건발생 평균횟수: rate

$\lambda \in (0,\infty)$: $\lambda$는 양의 실수

$f(k \, | \lambda)=\dfrac{\lambda^k e^{-\lambda}}{k!}$

$M_{K}(t)=\mathrm{exp}(\lambda(e^t -1))$

$\text{E}[K]=\lambda$

$\text{Var}[K]=\lambda$

$$\lambda[1-\mathrm{log}(\lambda)]+e^{-\lambda}\sum_{k=0}^{\infty}\dfrac{\lambda^k\mathrm{log}(k!)}{k!}$$

초기하분포- Hypergeometric distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

$f(k \, | N, L, n)$

$K \sim \text{Hyper}(N, L, n)$

$K$

$k \in \{\mathrm{max}(0, n+L=N),$

$\ldots ,\mathrm{min} (n,k)\}$

$k$는 표본에서 성공집단의 크기

$N$과 $L$과 $n$

$N$은 유한한 모집단의 크기

$N \in \{0,1,\ldots\} $

$L$은 모집단의 성공집단의 크기

$L \in \{0,1,\ldots,N\} $

$n$은 비복원추출 표본크기

$n \in \{0,1,\ldots,N\} $

$f(k \, | N, L, n)=\dfrac{\dbinom{L}{k}\dbinom{N-L}{n-k}}{\dbinom{N}{n}}$

$M_{K}(t)=\dfrac{\dbinom{N-L}{n} \sideset{_2}{_1}F(-n,-L;N-L-n+1:e^t)}{\dbinom{N}{n}}$

$\text{E}[K]=n\dfrac{L}{N}$

$\text{Var}[K]=n\dfrac{L}{N}\dfrac{N-L}{N}\dfrac{N-n}{N-1}$

음초기하분포- Negative Hypergeometric distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

$f(k \, | N, L, r)$

$K \sim \text{NH}(N, L, r)$

$K$

$k \in \{\mathrm{max}(0, r+L=N),$

$\ldots ,\mathrm{min} (k,r)\}$

$k$는 비복원추출 표본크기

$N$과 $L$과 $r$

$N$은 유한한 모집단의 크기

$N \in \{0,1,\ldots\} $

$L$은 모집단의 성공집단의 크기

$L \in \{0,1,\ldots,N\} $

$r$은 표본의 기대 성공집단의 크기

$r \in \{0,1,\ldots,N\} $

$f(k \, | N, L, r)=\dfrac{\dbinom{k-1}{r-1}\dbinom{N-k}{L-r}}{\dbinom{N}{L}}$

$M_{K}(t)=\dfrac{\dbinom{N-L}{r} \sideset{_2}{_1}F(-r,-L;N-L-r+1:e^t)}{\dbinom{N}{L}}$

$\text{E}[K]=k\dfrac{N}{L}$

$\text{Var}[K]=r\dfrac{L}{N}\dfrac{N-L}{N}\dfrac{N-r}{L}$

다항분포 - Multinomial distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(누적분포함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(k_i \, | n,p_i)$

$(K_1, K_2, \dots, K_m) \sim$

$\text{Multinomial}(n \, | p_1, p_2, \dots, p_m)$

$\boldsymbol{K}$

$k_i \in\{k_1, \ldots k_{m} \}$

$\sum\limits_{i}^{m} k_{i}=n$

$n$과 $m$와 $p_m$

$n$은 시행횟수

$n$은 $0$과 자연수

$m$은 독립시행 수

$m$은 $0$과 자연수

$p_m$는 $m$번째 시행에서의 확률질량

$p_m \in \{ p_1, \ldots, p_n \}$

$\sum_\limits{m=1}^{n} p_m=1$

$f(k_i \, | n,p_i)=\dfrac{k!}{k_1! \cdots k_m!}p_1^{k_1} \cdots p_m^{k_m}$

$$M_{K}(t)=\left(\sum_{i=1}^{m}p_i e^{t_i}\right)^n$$

${\operatorname {E}}[K_i]=n{p_i}$

${\operatorname {Var}}[K_i]=n{p_i}(1-p_i)$

${\operatorname {Cov}}[K=K_i,K=K_j]=-n{p_i}{p_j}$

여기서, $i\neq j$

$$-\mathrm{log}(n!)-n\sum_{i=1}^{m}p_i\mathrm{log}(p_i)+$$

$$\sum_{i=1}^{m} \sum_{k_i=0}^{n} \dbinom{n}{k_i}p_i^{m_i} (1-p_i)^{n-x_i}\mathrm{log}(k_i !)$$

연속확률분포 - Continuous Probability Distribution

연속균등분포 – Continuous uniform distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률밀도함수)

확률밀도함수(f) / 누적분포함수(F)

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(x \, | a, b)$

$X \sim U(a,b)$

$X$

$x \in [a, b]$

$a$와 $b$

$a$와 $b$는 실수

$ a < b $

$f(x \, | a, b)=\dfrac{1}{(b-a)}$

for $a ≤ x ≤ b$

$f(x \, | a, b)=0$

for $x < a $ or $x > b$

$F(x \, | a, b)=0$

for $x < a$

$$F(x \, ; a, b)=\dfrac{x-a}{b-a}$$

for $a < x < b$

$$F(x \, ; a, b)=1$$

for $b < x$

$M_{X}(t)=\dfrac{e^{tb}-e^{ta}}{t(b-a)}$

$\text{E}[X]=\dfrac{1}{2}(a+b)$

$\text{Var}[X]=\dfrac{1}{12}(b-a)^2$

$\mathrm{ln}(b-a)$

지수분포 – Exponential distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률밀도함수)

확률밀도함수(f) / 누적분포함수(F)

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(x \, | \lambda)$

$X \sim \text{Exp}(\lambda)$

$X$

$x \in [0, +\infty)$

$\lambda$

$\lambda$는 rate, inverse scale

$\lambda$는 양의실수

$f(x \, | \lambda)=\lambda e^{-\lambda x}=\lambda \left(\dfrac{1}{e}\right)^{\lambda x}$

for $x ≥ 0$

$f(x \, | \lambda)=0$

for $x < 0$

$F(x \, | \lambda)=1-e^{-\lambda x}=1-\left(\dfrac{1}{e}\right)^{\lambda x}$

for $x ≥ 0$

$F(x \, | \lambda)=0$

for $x < 0$

$M_{X}(t)=\dfrac{\lambda}{\lambda -t} \,\, \ \text{for} \ t<\lambda$

$\text{E}[X]=\dfrac{1}{\lambda}$

$\text{Var}[X]=\dfrac{1}{\lambda^2}$

$1-\ln \lambda$

정규분포 – Normal distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률밀도함수)

확률밀도함수(f) / 누적분포함수(F)

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(x \, | \mu, \sigma_X^2)$

$X \sim N(\mu, \sigma^2)$

$X$

$x\in[-\infty, +\infty]$

$\mu$와 $\sigma^2$

$\mu$는 평균

$\mu$는 실수

$\mu$는 location

$\sigma^2$은 분산

$\sigma^2$은 양의 실수

$\sigma^2$은 squared scale

$f(x \, | \mu, \sigma^2)=\dfrac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}$

$F(x \, | \mu, \sigma^2)=\dfrac{1}{2}\left(1+\operatorname {erf}\left(\dfrac{x-\mu}{\sqrt{2}\sigma}\right)\right)$

여기서, $\operatorname {erf} (x)=\dfrac {2}{\sqrt {\pi }}\int _{0}^{x}e^{-t^2}\,dt$

$M_X (t)=\mathrm{exp}\left(\mu t+\dfrac{\sigma^2 t^2}{2}\right)$

$\text{E}[X]=\mu$

$\text{Var}[X]=\sigma^2$

$12\ln(2πσ^2)+12$

감마분포 – Gamma distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률밀도함수)

확률밀도함수

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(x \, | k,\theta)$

$X \sim \text{Gamma}(k,\theta)$

$f(x \, | \alpha, \beta)$

$X \sim \text{Gamma}(\alpha, \beta)$

$X$

$x∈(0,+\infty)$

$k$와 $\theta$

$k$는 shape

$k$는 양의 실수

$$k=\dfrac{{\rm E}[X]^{2}}{{\rm Var}[X]}$$

$\theta$는 scale

$\theta$는 양의 실수

$$ \theta =\dfrac{{\rm Var}[X]}{{\rm E}[X]}$$

$\alpha$와 $\beta$

$\alpha$는 shape

$\alpha$는 양의 실수

$$\alpha=\dfrac{{\rm E}[X]^{2}}{{\rm Var}[X]}$$

$\beta$는 scale

$\beta$는 양의 실수

$$\beta =\dfrac{{\rm E}[X]}{{\rm Var}[X]}$$

$f(x \, | k,\theta)=x^{k-1}\dfrac{\mathrm{exp}\left(\frac{-x}{\theta}\right)}{\Gamma (k)\theta^k}$

$f(x \, | \alpha, \beta)={\dfrac{\beta ^{\alpha }}{\Gamma (\alpha )}}x^{\alpha -1}e^{-\beta x}$

여기서, $\Gamma(\alpha)$는 감마함수로, $\alpha$가 정수일 경우 $ (\alpha-1)! $와 동일

$M_{X}(t)=(1-\theta t)^{-k}$

$\text{for} \ t < \dfrac{1}{\theta}$

$\text{E}[X]=k\theta$

$\text{Var}[X]=k\theta^2$

$M_{X}(t)=\left(1-\dfrac{t}{\beta}\right)^{-\alpha }$

$\text{for} \ t<\beta$

$\text{E}[X]=\dfrac{\alpha}{\beta}$

$\text{Var}[X]=\dfrac{\alpha}{\beta^2}$

$k + \ln\theta+\ln\Gamma(k)+(1-k)\psi(k)$

$\alpha + \ln\beta+\ln\Gamma(\alpha)+(1-\alpha)\psi(\alpha)$

베타분포 – Beta distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률밀도함수)

확률밀도함수

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(x \, | \alpha, \beta)$

$X \sim \text{Beta}(\alpha, \beta)$

$X$

$x \in [0, 1]$

$x$는 성공확률

$X=\dfrac{Y}{Y + Z} \sim \mathrm{Beta}(\alpha, \beta)$

여기서, $Y \sim \mathrm{Gamma}(\alpha, 1), \quad Z \sim \mathrm{Gamma}(\beta, 1)$

$\alpha$와 $\beta$

$\alpha$는 성공횟수

$\alpha$는 양의 실수

$\beta$는 실패횟수

$\beta$는 양의 실수

$f(x \, | \alpha, \beta)=\dfrac {x^{\alpha -1}(1-x)^{\beta -1}}{B (\alpha ,\beta)}$

여기서, $B$는 베타정규화함수:

\[
B(\alpha, \beta) = \int_0^1 t^{\alpha – 1} (1 – t)^{\beta – 1} dt
\]

베타정규화화함수를 감마함수로 표현

$B(\alpha ,\beta )=\dfrac {\Gamma (\alpha )\Gamma (\beta )}{\Gamma (\alpha +\beta )}$

여기서, $\Gamma(\alpha)$는 감마함수로, $\alpha$가 정수일 경우 $ (\alpha-1)! $와 동일

$$M_{X}(t)=1+\sum _{k=1}^{\infty }\left(\prod_{r=0}^{k-1}{\frac {\alpha +r}{\alpha +\beta +r}}\right){\frac {t^{k}}{k!}}$$

$\mathrm {E} [X]=\dfrac{\alpha}{\alpha +\beta}$

$$\mathrm {E} [\ln X]=\psi (\alpha )-\psi (\alpha +\beta)$$

$ \mathrm {Var} [X]={\dfrac {\alpha \beta }{(\alpha +\beta )^{2}(\alpha +\beta +1)}}$

$\mathrm {Var} [\ln X]=\psi _{1}(\alpha )-\psi _{1}(\alpha +\beta )$

$\ln \mathrm {B} (\alpha ,\beta )-(\alpha -1)\psi (\alpha )$

$-(\beta -1)\psi (\beta )$

$+(\alpha +\beta -2)\psi (\alpha +\beta )$

카이제곱분포 – Chi-squared distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률밀도함수)

확률밀도함수

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(x \, | k)$

$X \sim \chi^2(k)$

$X \sim \chi_k^2$

$X$

$x \in (0, +\infty)$

$k=1$인 경우

$x \in [0, +\infty)$

$k≠1$인 경우

$k$

$k$는 자유도

$k$는 양의 실수

$f(x \, | k)=\dfrac{1}{2^{\frac{k}{2}}\Gamma\left(\frac{k}{2}\right)}x^{\frac{k}{2}-1}e^{-\frac{x}{2}}$

$M_{X}(t)=(1-2t)^{\frac{-k}{2}}$ for $t<\dfrac{1}{2}$

$\text{E}[X]=k$

$\text{Var}[X]=2k$

$\dfrac{k}{2}+\mathrm{ln}\left(2\Gamma\left(\dfrac{k}{2}\right)\right)+\left(1-\dfrac{k}{2}\right)\psi\left(\dfrac{k}{2}\right)$

t분포 - Student t distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률밀도함수)

확률밀도함수

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(t \, | \nu)$

$T \sim t(\nu)$

$T \sim t_{\nu}$

$T$

$t \in (-\infty, +\infty)$

$t=\dfrac{z}{\sqrt {\dfrac{V}{\nu}}}=\dfrac {{\bar {x}}-\mu }{\dfrac{s}{\sqrt {n}}}$

여기서, $t$는 t분포를 나타내는 확률변수

$z$는 표준정규분포함수

$V$는 카이제곱

$\nu$는 자유도

$s$는 표본표준편차

$\bar x$는 표본평균

$n$은 표본크기

$\nu$

$\nu$는 자유도(degree of freedom)

$f(t \, : \nu)= \frac{\Gamma\left(\frac{\nu + 1}{2}\right)}{\sqrt{\nu \pi} \Gamma\left(\frac{\nu}{2}\right)} \left(1 + \frac{t^2}{\nu}\right)^{-\frac{\nu + 1}{2}}
$

여기서, $\nu$는 자유도

$\Gamma( \,\,)$는 감마함수

$M_{X}(t)$는 없음

$\text{E}[t]=0$

for $\nu >1$

$\text{Var}[t]=\dfrac{\nu}{\nu-2}$ for $\nu >2$

$\text{Var}[t]=\infty$

for $1 < \nu ≤ 2$

$\dfrac{\nu +1}{2}\left[\psi \left(\dfrac{1+\nu}{2}\right)-\psi \left(\dfrac{\nu}{2}\right)\right]$

$+\ln \left[\sqrt{\nu}{\rm B}\left(\dfrac{\nu}{2},\dfrac{1}{2}\right)\right]$

여기서, $\psi$는 digamma function

$\rm B$는 beta function

F분포 – F distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률밀도함수)

확률밀도함수

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(x \, | d_1, d_2)$

$X \sim F(d_1, d_2)$

$X \sim F_{d_1, d_2}$

$X$

$x \in (0, +\infty)$

$d_1=1$인 경우

$x \in [0, +\infty)$

$d_1≠1$인 경우

$X=\dfrac{V_1}{d_1} \div \dfrac{V_2}{d_2}$

$x={\dfrac {s_{1}^{2}}{\sigma _{1}^{2}}}\div {\dfrac {s_{2}^{2}}{\sigma _{2}^{2}}}$

여기서, $X$는 F분포를 가지는 확률변수

$x$는 확률변수값

$V_1$과 $V_2$는 집단1과 집단2의 $\chi^2$

$d_1$과 $d_2$

$d_1$과 $d_2$는 자유도

$d_1$과 $d_2$는 양의 실수

$f(x \, | d_1, d_2) = \frac{\Gamma(\frac{d_1 + d_2}{2})}{\Gamma(\frac{d_1}{2})\Gamma(\frac{d_2}{2})} \left(\frac{d_1}{d_2}\right)^{\frac{d_1}{2}}$

$\cdot x^{\frac{d_1}{2} – 1} \left(1 + \frac{d_1}{d_2}x\right)^{-\frac{d_1 + d_2}{2}}$

여기서, $d_1$과 $d_2$는 각각 분자와 분모의 자유도

$\Gamma(\,\,)$는 감마함수

$M_{X}(t)$는 없음

$\text{E}[X]=\dfrac{d_2}{d_2-2}$

for $d_2 > 2$

$\text{Var}[X]=\dfrac{{2d_2^2}({d_1}+{d_2}-2)}{d_{1}(d_{2}-2)^{2}(d_{2}-4)}$

for $d_2 >4$

$\ln \Gamma \left({\tfrac {d_{1}}{2}}\right)+\ln \Gamma \left({\tfrac {d_{2}}{2}}\right)-\ln \Gamma \left({\tfrac {d_{1}+d_{2}}{2}}\right)$

$\cdot \left(1-{\tfrac {d_{1}}{2}}\right)\psi \left(1+{\tfrac {d_{1}}{2}}\right)$

$-\left(1+{\tfrac {d_{2}}{2}}\right)\psi \left(1+{\tfrac {d_{2}}{2}}\right)$

$+\left({\tfrac {d_{1}+d_{2}}{2}}\right)\psi \left({\tfrac {d_{1}+d_{2}}{2}}\right)+\ln {\frac {d_{1}}{d_{2}}}$

다변량정규분포 – Multivariate normal distribution

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률밀도함수)

확률밀도함수

모멘트생성함수 / 기대값 / 분산

엔트로피

$f(\boldsymbol{x} \, | \boldsymbol {\mu} , \boldsymbol {\Sigma})$

$\boldsymbol{X} \sim \mathcal{N}(\boldsymbol{\mu}, \, \boldsymbol{\Sigma})$

$\boldsymbol{X}$

$\boldsymbol {x} \in \boldsymbol \mu +\text{span}(\boldsymbol \Sigma)\subseteq \Bbb{R}^k$

$\boldsymbol{X}$는 확률변수 벡터

$\boldsymbol {x}$는 확률변수의 실현값 벡터

$k$는 확률변수 벡터의 차원수

$\boldsymbol{\mu}$는 평균벡터

$\boldsymbol\Sigma$는 공분산행렬: $k\times k$인 준단위행렬

$\boldsymbol \mu +\text{span}(\boldsymbol \Sigma)$는 $\boldsymbol {x}$가 $\boldsymbol \mu$를 기준으로 $\boldsymbol\Sigma$행렬의 열방향으로만 전개

$\text{span}(\boldsymbol \Sigma)$는 편차벡터($\boldsymbol {x}-\boldsymbol {\mu}$)들이 선형변환을 통해 만드는 공간, 편차벡터들이 실제로 퍼져 있는 부분공간

$\boldsymbol{\Sigma}$는 공분산행렬: 편차벡터 외적의 평균

\[
\boldsymbol{\Sigma} = \mathbb{E} \left[ (\mathbf{x} – \boldsymbol{\mu})(\mathbf{x} – \boldsymbol{\mu})^T \right]
\]

$\boldsymbol{\mu}$와 $\boldsymbol\Sigma$

$\boldsymbol{\mu}$는 평균벡터

$$\boldsymbol{\mu} \in \Bbb{R}^k $$

$\boldsymbol\Sigma$는 공분산행렬

$\boldsymbol\Sigma \in \Bbb{R}^{k \times k}$

$f(\boldsymbol {x} \, | \boldsymbol {\mu} , \boldsymbol {\Sigma})=(2\pi )^{-k/2}\det({\boldsymbol {\Sigma }})^{-1/2}$

$\cdot \exp \left(-{\frac {1}{2}}(\mathbf {x} -{\boldsymbol {\mu }})^{\!{\mathsf {T}}}{\boldsymbol {\Sigma }}^{-1}(\mathbf {x} -{\boldsymbol {\mu }})\right)$

$\boldsymbol{\Sigma}$가 positive-define일 때만 존재

변량이 $Y_1$, $Y_2$로 2개일 때 확률밀도함수

\[
\boldsymbol{\Sigma} =
\begin{bmatrix}
\mathrm{Var}(Y_1) & \mathrm{Cov}(Y_1, Y_2) \\
\mathrm{Cov}(Y_2, Y_1) & \mathrm{Var}(Y_2)
\end{bmatrix}
\]

$M_{\boldsymbol{X}}(t)=\mathrm{exp}\left(\boldsymbol{\mu}^{\mathsf{T}}{\boldsymbol{t}}+\dfrac{1}{2}\boldsymbol{t}^{\mathsf{T}}\boldsymbol{\Sigma} \boldsymbol{t}\right)$

$\text{E}[\boldsymbol{X}]=\boldsymbol {\mu}$

$\text{Var}[\boldsymbol{X}]=\boldsymbol \Sigma$

$\dfrac{1}{2} \ln \det \left(2\pi \mathrm {e} \boldsymbol {\Sigma}\right)$

제약조건 별 엔트로피가 최대인 분포

제약조건	엔트로피 최대 분포	정의역
$\mathbb{E[X]}, \, \mathrm{Var}[X]$ 고정, 확률변수가 실수	정규분포 $ \mathcal{N}(\mu, \sigma^2) $	$ \mathbb{R} $
$\mathbb{E[X]}$ 고정, 확률변수가 양의 실수	지수분포 $ \text{Exp}(\lambda) $	$ [0, \infty) $
$\mathbb{E[X]}$고정, 확률변수가 자연수	기하분포 $ \text{Geometric}(p) $	$ \mathbb{N} $
$\mathbb{E}[X], \, \mathbb{E}[\log X]$ 고정, 확률변수가 양의 실수	감마분포 $ \text{Gamma}(\alpha, \beta) $	$ [0, \infty) $
$\mathbb{E}[X], \, \mathbb{E}[\log X], \, \mathbb{E}[\log(1 – X)]$ 고정, 확률변수가 0과 1사이 실수	베타분포 $ \text{Beta}(\alpha, \beta) $	$ [0, 1] $

제약조건	엔트로피 최대 분포	정의역
$\mathbb{E[X]}, \, \mathrm{Var}[X]$ 고정, 확률변수가 실수	정규분포 \( \mathcal{N}(\mu, \sigma^2) \)	\( \mathbb{R} \)
$\mathbb{E[X]}$ 고정, 확률변수가 양의 실수	지수분포 \( \text{Exp}(\lambda) \)	\( [0, \infty) \)
$\mathbb{E[X]}$고정, 확률변수가 자연수	기하분포 \( \text{Geometric}(p) \)	\( \mathbb{N} \)
$\mathbb{E}[X], \, \mathbb{E}[\log X]$ 고정, 확률변수가 양의 실수	감마분포 \( \text{Gamma}(\alpha, \beta) \)	\( [0, \infty) \)
$\mathbb{E}[X], \, \mathbb{E}[\log X], \, \mathbb{E}[\log(1 – X)]$ 고정, 확률변수가 0과 1사이 실수	베타분포 \( \text{Beta}(\alpha, \beta) \)	\( [0, 1] \)

DISTRIBUTION

목차

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

엔트로피

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

엔트로피

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

엔트로피

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

엔트로피

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

Method of moment

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

엔트로피

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률질량함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(누적분포함수)

확률질량함수

모멘트생성함수 / 기대값 / 분산

엔트로피

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률밀도함수)

확률밀도함수(f) / 누적분포함수(F)

모멘트생성함수 / 기대값 / 분산

엔트로피

표기

확률변수와 지지집합(support)

모수(parameter)

확률분포도(확률밀도함수)

확률밀도함수(f) / 누적분포함수(F)

모멘트생성함수 / 기대값 / 분산

엔트로피

표기

확률변수와 지지집합(support)

모수(parameter)