Frequentist에게 “귀무가설”이 있다면 Bayesian에게는?

[ QA ] CONTENTS Bayesian에게는 “사전확률”이 있습니다. Frequentist와 Bayesian은 누구? Frequentist(프리퀀티스트, 빈도주의자)은 빈도주의 접근법을 따르는 사람입니다. 이들은 확률을 반복 실험에서 나타나는 빈도로 해석하며, 주어진 데이터를 통해 객관적인 추론을 수행합니다. 사전확률을 사용하지 않으며, 데이터 자체에 기반하여 가설을 검정하고 신뢰구간을 추정합니다. Bayesian(베이지앙, 사후확률추구자)은 베이지안 접근법을 따르는 사람입니다. 이들은 확률을 주관적인 믿음의 정도로 해석하며, 새로운 증거를 사용하여 사전확률(prior […]

대응표본처럼 독립표본도 연속일 수 있나?

[ QA ] CONTENTS 독립표본은 연속적인 관계를 가질 수 없습니다.  대응표본과 독립표본은 무엇인가요? 데이터셋은 표본이고 표본은 대응표본(paired samples)과 독립표본(independent samples)들로 이루어져 있다고 볼 수 있습니다. 표본은 개체들의 속성값의 모음입니다. 두 속성이 서로 대응되면 대응표본이고 두 속성이 서로 독립되면 독립표본이라고 합니다. 대응표본의 특징은? 대응표본(paired samples)은 동일한 개체에서 반복적으로 측정될 수 있으므로 대응표본은 연속성이 있습니다. 즉 , […]

유의수준이 임계값을 정하나?

[ QA ] CONTENTS 네, 유의수준이 먼저 정해지고 확률분포 정보를 더하여 임계값이 결정되므로 유의수준이 임계값을 정합니다. 유의수준과 임계값은 무엇? 유의수준(significance level)은 가설검정에서 귀무가설을 기각하는 기준이 되는 확률입니다. 일반적으로 $alpha$로 표시됩니다. 선행연구에 의해 주어집니다. 유의수준은 임계값을 설정하는 데 사용됩니다. 임계값 (critical value)은 귀무가설이 참이여서 귀무가설을 채택하는 영역과 귀무가설이 거짓이어서 귀무가설을 기각하는 영역의 경계값입니다. 임계값은 유의수준과 검정통계량의 […]

모델링 ?

[ QA ] ARTICLE CONTENTS 표본크기가 1에서 100까지 표본평균의 분포 변화 (모집단 : 표준정규분포) 0:03 두 표본의 표본평균 분포 : 중심극한정리 0:07 Play Video 모델 모델이란? 모델은 현실 세계의 복잡한 시스템이나 데이터를 수학적, 통계적, 또는 컴퓨터 프로그램의 형태로 단순화하여 표현한 것입니다. 데이터 과학에서 모델은 주어진 데이터로부터 패턴을 찾아내어 예측이나 분류 등의 작업을 수행할 수 있도록 […]

데이터종류 ?

[ QA ] CONTENTS Data type 척도에 따른 데이터종류 질적데이터는 수치가 아닌 기호로 표현된 데이터입니다. 질적데이터는 명목척도와 순서척도로 구한 데이터입니다. 양적데이터는 수치로 표현된 데이터입니다. 양적데이터는 간격척도와 비례척도로 구한 데이터입니다. 질적데이터 질적데이터는 수치로 표현되지 않은 데이터(관측값)입니다. 질적데이터는 명목척도와 순서척도를 사용하여 구한 데이터입니다. 질적데이터는 수치가 아닌 기호로 표현됩니다. 질적데이터는 개체명, 개체가 속하는 범주명, 순서와 같이 관측대상의 질적 정의를 […]

중심극한정리 ?

[ QA ] ARTICLE CONTENTS 표본크기가 커질수록 표본평균은 모평균에 수렴 0:25 모집단(population)이 정규분포일 때 표본크기의 변화에 따른 표본평균 표집의 확률밀도함수 0:03 두 딸기품종 당도의 확률밀도함수(probability density function)와 표본의 당도평균 표집의 분포( probability density function of sampling distribution) 0:08 Play Video Central limit theorem 중심극한정리 확률변수, $X_1, X_2, cdots, X_n$가 서로 독립하며 평균, $mu$와 분산, $sigma^2$을 […]

사분위표 ?

[ QA ] CONTENTS 사분위표 0:25 Play Video Quartile table 사분위표 사분위표는 데이터의 분포를 표현하는 한 방법입니다. 사분위표는 데이터를 순서대로 늘어놓고 같은 개수를 가지는 4개의 집단(group)으로 나누어 놓은 표입니다. 사분위수는 이 4개의 집단의 최대값입니다. 유사하게 백분위표는 데이터를 순서대로 늘어놓고 같은 개수를 가지는 100개의 집단으로 나누어  놓은 표입니다. 이 때 100개의 집단의 최대값이 백분위수(percentile)입니다. 백분위수는 %를 단위로 […]

확률변수 ?

[ QA ] ARTICLE CONTENTS 동전과 확률변수 0:10 12면체 주사위와 확률변수 0:10 표적과 이산형 확률변수 0:05 표적과 연속형 확률변수 0:05 Play Video Random variable 확률변수의 예 확률변수의 이름을 “로또복권의 등수”라 한다면 확률변수값은 1등, 2등, 3등, 4등, 5등 그리고 꽝으로 총 6개가 있을 수 있습니다.  여기서 “로또복권의 등수”는 범주형 확률변수입니다. 그리고 6개의 확률변수값으로 구성됩니다. 로또복권의 한 […]

변동계수 ?

[ QA ] CONTENTS 변동계수 0:18 Play Video Coefficient of variation 변동계수 변동계수(변이계수, variation coefficient)는 집단의 평균에 대한 표준편차의 비입니다. 변동계수는 한 확률변수가 나타내는 확률분포의 표준편차를 평균으로 나눈 것이라고 할 수 있습니다. 변동계수는 단위가 없기 때문에 단위가 다른 속성을 비교하는 경우 유용합니다. 변동계수는 표준편차와 평균간의 계수입니다. 변동계수의 정의식에서 분모인 평균은 0이 아니여야 합니다. 표준편차는 양의 […]

표준오차 ?

[ QA ] ARTICLE CONTENTS 표본크기가 1에서 100까지 표본평균의 분포 변화 (모집단 : 표준정규분포) 0:03 두 표본의 표본평균 분포 : 중심극한정리 0:07 Play Video Standard error 차이, 편차, 오차, 잔차 차이 차이(difference)는 두 값의 간격입니다. 두 값이 같으면 차이는 0입니다. 기준이 없습니다. 0과 양수로 표현됩니다. 편차 편차(deviation)는 값에서 기준값을 뺸 값입니다. 표본에서는 기준값으로 표본평균을 많이 […]