DATA ARTICLE : 2
LEARNING ARTICLE : 4
6 Weeks in Review
2 Weeks in Publication
Open Access
Peer Reviewed
eISSN 0000-0000

표준오차를 꼭 필요로 하는 표본통계량 순서는?

[ QA ] CONTENTS 표본평균, 표본비율, 표본분산의 순입니다. 표준오차는 무엇? 표준오차(Standard Error, SE)는 통계에서 표본평균, 표본분산, 표본비율 등의 표본 통계량이 반복적인 표본추출에서 모평균, 모분산, 모비율가 얼마나 차이가 나는 지를 나타냅니다. 즉, 표본 통계량의 모수에 대한 변동성을 나타내는 척도입니다.   표준오차는 왜 생기나? 표준오차는 표본추출 과정에서 발생하는 변동성으로 설명됩니다. 표본추출이 무작위적이므로, 각 표본에서 계산된 통계량이 다를 수밖에 없으며, […]

Frequentist에게 “귀무가설”이 있다면 Bayesian에게는?

[ QA ] CONTENTS Bayesian에게는 “사전확률”이 있습니다. Frequentist와 Bayesian은 누구? Frequentist(프리퀀티스트, 빈도주의자)은 빈도주의 접근법을 따르는 사람입니다. 이들은 확률을 반복 실험에서 나타나는 빈도로 해석하며, 주어진 데이터를 통해 객관적인 추론을 수행합니다. 사전확률을 사용하지 않으며, 데이터 자체에 기반하여 가설을 검정하고 신뢰구간을 추정합니다. Bayesian(베이지앙, 사후확률추구자)은 베이지안 접근법을 따르는 사람입니다. 이들은 확률을 주관적인 믿음의 정도로 해석하며, 새로운 증거를 사용하여 사전확률(prior […]

대응표본처럼 독립표본도 순차적으로 수집할 수 있나?

[ QA ] CONTENTS 네, 독립표본도 시간적, 공간적으로 순차적으로 관측한 결과일 수 있습니다. 대응표본과 독립표본은 무엇? 표본은 대응표본(paired samples)과 독립표본(independent samples)들로 이루어져 있다고 볼 수 있습니다. 한편, 표본은 개체속성의 실현된 값의 모음입니다. 개체의 두 속성이 서로 대응되면 대응표본이고 두 속성이 서로 독립되면 독립표본이라고 합니다. 그리고 개체의 한 속성을 반복측정한 것도 대응표본이라 할 수 있습니다. 대응표본의 […]

유의수준이 임계값을 정하나?

[ Q&A ] CONTENTS 네, 유의수준이 먼저 정해지고 확률분포 정보를 더하여 임계값이 결정되므로 유의수준이 임계값을 정합니다. 유의수준과 임계값은 무엇? 유의수준(significance level)은 가설검정에서 귀무가설을 기각하는 기준이 되는 확률입니다. 일반적으로 $alpha$로 표시됩니다. 선행연구에 의해 주어집니다. 유의수준은 임계값을 설정하는 데 사용됩니다. 임계값 (critical value)은 귀무가설이 참이여서 귀무가설을 채택하는 영역과 귀무가설이 거짓이어서 귀무가설을 기각하는 영역의 경계값입니다. 임계값은 유의수준과 검정통계량의 […]

한우의 출생지와 출생년도에 따른 도체중의 ‘일원분산분석 F검정’과 ‘독립표본 t검정’

[ DATA SCIENCE ] Figure Animation 표1 표1 [Q&A] 집단이 2개 일 때 일원분산분석 F검정과 t검정의 결과가 같은 이유 집단이 2개일 경우, 일원분산분석에서 계산되는 F값은 독립표본 t검정에서의 t값의 제곱과 같게 됩니다. 두 검정 방법이 같은 통계적 추정치를 사용하여 두 집단 간의 차이만을 평가. 집단이 2개일 경우, 일원분산분석에서 계산되는 F값은 독립표본 t검정에서의 t값의 제곱과 같게 됩니다. […]

좌표계

Animation Figure 1차원 좌표계 2차원 좌표계 3차원 좌표계 1차원 좌표계 2차원 좌표계 3차원 좌표계 1차원 좌표계 2차원 좌표계 3차원 좌표계 1차원 좌표계 2차원 좌표계 3차원 좌표계 CONTENTS Author Detail Publication Histroy DOI Citation Download Print 구글문서 Print 구글문서 Abstract 1차원 좌표계에서는 변수 값을 점으로 나타내며, 기준점에서의 거리와 방향으로 좌표를 정의합니다. 도수분포도는 데이터를 시각화할 때 유용하며, […]

모델링?

CONTENTS 모델링은 현상을 추상화하는 과정입니다. 현상은 모델의 대상입니다. 모델은 현상을 추상화한 결과입니다. 모델 모델(model)이란, 복잡한 현상을 단순화, 추상화하여 핵심을 표현한 것입니다. 즉, 모델은 현실 세계의 복잡한 대상이나 현상을 핵심만 표현합니다. 모델은 분석과 예측을 가능하게 하여 현실에서의 의사결정과 문제해결을 돕는 도구입니다. 데이터 사이언스에서의 모델은 복잡한 현실 세계의 현상을 그 세계의 데이터를 사용하여 추상화·단순화한 것입니다. 이 모델은 […]

단순선형회귀의 결정계수 비교: 단순선형회귀분석 F검정

Animation Figure [Q&A] CONTENTS Author Detail Publication Histroy DOI Citation Download Print 구글문서 Print 구글문서 Abstract 프랜시스 갈톤은 1885년, 부모와 자식 간의 키 관계를 연구하며, 평균 키로의 회귀 경향을 발견했습니다. 이는 부모와 자식의 키 관계가 기울기가 1보다 작은 회귀직선으로 표현됨을 의미합니다. 회귀분석은 변수 간 함수관계를 파악하는 데 사용되며, 결과변수(종속변수)와 원인변수(독립변수) 간 관계를 모델링합니다. 단순선형회귀는 1개의 […]

두 연속형 확률변수의 상관계수 비교: 상관분석 t검정

Animation Figure [Q&A] CONTENTS Author Detail Publication Histroy DOI Citation Download Print 구글문서 Print 구글문서 Abstract 모수와 통계량 추정에서, 확률변수의 모평균, 모분산, 모표준편차는 각각 표본평균, 표본분산, 표본표준편차를 통해 추정됩니다. 상관분석은 두 변수 간의 선형적 관계를 측정하며, 피어슨상관계수는 이 관계의 강도와 방향을 수치화합니다. 공분산은 두 변수 간의 변동성을 나타내며, 상관계수는 공분산을 표준화한 값입니다. 상관계수의 제곱인 결정계수는 […]

교차표의 확률분포 비교: 교차분석 카이제곱검정

Animation Figure [Q&A] CONTENTS Author Detail Publication Histroy DOI Citation Download Print 구글문서 Print 구글문서 Abstract 교차분석은 범주형 변수 간의 관계를 분석하는 통계적 방법입니다. 예로, 대학교 학생의 학년과 영어학점 관계를 교차표로 나타내어 학년별 영어학점 분포의 동질성을 검정할 수 있습니다. 이는 학년이 영어학점에 미치는 영향을 평가하기 위함입니다. 교차표는 학년과 영어학점 조합의 빈도수를 표시하며, 전체 학생 집합에서 […]