데이터 프레임
종속변수
확률변수 가정
결과변수의 확률분포
통계량 확률분포
검정통계량
유의확률과 유의수준으로 검정
분석
대응된 데이터
당도: 연속형 확률변수
독립동일분포, 등분산성, 정규성
정규뷴포
중심극한정리
(표본차이평균-$d_0$)와 표준오차의 비
귀무가설 채택 or 기각
대응표본 t검정
어떻게 하면 딸기의 상품가치가 향상되는가?
어떤 방법이 딸기의 당도를 증가시키는 것이 확인된다면, 딸기 생산자는 이 방법을 활용하여 딸기의 품질을 개선하고, 유통업자는 더 달고 맛있는 딸기를 제공함으로써 소비자 만족도를 높일 수 있습니다. 당도가 높은 딸기는 시장에서 더 높은 가격에 판매될 수 있으며, 농업 및 유통업체의 수익성을 증가시킬 수 있습니다.
어떤 방법이 딸기의 당도를 증가시키는지에 대한 명확한 데이터를 통해 과학적 사실을 확인할 수 있다면 이는 농업 과학 및 식품 과학 연구의 신뢰성을 높이는 데 기여합니다. 또한, 이러한 방법이 딸기의 당도를 어떻게 변화시키는지를 이해하는 데 도움이 됩니다.
따라서, 어떻게 하면 딸기의 당도가 향상되는가라는 질문은 매우 의미있고 가치있는 질문입니다.
이러한 질문과 관련있는 선행 사례와 문헌을 조사하여 질문에 대한 답이 될 수 있는 가설을 세우고, 가설을 검정할 수 있는 실험설계와 데이터 프레임을 만듭니다.
우리는 ‘저온숙성을 하면 딸기의 당도가 향상된다’라는 가설을 세우고, 20개 딸기의 저온숙성 전과 후의 당도를 Brix 단위로 측정하기로 하였습니다.
실험설계에 따라 20개 딸기의 저온숙성 전과 후의 당도를 Brix 단위로 측정하였습니다. 평균, 분산, 표준편차, 최대값, 최소값을 구하고, 산점도와 히스토그램을 그려서 데이터의 형태와 분포를 살펴보았습니다.
저온숙성이 이번 실험에서 딸기의 당도 차이를 만드는 원인이 됩니다. 저온숙성은 질적 데이터이고, 범주형, 이분형 데이터이며, 원인변수입니다. 저온숙성은 이 실험을 설계한 사람이 부여한 것으로 확률변수라고 할 수는 없습니다.
Brix 당도계로 측정한 딸기의 당도는 양적 데이터이고, 수치형, 연속형 데이터이며, 결과변수입니다.
저온숙성 전후 딸기의 당도는 이번 프로젝트의 데이터 생성 모델에 따라 정규분포로 만들어진 확률변수입니다.
새확률변수인 ‘저온숙성 전후 당도차이’는 ‘당도차이 모평균’을 중심으로 정규분포를 이룹니다.
새확률변수, ‘저온숙성 전후 당도차이’의 표본크기, 평균, 자유도, 표본분산이라는 통계량을 구합니다. 이 통계량을 알려진 분포를 따르는 특정 확률변수로 변환합니다.
특정 확률변수는 알려진 분포인 t분포를 따릅니다.
‘저온숙성 전후 딸기 당도차이 모평균은 0이다’라는 귀무가설과 우리가 관측한 표본데이터로부터 t검정통계량을 구합니다.
t검정통계량으로 유의확률(p값)을 구합니다.
유의수준을 정하여 유의확률과 비교하여 귀무가설을 기각 또는 채택합니다.
“데이터 -> 모델링 -> 데이터분석” 루틴을 반복하여 유용한 결과를 도출하고 논문을 작성합니다.