ROUTINE : 21
PROJECT : 5
PROGRAMMING : 6
ROUTINE eISBN

[ ROUTINE ]

딸기의 상품가치 – 시뮬레이션 데이터셋: 정형데이터

목차

영상강의

1 Videos
Print
구글문서

[Related ROUTINE]

한우의 품질 - 관측 데이터셋: 정형데이터

ROUTINE

데이터 작성
데이터 검증
데이터 공유
논문작성
연구배경 (Background)
연구방법 (Methods)
데이터기록 (Data records)
기술검증 (Technical validation)
사용안내 (Usage notes)
코드 가용성 (Code availability)
데이터 접근성 (Data availability)
데이터 논문작성
학습, 연구

생성

생성

실험

데이터 구조

데이터셋의 프레임

데이터 검증 절차

통계적 검증 및 측정 기법

데이터 활용 지원

데이터 활용을 위한 분석 방법 제시

데이터 및 코드 공유

데이터 및 코드 공유 방법 명시

데이터 접근 방법

데이터 저장소 및 접근 방법 설명

초록

논문정보

데이터사이언스 학습

데이터 생성

Rule-Based

생성

정형데이터

회귀

회귀

상관계수

회귀

회귀

DOI

DOI

URL

URL

초록작성

저자, 윤리, ...

ARTICLE

PROJECT-002 (2)
001
PROGRAMMINGS _ 모수 가설검정-001
A1-002

DATA SCIENCE

가설수립
완전확률화 실험설계
산점도
대표값
확률변수
정규분포
t분포
대응된 두 확률변수의 차이평균
집단의 변동과 개체의 변동
모집단모수와 표본통계량
표본통계량의 표집분포
표본평균의 표집분포
표본통계량의 표준오차
표본평균의 표준오차
대응된 두 집단의 모평균 비교: 대응표본 t검정

1. 질문

딸기의 상품가치를 나타내는 딸기의 속성은 어떤 것이 있나요?

2. 데이터 작성

2.1. 연구배경 (Background)

어떤 방법이 딸기의 당도를 증가시키는 것이 확인된다면, 딸기 생산자는 이 방법을 활용하여 딸기의 품질을 개선하고, 유통업자는 더 달고 맛있는 딸기를 제공함으로써 소비자 만족도를 높일 수 있습니다. 당도가 높은 딸기는 시장에서 더 높은 가격에 판매될 수 있으며, 농업 및 유통업체의 수익성을 증가시킬 수 있습니다.

어떤 방법이 딸기의 당도를 증가시키는지에 대한 명확한 데이터를 통해 과학적 사실을 확인할 수 있다면 이는 농업 과학 및 식품 과학 연구의 신뢰성을 높이는 데 기여합니다. 또한, 이러한 방법이 딸기의 당도를 어떻게 변화시키는지를 이해하는 데 도움이 됩니다.

따라서, 어떻게 하면 딸기의 당도가 향상되는가라는 질문은 매우 의미있고 가치있는 질문입니다.

이러한 질문과 관련있는 선행 사례와 문헌을 조사하여 질문에 대한 답이 될 수 있는 가설을 세우고, 가설을 검정할 수 있는 실험설계와 데이터 프레임을 만듭니다.

우리는 ‘저온숙성을 하면 딸기의 당도가 향상된다’라는 가설을 세우고, 20개 딸기의 저온숙성 전과 후의 당도를 Brix 단위로 측정하기로 하였습니다.

2.2. 연구방법 (Methods)

실험설계에 따라 20개 딸기의 저온숙성 전과 후의 당도를 Brix 단위로 측정하였습니다. 평균, 분산, 표준편차, 최대값, 최소값을 구하고, 산점도와 히스토그램을 그려서 데이터의 형태와 분포를 살펴보았습니다.

2.3. 데이터 기록 (Data records)

실험설계에 따라 20개 딸기의 저온숙성 전과 후의 당도를 Brix 단위로 측정하였습니다. 평균, 분산, 표준편차, 최대값, 최소값을 구하고, 산점도와 히스토그램을 그려서 데이터의 형태와 분포를 살펴보았습니다.

3. 데이터 검증

3.1. 기술검증 (Technical validation)

저온숙성이 이번 실험에서 딸기의 당도 차이를 만드는 원인이 됩니다. 저온숙성은 질적 데이터이고, 범주형, 이분형 데이터이며, 원인변수입니다. 저온숙성은 이 실험을 설계한 사람이 부여한 것으로 확률변수라고 할 수는 없습니다.

Brix 당도계로 측정한 딸기의 당도는 양적 데이터이고, 수치형, 연속형 데이터이며, 결과변수입니다.

3.2. 사용안내 (Usage notes)

저온숙성 전후 딸기의 당도는 이번 프로젝트의 데이터 생성 모델에 따라 정규분포로 만들어진 확률변수입니다. 

4. 데이터 공유

4.1. 코드 가용성 (Code availability)

새확률변수인 ‘저온숙성 전후 당도차이’는 ‘당도차이 모평균’을 중심으로 정규분포를 이룹니다.

4.2. 데이터 접근성 (Data availability)

새확률변수, ‘저온숙성 전후 당도차이’의 표본크기, 평균, 자유도, 표본분산이라는 통계량을 구합니다. 이 통계량을 알려진 분포를 따르는 특정 확률변수로 변환합니다.

특정 확률변수는 알려진 분포인 t분포를 따릅니다.

‘저온숙성 전후 딸기 당도차이 모평균은 0이다’라는 귀무가설과 우리가 관측한 표본데이터로부터 t검정통계량을 구합니다.

5. 논문작성

“데이터 작성 -> 데이터 검증 -> 데이터 공유”  루틴을 반복하여 유용한 결과를 도출하고 데이터 논문을 작성합니다.