네, 관계는 대응의 형태를 필요로 합니다.
대응의 대상에는 개체 또는 집단의 속성이 있습니다.
대응시키는 연결고리를 대응요소라고 합니다.
개체 또는 집단은 대응의 대상입니다. 개체 또는 집단의 속성(attribute)은 변수함수로 표현되며 실현된 변수값은 데이터입니다. 속성을 수치적 또는 범주형 데이터로 변환하여 모델이나 분석에 활용할 수 있도록 만듭니다.
Table 1. 대응 대상의 속성을 변수로 표현
대응 대상 | 속성 | 변수로 표현 | 변수 유형 |
---|---|---|---|
사람 (개체) | 키 | $X_{height}$ | 수치형(연속형) |
사람 (개체) | 성별 | $X_{gender} =\{0, 1\}$ | 범주형(이진형) |
도시 (개체) | 평균 기온 | $X_{temp}$ | 수치형(연속형) |
도시 (개체) | 인구 밀도 수준 | $X_{density} = \{1, 2, 3\}$ | 순서형 |
사람 (개체) | 회원 가입 여부 | $X_{member} = \{0, 1\}$ | 이진형 |
국가 (집단) | GDP | $X_{GDP}$ | 수치형(연속형) |
국가 (집단) | 인구 규모 | $X_{population-size} = \{소, 중, 대\}$ | 범주형 |
학교 (집단) | 평균 수학 점수 | $X_{math-score}$ | 수치형(연속형) |
학교 (집단) | 학급 수 | $X_{class-count}$ | 이산형 |
통계적 관계의 유형은 상관관계, 인과관계가 있으며 관계가 없는 독립적인 관계가 있습니다. 관계는 대응되는 개체나 집단의 속성간의 관계를 의미하며 대응요소를 통해 대응됩니다.
Fig 1. 관계의 유형의 예
Table 2. 관계의 유형과 대응요소
관계 유형 | 설명 | 예시 | 개체(속성) – 개체(속성) | 대응요소 |
---|---|---|---|---|
상관 | 두 변수 간 선형적 연관성을 표현함 | 온도와 아이스크림 판매량 간 상관 관계 | 날씨(온도) – 아이스크림(판매량) | 시간 (날짜 또는 시간대) |
인과 | 한 변수의 변화가 다른 변수에 영향을 미침 | 광고비가 판매량에 미치는 영향 | 회사(광고비) – 회사(판매량) | 시간 (광고비 집행 기간) |
독립 | 두 변수가 서로 독립적으로 변화함 | 주사위 결과와 동전 던지기 결과 | 주사위(결과) – 동전(결과) | 없음 |