정리방법
- 분할표(Contignency table), 교차표(Cross tabulation)
- 두개 이상의 변수를 동시에 고려하여 관측 개체의 빈도 정리
- 교차표는 카이제곱 검정, 분산분석(ANOVA) 에서 활용
- 질적(범주형) 자료
- 도수분포표, Bar chart(빈도 기반), Pie chart 등
- 양적(수치형) 자료
- 도수분포표, Histogram, Box plot, Scatter plot 등
일변량 차트 (Univariate Charts) - 변수 1개 |
범주형 | Pie chart, Bar chart |
수치형 | Histogram, Box plot | |
다변량 차트 (Bivariate Charts) - 변수 2개 이상 |
범주형 & 수치형 | Box plot, Bar chart |
수치형 & 수치형 | Scatter plot | |
범주형 & 범주형 | Mosaic plot | |
범주형 & 범주형 & 수치형 | Cluster Stack Column Chart (누적 세로막대형 차트) |
차트 종류
관계 | Scatter plot |
비교 | Bar chart, Line chart |
분류 | Bar histogram, Line histogram |
구성 | Stacked 100% bar chart, Pie chart, Tree map |
그래프의 특징
Histogram | 표로 되어 있는 도수 분포를 정보 그림으로 표현 |
그룹, 이상치 존재 여부 확인 | 가로축 - 계급 세로축 - 도수 |
Box plot | 데이터를 사분위수(Quartile)로 분할 | 그룹의 수, 이상치 | 모든 데이터가 동일 값이라면, 사분위수가 1개의 값으로 선도 1개만 생성 |
Scatter plot | 데이터를 점으로 표현 | 그룹, 이상치 | 데이터 간의 관계성(선형 or 비선형) 인과관계 알 수 없음 |