IT/Data Science

시각화

우루사이 2023. 12. 2. 18:27

정리방법

  • 분할표(Contignency table), 교차표(Cross tabulation)
    • 두개 이상의 변수를 동시에 고려하여 관측 개체의 빈도 정리
    • 교차표는 카이제곱 검정, 분산분석(ANOVA) 에서 활용
  • 질적(범주형) 자료
    • 도수분포표, Bar chart(빈도 기반), Pie chart 등
  • 양적(수치형) 자료
    • 도수분포표, Histogram, Box plot, Scatter plot 등
일변량 차트
(Univariate Charts)
- 변수 1개
범주형 Pie chart, Bar chart
수치형 Histogram, Box plot
다변량 차트
(Bivariate Charts)
- 변수 2개 이상
범주형 & 수치형 Box plot, Bar chart
수치형 & 수치형 Scatter plot
범주형 & 범주형 Mosaic plot
범주형 & 범주형 & 수치형 Cluster Stack Column Chart
(누적 세로막대형 차트)

차트 종류

관계 Scatter plot
비교 Bar chart, Line chart
분류 Bar histogram, Line histogram 
구성 Stacked 100% bar chart, Pie chart, Tree map

그래프의 특징

Histogram 표로 되어 있는 도수 분포를
정보 그림으로 표현
그룹, 이상치 존재 여부 확인 가로축 - 계급
세로축 - 도수
Box plot 데이터를 사분위수(Quartile)로 분할 그룹의 수, 이상치 모든 데이터가 동일 값이라면,
사분위수가 1개의 값으로
선도 1개만 생성
Scatter plot 데이터를 점으로 표현 그룹, 이상치 데이터 간의 관계성(선형 or 비선형)
인과관계 알 수 없음