이번 포스팅에서는 Matplotlib를 활용한 데이터 시각화에 대해서 이야기해보겠습니다.
파이썬의 대표적 데이터 시각화 모듈 - Matplotlib
많은 내용들이 Matplotlib 모듈에 포함되어 있지만, 우리는 주로 pyplot이라는 시각화 도구를 제일 많이 사용합니다.
먼저 import 부터 하겠습니다.
아주 간단하게 그래프를 그려 보았습니다.
plot 함수에는 그래프에 표현될 데이터들이 들어가고, 각 x축과 y축은 임의로 지정되어서 숫자가 표시됩니다.
조금 더 복잡하게 삼각함수 그래프를 그려보겠습니다. 물론 numpy를 활용합니다.
각종 옵션으로 grid나 x축, y축 라벨을 붙여 그래프에 대한 설명을 시각화할 수 있습니다.
두 개 이상의 그래프를 비교하여 시각화를 해줄 수도 있습니다. (plot만 더 추가)
범례 옵션도 plot 함수에 추가 해주면 범례 표현도 가능합니다.
또한 lw 옵션을 이용해 선의 굵기를 지정할 수 있고, color 옵션으로 색상도 지정 가능합니다
다른 모양 그래프로 더 알아보겠습니다.
linstyle 옵션으로 선의 모양도 지정할 수 있습니다.
데이터가 실제 존재하는 곳에 점을 찍어 줄 수도 있습니다.
marker 옵션을 이용해 점을 찍고, markerfacecolor 옵션을 이용해 색상을, markersize 옵션으로 크기를 지정할 수 있습니다.
scatter를 사용하면 점 그래프가 됩니다.
scatter에서는 마커의 크기를 s 옵션으로 조절합니다.
c 옵션(색상)으로 color map까지 만들어 낼 수 있습니다.
numpy의 랜덤 함수를 이용해서 그래프를 그려 보겠습니다.
loc 옵션으로 평균을, scale 옵션으로 표준 편차를 조절할 수 있습니다.
위의 그래프를 boxplot으로 표현할 수도 있습니다.
boxplot은 나중에 더 자세히 살펴볼 수 있습니다.
2021/02/03 - [Programming/Python] - [Python]Data Visualisation # 시각화 기초 (Plot, Bar)
더 많은 옵션 변경을 알고 싶다면 시각화 기초 편을 참고하는 것을 추천합니다.
지금까지 Matplotlib를 활용한 데이터 시각화에 대하여 알아보았고 다음 블로그에서는 CCTV 현황 그래프로 분석해보도록 하겠습니다.
'Programming > Python' 카테고리의 다른 글
[Python] Seaborn을 활용한 시각화 (+예제) (0) | 2021.04.05 |
---|---|
[Python] 두개 이상의 데이터 프레임 병합 - concat 이용하기 (0) | 2021.02.18 |
[Python] Pandas DataFrame #pandas 기초 .01 (DataFrame 생성, 정제 및 준비, 삭제, Data 내보내기) (1) | 2021.02.04 |
[Python]Data Visualisation # 시각화 기초 (Plot, Bar) (1) | 2021.02.03 |