본문 바로가기
Data Science/Data Analysis

[파이썬으로 하는 데이터 분석] 16. 시각화 - 우당탕탕 개발자 되기 프로젝트

by 우당탕탕 개발자 2024. 3. 23.
728x90
반응형

 

시각화는 데이터를 가지고 많은 데이터의 관계를 그림으로 나타내어 한눈에 파악하기 쉽도록 구현하는 것입니다.

시각화를 할 때는 시각화 결과를 보여줄 대상을 잘 생각해야 합니다.

또한 시각화의 결과가 직관적이어야 하고 결과를 바로 파악할 수 있어야 좋은 시각화라고 할 수 있습니다.

 

우선 전에 살펴봤었던 matplotlib 도구를 활용하여 시각화하는 방법을 살펴보면, pyplot plot 메서드가 있습니다.

plot 메서드는 일반적인 선 그래프가 도출되는 것을 볼 수 있습니다.

 

scatter 메서드산점도를 도출하는 메서드입니다.

scatter plot은 데이터의 분포를 나타냅니다.

 

bar 메서드막대그래프를 도출하는 메서드입니다.

반응형

plot 메서드의 marker 옵션은 선 그래프에서 데이터의 점이 해당 marker로 표현되도록 지정해 주는 옵션입니다.

또한 title 메서드는 그래프의 제목을 지정해 주는 메서드이며, fontsize처럼 다양한 옵션도 존재합니다.

x축과 y축의 이름도 각각 xlabel 메서드ylabel 메서드로 지정해 줄 수 있습니다.

ticks 메서드는 축의 눈금을 지정해 주는 메서드입니다. 지정해 줄 값을 리스트로 묶어 지정하면 됩니다.

legend 메서드는 각 선들이 무엇을 나타내는지 선의 이름(정보)을 지정해 주는 메서드입니다. 만약 여러 개의 값을 지정해 줄 때는 [ ]로 묶어서 지정하면 됩니다.

 

그래프를 그릴 한 figure를 여러 개의 figure로 나누어 그래프를 각각 그릴 수도 있습니다.

subplots 메서드를 사용하면 되는데 메서드 안에는 나눌 figure 크기를 행과 열의 크기로 지정해줘야 합니다.

또한 figsize 옵션을 사용하여 각 figure의 크기도 지정해 줄 수 있습니다.

subplots 메서드는 figax를 반환하는데, fig는 전체를 나타내는 figure를 의미하고 ax는 내부 figure 각각을 의미합니다. ax는 배열 형태로 반환합니다.

배열 형태로 반환되는 ax를 인덱스로 접근하여 서로 다른 형태의 그래프를 지정해 주면 서로 다른 그래프가 그려집니다.

728x90
반응형