728x90
반응형
SMALL

이번 포스팅에서는 pandas의 pivot_table을 활용해 원하는 기준을 만들어 보도록 하겠습니다.

pivot table을 이용해 우리가 할 수 있는 것?

pivot 테이블의 가장 큰 목적은 우리가 원하는 기준 을 만들어 활용한다는 것입니다.

컴퓨터 부품 판매 데이터를 예제로 사용해보겠습니다.

위의 데이터에서 가게명(Name)으로 정렬해서 확인하고 싶을 때 pivot_table을 활용할 수 있습니다.

Name이 인덱스가 되고, 나머지 값들은 기본적으로 평균값을 표현하게 됩니다.

여기서 인덱스는 이름 말고도 여러 개로 지정해 줄 수 있습니다.

특정 Value만 선택해서 계산을 할 수도 있습니다.

기본적으로 value 자체를 pivot_table로 합치면 평균이 됩니다만, aggfunc(집계 기능) 옵션을 활용하여 합계를 계산할 수도 있습니다.
numpy의 sum(np.sum) 함수를 지정하면 됩니다.

aggfunc를 적절히 이용하면 평균과 합계 등 여러 가지 데이터를 그럴싸하게 보여 줄 수도 있습니다.

pivot table은 언제 써야 할까요?

pivot 테이블 자체는 그리 큰 비중을 차지하지는 않습니다. 하지만 원하는 데이터를 구해내기 위해서 조건문과 반복문을 생각하면 어떻게 될까요?
꽤나 머리 아픈 작업이 될 것 같습니다. 일일이 다 코드로 원하는 데이터를 구해내기보다, pivot table을 사용하여 원하는 데이터를 어떻게 뽑아낼지 테스트해 보고, 구현하는 연습이 많이 필요합니다.

 

다음 포스팅에는 pivot 테이블을 활용한 범죄 데이터 정리를 해보도록 하겠습니다.

728x90
반응형
LIST

+ Recent posts