728x90
반응형
SMALL
이번 포스팅에서는 pandas의 pivot_table을 활용해 원하는 기준을 만들어 보도록 하겠습니다.
pivot table을 이용해 우리가 할 수 있는 것?
pivot 테이블의 가장 큰 목적은 우리가 원하는 기준 을 만들어 활용한다는 것입니다.
컴퓨터 부품 판매 데이터를 예제로 사용해보겠습니다.
위의 데이터에서 가게명(Name)으로 정렬해서 확인하고 싶을 때 pivot_table을 활용할 수 있습니다.
Name이 인덱스가 되고, 나머지 값들은 기본적으로 평균값을 표현하게 됩니다.
여기서 인덱스는 이름 말고도 여러 개로 지정해 줄 수 있습니다.
특정 Value만 선택해서 계산을 할 수도 있습니다.
기본적으로 value 자체를 pivot_table로 합치면 평균이 됩니다만, aggfunc(집계 기능) 옵션을 활용하여 합계를 계산할 수도 있습니다.
numpy의 sum(np.sum) 함수를 지정하면 됩니다.
aggfunc를 적절히 이용하면 평균과 합계 등 여러 가지 데이터를 그럴싸하게 보여 줄 수도 있습니다.
pivot table은 언제 써야 할까요?
pivot 테이블 자체는 그리 큰 비중을 차지하지는 않습니다. 하지만 원하는 데이터를 구해내기 위해서 조건문과 반복문을 생각하면 어떻게 될까요?
꽤나 머리 아픈 작업이 될 것 같습니다. 일일이 다 코드로 원하는 데이터를 구해내기보다, pivot table을 사용하여 원하는 데이터를 어떻게 뽑아낼지 테스트해 보고, 구현하는 연습이 많이 필요합니다.
다음 포스팅에는 pivot 테이블을 활용한 범죄 데이터 정리를 해보도록 하겠습니다.
728x90
반응형
LIST
'Programming > 통계 데이터 분석' 카테고리의 다른 글
[Python]Seaborn을 이용한 범죄데이터 시각화 (0) | 2021.04.06 |
---|---|
[Python] pivot 테이블을 활용한 범죄 데이터 (pivot_예제) (0) | 2021.04.04 |
[Python] CCTV 현황 그래프로 분석하기 (0) | 2021.04.01 |
[Python]CCTV 데이터와 인구 현황 데이터를 합치고 분석하기 (0) | 2021.02.18 |
[Python] 서울시 CCTV data와 인구현황 data 파악하기 (0) | 2021.02.15 |