pandas groupby 활용하기
01. groupby basic
일단 기본적인 데이터 집계 방법을 살펴봅니다.
02. multi columns and aggs
여러 개의 항목들을 활용하여 집계하는 방법에 대해 알아봅니다.
03. agg 함수 customizing
사용자 정의 agg 함수 활용법을 이해합니다.
함수에 추가 인수를 활용하는 것도 가능합니다. 하지만, 여러 개의 함수를 활용할 때는 ‘클로저’를 활용해야 합니다.
04. group filtering
데이터셋을 Grouping 한 상태로 filtering이 가능합니다. 일반적인 SQL query에서는 단일 쿼리로 group by 상태에서 filtering이 불가능합니다.
05. groupby 객체 적용 함수
groupby 객체에는 agg, filter, transform, apply 네 가지 함수를 적용할 수 있으며, 각각 함수는 Input & Output 양식이 서로 다릅니다.
- agg(Series -> Scalar)
- filter(DataFrame -> Scalar)
- transform(DataFrame -> DataFrame)
- apply(DataFrame -> 모든양식)
모든 종류의 Gropby 객체 처리가 가능하다는 점에서 apply() 함수의 유연성이 가장 높습니다.
06. Pandas cut 함수
연속형 변수를 범주화 하는 경우도 빈번하게 일어나므로 사용법을 익혀봅니다.
07. pivot_table 함수
groupby와 같이 집계를 쉽계하는 pivot_table 함수에 대해 알아봅니다.