본문 바로가기
Data Science/Data Analysis

[파이썬으로 하는 데이터 분석] 11. Function Mapping & 그룹화 - 우당탕탕 개발자 되기 프로젝트

by 우당탕탕 개발자 2023. 11. 4.
728x90
반응형

 

Function mapping은 특정 column의 값에 함수를 적용시키는 것을 말합니다.

우선 적용시킬 함수를 먼저 만들어주고 함수를 적용시킬 DataFrame의 column의 데이터를 지정해 apply() 함수로 만들어둔 함수를 적용하면 됩니다.

apply() 함수 안에는 lambda 식을 활용해 해당 함수를 각 데이터에 적용시킬 수 있습니다.

그룹화는 DataFrame을 특정 column의 값으로 각 해당되는 값끼리 그룹을 만드는 것을 말합니다.

DataFrame 이름.groupby('column 이름') 형식으로 작성해 주면 해당 DataFrame을 해당 column의 각 값으로 분류하게 됩니다. 그룹을 지어 각 그룹별 특성을 알아볼 때 유용하게 사용할 수 있습니다.

그룹화를 할 때 지정해 주는 column은 범주형 변수면 좋습니다.

그룹화한 각 그룹을 보려면 그룹을 나눈 값을 get_group() 함수 안에 넣어주면 해당 값을 갖는 그룹의 DataFrame을 확인할 수 있습니다.

반응형

그리고 groupby() 함수로 나누어진 그룹에 mean(), sum(), size() 같은 함수를 작성해 주면 해당 함수를 적용시킬 수 있습니다.

mean() 함수를 적용시키면 각 그룹의 column별 데이터들의 평균을 확인할 수 있습니다.

sum() 함수를 적용시키면 각 그룹의 column별 데이터들의 합을 확인할 수 있습니다.

size() 함수를 적용시키면 각 그룹의 row 개수를 확인할 수 있습니다.

728x90
반응형