728x90
반응형
Function mapping은 특정 column의 값에 함수를 적용시키는 것을 말합니다.
우선 적용시킬 함수를 먼저 만들어주고 함수를 적용시킬 DataFrame의 column의 데이터를 지정해 apply() 함수로 만들어둔 함수를 적용하면 됩니다.
apply() 함수 안에는 lambda 식을 활용해 해당 함수를 각 데이터에 적용시킬 수 있습니다.
그룹화는 DataFrame을 특정 column의 값으로 각 해당되는 값끼리 그룹을 만드는 것을 말합니다.
DataFrame 이름.groupby('column 이름') 형식으로 작성해 주면 해당 DataFrame을 해당 column의 각 값으로 분류하게 됩니다. 그룹을 지어 각 그룹별 특성을 알아볼 때 유용하게 사용할 수 있습니다.
그룹화를 할 때 지정해 주는 column은 범주형 변수면 좋습니다.
그룹화한 각 그룹을 보려면 그룹을 나눈 값을 get_group() 함수 안에 넣어주면 해당 값을 갖는 그룹의 DataFrame을 확인할 수 있습니다.
반응형
그리고 groupby() 함수로 나누어진 그룹에 mean(), sum(), size() 같은 함수를 작성해 주면 해당 함수를 적용시킬 수 있습니다.
mean() 함수를 적용시키면 각 그룹의 column별 데이터들의 평균을 확인할 수 있습니다.
sum() 함수를 적용시키면 각 그룹의 column별 데이터들의 합을 확인할 수 있습니다.
size() 함수를 적용시키면 각 그룹의 row 개수를 확인할 수 있습니다.
728x90
반응형
'Data Science > Data Analysis' 카테고리의 다른 글
[파이썬으로 하는 데이터 분석] 15. DataFrame 병합하기 - 우당탕탕 개발자 되기 프로젝트 (0) | 2024.03.17 |
---|---|
[파이썬으로 하는 데이터 분석] 14. 데이터 보기 - 우당탕탕 개발자 되기 프로젝트 (0) | 2024.03.16 |
[파이썬으로 하는 데이터 분석] 13. 파일 다루기 - 우당탕탕 개발자 되기 프로젝트 (0) | 2023.12.02 |
[파이썬으로 하는 데이터 분석] 12. 산술연산 - 우당탕탕 개발자 되기 프로젝트 (0) | 2023.11.26 |
[파이썬으로 하는 데이터 분석] 10. Aggregation - 우당탕탕 개발자 되기 프로젝트 (0) | 2023.10.15 |
[파이썬으로 하는 데이터 분석] 9. 인덱스 - 우당탕탕 개발자 되기 프로젝트 (0) | 2023.10.14 |
[파이썬으로 하는 데이터 분석] 8. 추가 & 변경 - 우당탕탕 개발자 되기 프로젝트 (0) | 2023.10.08 |
[파이썬으로 하는 데이터 분석] 7. 선택 - 우당탕탕 개발자 되기 프로젝트 (0) | 2023.10.07 |