[파이썬으로 하는 데이터 분석] 9. 인덱스 - 우당탕탕 개발자 되기 프로젝트

728x90

먼저 DataFrame을 하나 생성해 줍니다. DataFrame을 생성할 때 인덱스를 따로 지정해주지 않으면 default로 정수형으로 0번부터 지정됩니다. 인덱스의 원래 용도는 row 구별을 위한 것이라 인덱스는 유일성이 존재해야 합니다.

만약 이미 생성된 DataFrame의 인덱스를 변경하기 위해서는 set_index() 메서드를 활용하면 됩니다.

DataFrame 이름.set_index('column 이름') 형식으로 작성하면 지정한 column의 값을 인덱스로 바꿔줍니다.

만약 set_index() 메서드를 적용한 상태에서 한 번 더 다른 column 이름으로 set_index() 메서드를 사용하면 이전 인덱스가 사라지게 되므로 사용하실 때 주의하시길 바랍니다.

set_index() 메서드로 column을 인덱스로 바꿔도 실제로는 적용되지 않는 것을 볼 수 있습니다.

set_index() 메서드도 마찬가지로 inplace 옵션을 True로 변경해 줘야 실제도 적용됩니다.

만약 인덱스를 여러 개 사용하여 row를 구분할 수도 있습니다. 이를 멀티 인덱싱이라고 합니다.

set_index() 메서드를 사용할 때 여러 column 이름을 묶어서 지정해 주면 지정된 column 내용이 모두 인덱스로 활용되어 row를 구분해 줍니다.

만약 변경한 인덱스를 정수형으로 변경하려면 reset_index() 메서드를 사용하면 됩니다.

DataFrame 이름.reset_indes() 형식으로 작성하면 해당 DataFrame의 인덱스가 원래의 정수형으로 변경되고 기존의 인덱스는 column으로 이동하게 됩니다.

DataFrame을 정렬할 수도 있습니다. 정렬은 다방면을 많이 활용됩니다.

DataFrame을 정렬할 때는 sort_values() 메서드를 활용하면 됩니다.

DataFrame 이름.sort_values(by = 'column 이름') 형식으로 작성하면 해당 column의 값에 따라 오름차순으로 정렬됩니다. 만약 내림차순으로 정렬하기 위해선 default 값이 True로 설정되어 있는 ascending 옵션을 False로 변경해 주면 됩니다.

728x90

저작자표시 비영리 변경금지 (새창열림)

'Data Science > Data Analysis' 카테고리의 다른 글

[파이썬으로 하는 데이터 분석] 13. 파일 다루기 - 우당탕탕 개발자 되기 프로젝트 (0)	2023.12.02
[파이썬으로 하는 데이터 분석] 12. 산술연산 - 우당탕탕 개발자 되기 프로젝트 (0)	2023.11.26
[파이썬으로 하는 데이터 분석] 11. Function Mapping & 그룹화 - 우당탕탕 개발자 되기 프로젝트 (0)	2023.11.04
[파이썬으로 하는 데이터 분석] 10. Aggregation - 우당탕탕 개발자 되기 프로젝트 (0)	2023.10.15
[파이썬으로 하는 데이터 분석] 8. 추가 & 변경 - 우당탕탕 개발자 되기 프로젝트 (0)	2023.10.08
[파이썬으로 하는 데이터 분석] 7. 선택 - 우당탕탕 개발자 되기 프로젝트 (0)	2023.10.07
[파이썬으로 하는 데이터 분석] 6. Pandas 자료구조 - 우당탕탕 개발자 되기 프로젝트 (0)	2023.09.24
[파이썬으로 하는 데이터 분석] 5. Matplotlib - 우당탕탕 개발자 되기 프로젝트 (0)	2023.09.23

[파이썬으로 하는 데이터 분석] 9. 인덱스 - 우당탕탕 개발자 되기 프로젝트

'Data Science > Data Analysis' 카테고리의 다른 글

관련글

티스토리툴바