본문 바로가기
Data Science/Data Analysis

[파이썬으로 하는 데이터 분석] 9. 인덱스 - 우당탕탕 개발자 되기 프로젝트

by 우당탕탕 개발자 2023. 10. 14.
728x90
반응형

 

먼저 DataFrame을 하나 생성해 줍니다. DataFrame을 생성할 때 인덱스를 따로 지정해주지 않으면 default로 정수형으로 0번부터 지정됩니다. 인덱스의 원래 용도는 row 구별을 위한 것이라 인덱스는 유일성이 존재해야 합니다.

만약 이미 생성된 DataFrame의 인덱스를 변경하기 위해서는 set_index() 메서드를 활용하면 됩니다.

DataFrame 이름.set_index('column 이름') 형식으로 작성하면 지정한 column의 값을 인덱스로 바꿔줍니다.

 

만약 set_index() 메서드를 적용한 상태에서 한 번 더 다른 column 이름으로 set_index() 메서드를 사용하면 이전 인덱스가 사라지게 되므로 사용하실 때 주의하시길 바랍니다.

set_index() 메서드로 column을 인덱스로 바꿔도 실제로는 적용되지 않는 것을 볼 수 있습니다.

set_index() 메서드도 마찬가지로 inplace 옵션 True로 변경해 줘야 실제도 적용됩니다.

만약 인덱스 여러 개 사용하여 row를 구분할 수도 있습니다. 이를 멀티 인덱싱이라고 합니다.

set_index() 메서드를 사용할 때 여러 column 이름을 묶어서 지정해 주면 지정된 column 내용이 모두 인덱스로 활용되어 row를 구분해 줍니다.

 

만약 변경한 인덱스를 정수형으로 변경하려면 reset_index() 메서드를 사용하면 됩니다.

DataFrame 이름.reset_indes() 형식으로 작성하면 해당 DataFrame의 인덱스가 원래의 정수형으로 변경되고 기존의 인덱스는 column으로 이동하게 됩니다.

반응형

DataFrame을 정렬할 수도 있습니다. 정렬은 다방면을 많이 활용됩니다.

DataFrame을 정렬할 때는 sort_values() 메서드를 활용하면 됩니다.

DataFrame 이름.sort_values(by = 'column 이름') 형식으로 작성하면 해당 column의 값에 따라 오름차순으로 정렬됩니다. 만약 내림차순으로 정렬하기 위해선 default 값이 True로 설정되어 있는 ascending 옵션 False로 변경해 주면 됩니다.

728x90
반응형