본문 바로가기
Data Science/Data Analysis

[파이썬으로 하는 데이터 분석] 8. 추가 & 변경 - 우당탕탕 개발자 되기 프로젝트

by 우당탕탕 개발자 2023. 10. 8.
728x90
반응형

 

DataFrame에 row, column, 값(원소)을 추가할 수 있습니다.

column을 추가하려면 새로운 column을 생성해 주고 각 row 마다 column의 값을 지정하면 됩니다.

DataFrame 이름['새로운 column 이름'] = [각 row 별 column 값] 형식으로 작성해 주면 되는데, 만약 값을 하나만 줬다면 모든 row의 column 값이 동일하게 추가됩니다.

 

row를 추가하려면 loc를 활용하여 새로운 row를 생성하고 각 column 마다 값을 지정해 주면 됩니다.

DataFrame 이름.loc['새로운 row 이름'] = [각 column 별 값들] 형식으로 작성해 주면 새로운 row가 추가됩니다.

DataFrame의 값(원소)을 변경할 수도 있습니다.

값(원소)을 변경할 때는 해당 값의 위치를 row와 column의 값으로 지정해 준 뒤, 새로운 값을 대입함으로써 변경할 수 있습니다. DataFrame 이름.loc['row 값', 'column 값'] = 변경할 값(원소) 형식으로 작성해 주면 해당 row와 column의 위치 값을 변경해 줍니다.

 

만약 값을 여러 개 변경할 때는 하나하나 따로 변경해 줄 수도 있지만 한 번에 작성해 주어 변경할 수도 있습니다.

row 값과 column 값을 선택하는 부분에서 여러 개의 값을 묶어 한 번에 작성해 주면 됩니다.

값을 변경할 때도 loc를 사용할 수도 있고 iloc를 사용할 수도 있습니다.

반응형

마지막으로 T는 row와 column의 위치를 바꾸는 전치행렬로 만들어줍니다. 

DataFrame 이름.transpose() 형식으로 작성하여 transpose() 메서드를 사용할 수도 있고, 그냥 DataFrame.T 형식으로 작성하여 DataFrame을 전치행렬로 변환해 줄 수 있습니다.

T가 중요한 이유는 실제로 분석할 데이터는 양이 많은데, column은 보통 문자열로 나타내어져 있습니다. 하여 데이터를 분석하는 한 화면에 값이 다 들어오지 않을 수도 있습니다. 하여 T를 사용해 전치행렬로 바꾸면 row 별로 column 값을 한눈에 보기 더 용이하기에 T가 많이 사용됩니다.

728x90
반응형