본문 바로가기
Data Science/Data Analysis

[파이썬으로 하는 데이터 분석] 13. 파일 다루기 - 우당탕탕 개발자 되기 프로젝트

by 우당탕탕 개발자 2023. 12. 2.
728x90
반응형

 

데이터 분석을 하려면 파이썬의 라이브러리에 있는 데이터들을 가져와 분석을 해볼 수도 있지만 외부에서 데이터를 가져와 분석을 해야 하는 경우가 대부분입니다.

이처럼 외부에서 데이터를 가져올 때는 데이터가 저장되어 있는 외부 파일을 불러와야 합니다.

 

외부 파일을 불러오는 방법에는 pandas 라이브러리read_csv(), read_excel(), read_json() 등의 함수를 사용하면 됩니다. 각 함수는 불러오려는 파일의 확장자에 따라 사용하시면 됩니다.

함수를 적고 () 안에 파일의 경로나 이름을 적어주면 해당 파일을 불러올 수 있습니다.

pd.read_csv('test.csv')와 같은 형식으로 작성해 주면 됩니다.

반면에 만든 DataFrame을 파일로 저장하고자 할 때는 pandas 라이브러리의 to_csv() 함수를 사용하면 됩니다.

파일을 불러오는 함수와 마찬가지로 to_csv(), to_excel(), to_json() 등의 함수를 저장하고자 하는 파일의 확장자에 따라 적절하게 사용하시면 됩니다.

 

또한 파일을 불러오는 것과 동일하게 함수를 사용하시면 되는데, 함수를 적어주고 () 안에 파일을 저장할 파일 경로나 이름을 적어주면 해당 데이터를 확장자의 형식에 맞춰 원하는 이름과 위치에 저장됩니다.

반응형

데이터를 파일로 저장할 때 그냥 저장하게 되면 기본적으로 index가 새로 생성되어 같이 저장됩니다.

index를 새로 생성하여 같이 저장하고 싶지 않다면 파일로 저장할 때 index 옵션False로 변경하여 저장해 주면 됩니다.

index 옵션을 False로 변경하여 저장하면 index가 추가로 생성되지 않고 원래 데이터 그대로 저장되는 것을 확인할 수 있습니다.

728x90
반응형