본문 바로가기
Data Science/Data Analysis

[파이썬으로 하는 데이터 분석] 18. CRISP-DM Business Understanding - 우당탕탕 개발자 되기 프로젝트

by 우당탕탕 개발자 2024. 3. 30.
728x90
반응형

 

데이터를 분석하는 방법에는 크게 두 가지가 있습니다.

KDD 방법론과 CRISP-DM 방법론이 있는데 CRISP-DM 방법론은 Cross-Industry Standard Process - Data Mining으로 총 6단계로 구성되어 있습니다.

Business Understanding - Data Understanding - Data Preparation - Modeling - Evaluation - Deployment 단계로 데이터 분석이 수행됩니다.

반응형

그중 첫 번째 단계인 Business Understanding 단계를 살펴보면 Business Understanding 단계는 비즈니스 관점에서 프로젝트의 목적요구사항을 이해하기 위한 단계입니다.

도메인 지식을 데이터 분석을 위한 문제 정의로 변경하고 초기 프로젝트 계획을 수립하는 단계입니다.

해당 단계에서는 업무 목적 파악, 상황 파악, 데이터 마이닝 목표 설정, 프로젝트 계획 수립 등이 수행됩니다.

가져온 데이터는 자전거 공유 회사가 모은 데이터로 공유 자전거 서비스 업계의 도메인 지식을 이해해야 합니다.

또한 해당 업계는 자전거라는 상품을 대여하는 서비스를 운영 중이고 대여되지 않은 자전거의 개수가 적을수록 사업이 잘된다고 파악할 수 있습니다.

하여 해당 데이터의 분석 방향은 자전거의 수요량을 예측하고 서비스의 이용량의 증감을 파악하는 방향이 될 것입니다.

데이터의 column을 살펴보고 데이터를 어떻게 다룰 것인지 생각해 볼 수 있습니다.

test1.csv
0.62MB

728x90
반응형