본문 바로가기
728x90
반응형

전체 글510

[R 공부하기] 3. 매트릭스 - 우당탕탕 개발자 되기 프로젝트 목차 행렬 행렬 생성 행렬 인덱싱 행렬 연산 행렬 결합 state.x77 데이터 1. 행렬 행렬, 매트릭스(matrix)는 2차원 데이터로 데이터 테이블의 모든 셀의 값들이 동일한 자료형이다. 데이터 테이블의 구조는 행(row), 관측값(observation)과 열(column), 컬럼, 변수(variable) 그리고 셀(cell)로 구성되어 있다. 2. 행렬 생성 매트릭스(matrix)는 2차원 데이터로, 매트릭스의 모든 셀에 저장되는 값은 동일한 자료형이어야 한다. 매트릭스를 생성할 때는 matrix() 함수를 사용한다. matrix() 함수 안에 값, nrow 옵션에 행의 개수, ncol 옵션에 열의 개수를 입력하여 매트릭스를 생성한다. 그렇게 생성한 매트릭스의 행과 열의 이름을 확인해 보면 NUL.. 2024. 3. 29.
[파이썬으로 하는 데이터 분석] 17. seaborn - 우당탕탕 개발자 되기 프로젝트 seaborn는 보통 sns라는 축약어로 많이 불러와 사용합니다. seaborn 자체에 기본으로 제공해 주는 데이터는 load_dataset() 함수를 활용해 불러오면 사용할 수 있습니다. 우선 seaborn 말고 matplotlib를 사용해 요일(day) 별로 요금(total_bill)을 막대그래프를 그려보면 주말이 평일보다 더 많은 것을 확인할 수 있습니다. 이렇게 이전에는 matplotlib를 사용해 시각화를 했다면 이번에는 seaborn을 사용해 시각화를 해보도록 하겠습니다. seaborn으로 막대그래프를 그릴 때는 barplot() 함수를 사용합니다. barplot() 함수를 사용할 때는 data 옵션에 그래프를 그릴 때 사용할 데이터 프레임을 넣고, 각 x축과 y축에 해당하는 column을 넣.. 2024. 3. 24.
[R 공부하기] 2. 변수와 벡터 - 우당탕탕 개발자 되기 프로젝트 목차 변수 벡터(vector) 벡터 생성 연속적인 벡터 생성 결합형 벡터 생성 벡터에 이름 부여 벡터 인덱싱 벡터의 연산 산술 연산 비교 연산 논리 연산 집합 연산 벡터 요소 간 연산 벡터 다루기 any, all, which, subset NA, NULL 벡터의 형변환 문자 벡터 연산 팩터(factor) 명목형 팩터 생성 순서형 팩터 생성 팩터 관련 함수 리스트 리스트 생성 리스트 조회 리스트 항목 추가 리스트 데이터 변경 리스트 키 이름 확인 및 변경 리스트 항목 삭제 리스트 합치기 리스트의 크기 확인 unlist 1. 변수변수란 프로그램에서 어떤 값을 저장하는 저장소나 보관 박스를 의미한다. 변수명 지정 규칙첫 글자는 영문자(알파벳) or 마침표(.)로 시작 (일반적으로는 영문자로 시작)두 번째 글자.. 2024. 3. 24.
[파이썬으로 하는 데이터 분석] 16. 시각화 - 우당탕탕 개발자 되기 프로젝트 시각화는 데이터를 가지고 많은 데이터의 관계를 그림으로 나타내어 한눈에 파악하기 쉽도록 구현하는 것입니다. 시각화를 할 때는 시각화 결과를 보여줄 대상을 잘 생각해야 합니다. 또한 시각화의 결과가 직관적이어야 하고 결과를 바로 파악할 수 있어야 좋은 시각화라고 할 수 있습니다. 우선 전에 살펴봤었던 matplotlib 도구를 활용하여 시각화하는 방법을 살펴보면, pyplot에 plot 메서드가 있습니다. plot 메서드는 일반적인 선 그래프가 도출되는 것을 볼 수 있습니다. scatter 메서드는 산점도를 도출하는 메서드입니다. scatter plot은 데이터의 분포를 나타냅니다. bar 메서드는 막대그래프를 도출하는 메서드입니다. plot 메서드의 marker 옵션은 선 그래프에서 데이터의 점이 해당 .. 2024. 3. 23.
[프로그래머스] 숫자 카드 나누기 - 파이썬(Python) - 우당탕탕 개발자 되기 프로젝트 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 1. 문제 설명 2. 풀이과정 해당 문제는 두 조건 중 하나라도 만족하는 가장 큰 양의 정수를 구하는 문제이다. 각 조건을 만족하는지 판별하는 방법은 각 카드 리스트의 최대 공약수를 구하여 구한 최대 공약수를 다른 리스트의 카드 값에 나누어 봤을 때 모두 나누어 떨어지지 않으면 된다. 각 리스트의 최대 공약수를 구할 때는 math 라이브러리의 gcd() 함수를 사용한다. 그렇게 구한 각 리스트의 최대 공약수를 다른 리스트의 값들과 모두 나누어 0이면 True를, 0이 아니면 False 값으로 저장한 후 0이 .. 2024. 3. 23.
[프로그래머스] 시소 짝꿍 - 파이썬(Python) - 우당탕탕 개발자 되기 프로젝트 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 1. 문제 설명 2. 풀이과정 해당 문제는 가능한 시소 짝꿍의 수를 구하는 문제이다. 가능한 짝꿍의 조합을 하나하나 판별하는 것은 많은 시간이 걸린다. 하여 각 무게별로 가능한 조합인지 판별하고 해당 조합이 총 몇 쌍 나올 수 있는지 구하는 방법으로 해결하고자 하였다. 우선 동일한 무게를 가지는 사람은 서로 동일한 거리에만 앉으면 되므로 동일한 무게를 가지는 사람의 수를 세어 그중 2명을 뽑는 경우의 수를 구한다. 다른 무게를 가지는 사람들 중 서로 짝꿍이 될 수 있는 조합을 구한다. 이후 전체 인원 중 해당.. 2024. 3. 18.
[파이썬으로 하는 데이터 분석] 15. DataFrame 병합하기 - 우당탕탕 개발자 되기 프로젝트 여러 데이터 프레임을 하나로 합치는 방법에는 여러 가지가 있는데 우선 concat을 살펴보면, concat은 단순하게 데이터 프레임들을 붙이는, 연결하는 방법입니다. concat은 서로 크기(구조)가 다른 데이터 프레임이라도 병합이 가능합니다. concat() 함수 안에 병합할 데이터 프레임을 [ ]로 묶어 입력해 사용하면 됩니다. concat을 사용해 병합한 결과를 살펴보면 중복되는 칼럼은 아래로 이어져서 데이터가 저장되고 중복되지 않는 칼럼의 공간은 NaN의 값으로 채워진 것을 확인할 수 있습니다. concat() 기본적으로 아래로 데이터 프레임을 붙이는 방법입니다. 여기서 위아래가 아닌 옆으로 데이터 프레임을 붙이고 싶으면 concat() 함수에서 axis 옵션을 1로 변경해 주면 옆으로 데이터 프.. 2024. 3. 17.
[파이썬으로 하는 데이터 분석] 14. 데이터 보기 - 우당탕탕 개발자 되기 프로젝트 분석할 데이터를 파일에서 잘 불러왔다면 다음으로는 데이터가 어떻게 구성되었는지 알아야 합니다. 살펴볼 데이터를 가져온 뒤, head() 함수를 사용하면 해당 데이터의 위쪽 행들만 간단히 살펴볼 수 있습니다. 여기서 head() 함수 안에 값을 넣어주면 나타날 행의 개수를 지정해 줄 수 있습니다. 반대로 아래쪽 행들을 살펴보고 싶다면 tail() 함수를 사용하면 됩니다. head() 함수와 마찬가지로 tail() 함수 안에 값을 넣어주면 나타날 행의 개수를 지정해 줄 수 있습니다. head() 함수와 tail() 함수 모두 기본적으로 5개의 데이터를 보여줍니다. 다음으로 데이터 프레임의 shape는 데이터 프레임의 모양 즉, 행과 열의 개수를 의미합니다. shape는 데이터 프레임의 내용은 보여주지 않고 .. 2024. 3. 16.
[R 공부하기] 1. R, R Studio 설치 및 사용 - 우당탕탕 개발자 되기 프로젝트 목차 R 설치 R 간단히 사용 R Studio 설치 R Studio 화면 구성 R Studio 다루기 R Studio 작업환경 구축 프로젝트 관리 패키지 설치 및 사용 R Studio 간단히 사용 1. R 설치 R: The R Project for Statistical Computing www.r-project.org 먼저 R을 설치해 보면, 위의 링크를 접속하여 사진과 같이 따라 하면서 설치하면 된다. Korea와 0-Cloud 중 상관없이 선택하면 된다. 본인의 환경에 맞는 파일을 다운로드하면 된다. 계속해서 차례대로 클릭하며 다운로드를 진행한다. 파일이 설치가 되면 한국어를 선택한다. 설치할 위치를 선택하여 경로를 변경하거나 유지한 채로 설치를 계속한다. 구성 요소 설치에서 필요한 항목을 선택하고 .. 2024. 3. 15.
[백준] 1753번 : 최단경로 - 파이썬(Python) - 우당탕탕 개발자 되기 프로젝트 1753번: 최단경로 첫째 줄에 정점의 개수 V와 간선의 개수 E가 주어진다. (1 ≤ V ≤ 20,000, 1 ≤ E ≤ 300,000) 모든 정점에는 1부터 V까지 번호가 매겨져 있다고 가정한다. 둘째 줄에는 시작 정점의 번호 K(1 ≤ K ≤ V)가 www.acmicpc.net 1. 문제 설명 2. 풀이과정 해당 문제는 시작점과 다른 노드와 관련된 최단 경로의 경로값을 구하는 문제이다. 다익스트라 알고리즘의 가장 기본적인 형태를 구현할 수 있는지 물어보는 문제라고 할 수 있다. 다익스트라 알고리즘의 핵심 이론 인접 리스트로 그래프 구현하기 인접 리스트에 연결한 데이터 자료형은 [노드, 가중치] 같은 형태로 선언하여 연결한 점도 잘 봐야 한다. 최단 거리 리스트 초기화하기 출발 노드는 0, 이외의 노.. 2024. 3. 10.
728x90
반응형