빅분기(8)
-
[빅분기] 판다스 (pandas) - 탐색적 데이터 분석 (EDA). 자료형 변환. 컬럼 추가. 데이터 삭제
1. 탐색적 데이터 분석 (Exploratory Data Analysis, EDA)데이터를 탐색하고 이해하기 위해 수행한다.일반적으로 데이터는 한눈에 관찰할 수 없다. 눈으로 식별할 수 있는 크기라도 시간이 많이 소요된다.따라서 탐색적 데이터 분석 과정을 통해 데이터를 다양한 각도에서 관찰하고 이해해야 한다. 1-1. 데이터 프레임 샘플 확인head(N)은 데이터프레임의 상위 N개의 행을 반환한다.N은 자연수이고 기본값은 5이다. import pandas as pddf = pd.read_csv('cafe.csv') # cafa.csv 만드는 방법 참고 https://kdh9797-devwiki.tistory.com/77df.head() df.head(2) tail은 데이터프레임의 하위 N개의 행을 ..
2024.11.02 -
[빅분기 실기] 판다스 (Pandas) - 데이터 프레임과 시리즈. 데이터 저장 및 불러오기
1. 데이터프레임과 시리즈판다스의 데이터는 시리즈 (Series)와 데이터프레임(DataFrame)으로 구성되어 있다.시리즈는 1차원 형대고, 데이터프레임은 행(rows)과 열(columns)이 있는 2차원 (표) 형태다. 1-1. 행과 열행은 각 데이터/레코드이고 열은 컬럼 전체다. 즉 행은 가로이고 열은 세로이다.판다스에서 축(axis)을 숫자로 나타낼 때 행은 0, 열은 1로 표시하므로 숫자 순서대로 "행(0)렬(1)"로 기억한다. 1-2. 판다스의 별칭import pandas as pd 1-3. 시리즈시리즈는 pd.Series(데이터)로 만들 수 있다. 데이터는 리스트를 활용해 만들 수 있다.출력을 하면 인덱스와 값이 출력되고 자료형은 'object'다.판다스에서 object형은 주로 문자열 데이..
2024.11.02