본문 바로가기

판다스9

[빅분기] 판다스 (pandas) 인덱싱. 슬라이싱 (loc, iloc) 1. loc1-1. 인덱싱loc는 location의 약자로 인덱스명 또는 컬럼명을 통해 데이터를 접근한다.df.loc [인덱스 명]을 통해 해당 인덱스 데이터에 접근할 수 있다. import pandas as pddf = pd.read_csv('cafe.csv') # cafa.csv 만드는 방법 참고 https://kdh9797-devwiki.tistory.com/77df.head() df.loc[0] 특정 행과 특정 열의 교차점에 있는 단일 값을 출력할 때는 콤마로 구분해 찾을 수 있다. df.loc[1, "가격"] 1-2. 슬라이싱loc [행 범위 또는 특정 행, 컬럼 (열)의 범위 또는 특정 컬럼]을 활용한다.범위는 '시작 인덱스 : 끝 인덱스'로 구간을 나타낸다.시작 인덱스를 생략하면 처음.. 2024. 11. 6.

[빅분기] 판다스 (pandas) - 탐색적 데이터 분석 (EDA). 자료형 변환. 컬럼 추가. 데이터 삭제 1. 탐색적 데이터 분석 (Exploratory Data Analysis, EDA)데이터를 탐색하고 이해하기 위해 수행한다.일반적으로 데이터는 한눈에 관찰할 수 없다. 눈으로 식별할 수 있는 크기라도 시간이 많이 소요된다.따라서 탐색적 데이터 분석 과정을 통해 데이터를 다양한 각도에서 관찰하고 이해해야 한다. 1-1. 데이터 프레임 샘플 확인head(N)은 데이터프레임의 상위 N개의 행을 반환한다.N은 자연수이고 기본값은 5이다. import pandas as pddf = pd.read_csv('cafe.csv') # cafa.csv 만드는 방법 참고 https://kdh9797-devwiki.tistory.com/77df.head() df.head(2) tail은 데이터프레임의 하위 N개의 행을 .. 2024. 11. 2.

[빅분기 실기] 판다스 (Pandas) - 데이터 프레임과 시리즈. 데이터 저장 및 불러오기 1. 데이터프레임과 시리즈판다스의 데이터는 시리즈 (Series)와 데이터프레임(DataFrame)으로 구성되어 있다.시리즈는 1차원 형대고, 데이터프레임은 행(rows)과 열(columns)이 있는 2차원 (표) 형태다. 1-1. 행과 열행은 각 데이터/레코드이고 열은 컬럼 전체다. 즉 행은 가로이고 열은 세로이다.판다스에서 축(axis)을 숫자로 나타낼 때 행은 0, 열은 1로 표시하므로 숫자 순서대로 "행(0)렬(1)"로 기억한다. 1-2. 판다스의 별칭import pandas as pd 1-3. 시리즈시리즈는 pd.Series(데이터)로 만들 수 있다. 데이터는 리스트를 활용해 만들 수 있다.출력을 하면 인덱스와 값이 출력되고 자료형은 'object'다.판다스에서 object형은 주로 문자열 데이.. 2024. 11. 2.

이전 1 2 다음

티스토리툴바