빅데이터 분석기사10 [빅분기 실기] 판다스 (pandas) 데이터 추가, 변경. 정렬 1. 데이터 추가 및 변경1-1. 결측치(NaN) 대입import pandas as pddf = pd.read_csv('cafe.csv') # cafa.csv 만드는 방법 참고 https://kdh9797-devwiki.tistory.com/77df.head() '원산지'라는 새로운 컬럼을 만들고 데이터는 '값없음'을 의미하는 NaN (Not a Number)을 대입한다.NaN (결측치) 이 있는 데이터를 만든다. NaN은 numpy 라이브러리를 통해 만들 수 있다. ※ 넘파이 (numpy)파이썬 라이브러리로 빠르게 수치 연산하는 것이 특징이다.연산량이 많은 딥러닝에서 주로 사용한다. 결측치가 있는 데이터셋을 만들기 위해 넘파이 라이브러리를 불러오고, 원산지 컬럼에 np.nan을 대입한다. impor.. 2024. 11. 9. [빅분기] 판다스 (pandas) 인덱싱. 슬라이싱 (loc, iloc) 1. loc1-1. 인덱싱loc는 location의 약자로 인덱스명 또는 컬럼명을 통해 데이터를 접근한다.df.loc [인덱스 명]을 통해 해당 인덱스 데이터에 접근할 수 있다. import pandas as pddf = pd.read_csv('cafe.csv') # cafa.csv 만드는 방법 참고 https://kdh9797-devwiki.tistory.com/77df.head() df.loc[0] 특정 행과 특정 열의 교차점에 있는 단일 값을 출력할 때는 콤마로 구분해 찾을 수 있다. df.loc[1, "가격"] 1-2. 슬라이싱loc [행 범위 또는 특정 행, 컬럼 (열)의 범위 또는 특정 컬럼]을 활용한다.범위는 '시작 인덱스 : 끝 인덱스'로 구간을 나타낸다.시작 인덱스를 생략하면 처음.. 2024. 11. 6. [빅분기] 판다스 (pandas) - 탐색적 데이터 분석 (EDA). 자료형 변환. 컬럼 추가. 데이터 삭제 1. 탐색적 데이터 분석 (Exploratory Data Analysis, EDA)데이터를 탐색하고 이해하기 위해 수행한다.일반적으로 데이터는 한눈에 관찰할 수 없다. 눈으로 식별할 수 있는 크기라도 시간이 많이 소요된다.따라서 탐색적 데이터 분석 과정을 통해 데이터를 다양한 각도에서 관찰하고 이해해야 한다. 1-1. 데이터 프레임 샘플 확인head(N)은 데이터프레임의 상위 N개의 행을 반환한다.N은 자연수이고 기본값은 5이다. import pandas as pddf = pd.read_csv('cafe.csv') # cafa.csv 만드는 방법 참고 https://kdh9797-devwiki.tistory.com/77df.head() df.head(2) tail은 데이터프레임의 하위 N개의 행을 .. 2024. 11. 2. [빅분기 실기] 판다스 (Pandas) - 데이터 프레임과 시리즈. 데이터 저장 및 불러오기 1. 데이터프레임과 시리즈판다스의 데이터는 시리즈 (Series)와 데이터프레임(DataFrame)으로 구성되어 있다.시리즈는 1차원 형대고, 데이터프레임은 행(rows)과 열(columns)이 있는 2차원 (표) 형태다. 1-1. 행과 열행은 각 데이터/레코드이고 열은 컬럼 전체다. 즉 행은 가로이고 열은 세로이다.판다스에서 축(axis)을 숫자로 나타낼 때 행은 0, 열은 1로 표시하므로 숫자 순서대로 "행(0)렬(1)"로 기억한다. 1-2. 판다스의 별칭import pandas as pd 1-3. 시리즈시리즈는 pd.Series(데이터)로 만들 수 있다. 데이터는 리스트를 활용해 만들 수 있다.출력을 하면 인덱스와 값이 출력되고 자료형은 'object'다.판다스에서 object형은 주로 문자열 데이.. 2024. 11. 2. 이전 1 2 다음