전체 글91 [빅분기 실기] 판다스 (pandas) 그룹핑 1. 그룹핑 (Grouping)데이터를 다양한 방식으로 집계하고 분석하는 데는 groupby()를 사용한다.특정 컬럼을 기준으로 여러 그룹을 나누고 각 그룹에 대한 합계, 평균, 최대, 최소, 빈도 등을 구할 수 있다. 데이터를 불러온다. import pandas as pddf = pd.read_csv('cafe4.csv') # https://kdh9797-devwiki.tistory.com/85df.head() 1-1. 그룹 기준 1개원산지를 기준으로 평균값을 계산해 보자. df.groupby('원산지').mean(numeric_only=True) 원산지를 기준으로 그룹이 만들어진다.수치형 데이터인 '가격', '칼로리', '이벤트가'의 평균을 확인할 수 있다. 1-2. 집계 연산mean()평균sum.. 2024. 11. 9. [빅분기 실기] 판다스 (pandas) 내장 함수 1. 내장 함수데이터를 불러온다. import pandas as pddf = pd.read_csv('cafe4.csv') # https://kdh9797-devwiki.tistory.com/85df.head() 1-1. len()데이터프레임에서 행(row)의 수를 반환한다.행의 수를 구하는 다른 방법은 df.shape을 사용한다.df.shape [0]은 행의 수, df.shape [1]은 열의 수이다. # 데이터프레임의 행의 수 구하기print(len(df))print(df.shape[0]) 88 1-2. sum()sum()은 합계 함수이다.예를 들어 '가격이 5000보다 크다'라는 조건에 맞는 데이터 수를 구한다고 하자. df['가격'] > 5000 이때 True는 1, False는 0이므로 조건.. 2024. 11. 9. [빅분기 실기] 판다스 (pandas) 값 변경. 문자열 1. 값 변경데이터를 불러온다.import pandas as pddf = pd.read_csv('cafe3.csv') # https://kdh9797-devwiki.tistory.com/84 cafe3.csv 참고df.head() 1-1. replace 활용특정 값을 찾아 대체가 필요하다면 replace()를 활용한다.replace()는 변경 전 값과 변경 후 값 순서로 입력해 사용한다.여러 개의 값을 변경하기 위해 replace()를 여러 번 사용한다. df.replace('아메리카노', '룽고', inplace=True)df.replace('녹차', '그린티', inplace=True)df 딕셔너리를 활용한 후 replace() 괄호 안에 넣어 사용할 수 있다. change = {'룽고' : '.. 2024. 11. 9. [빅분기 실기] 판다스 (pandas) 필터링, 결측치 처리 데이터를 불러온다. import pandas as pddf = pd.read_csv('cafe2.csv') # https://kdh9797-devwiki.tistory.com/83 cafe2 만들기 참고df 1. 필터링1-1. 1개 조건 필터링특정 컬럼에 조건식을 적용하면 True/False가 반환된다.조건에 만족하면 True, 만족하지 않으면 False이다.'칼로리' 컬럼의 각 값이 50보다 작은 지를 나타내는 코드이다. df['칼로리'] Boolean 결과를 데이터프레임의 대괄호 안에 넣으면 True로 표시된 행들만 선택된다.df[df['칼로리'] 1-2. NOT 연산자'~' 연산자는 조건의 반대를 필터링하는 데 사용한다.True를 False로 False를 True로 변경한다. df[~(df.. 2024. 11. 9. [빅분기 실기] 판다스 (pandas) 데이터 추가, 변경. 정렬 1. 데이터 추가 및 변경1-1. 결측치(NaN) 대입import pandas as pddf = pd.read_csv('cafe.csv') # cafa.csv 만드는 방법 참고 https://kdh9797-devwiki.tistory.com/77df.head() '원산지'라는 새로운 컬럼을 만들고 데이터는 '값없음'을 의미하는 NaN (Not a Number)을 대입한다.NaN (결측치) 이 있는 데이터를 만든다. NaN은 numpy 라이브러리를 통해 만들 수 있다. ※ 넘파이 (numpy)파이썬 라이브러리로 빠르게 수치 연산하는 것이 특징이다.연산량이 많은 딥러닝에서 주로 사용한다. 결측치가 있는 데이터셋을 만들기 위해 넘파이 라이브러리를 불러오고, 원산지 컬럼에 np.nan을 대입한다. impor.. 2024. 11. 9. 대전 카이스트 출장 10/13~10/18 (1). 대전 숙박. 대전 맛집. 대전 성심당 10/13토요일 하루 쉬고 월요일 아침부터 교육을 시작해서 일요일 저녁에 대전으로 갔습니다. 이 날도 용산역으로 가서 ktx 타고 서대전역으로 갔어요.주말이어서 그런지 사람이 많았던 것 같아요. 서대전역에서 필살 법카를 사용하여 택시 타고 예약한 숙소로 이동했습니다. 6일 동안 머물 숙소는 신탄진역 근처에 저스트 스테이 호텔입니다.숙소를 예약하면 핸드폰 문자로 출입문 비밀번호를 알려주는데 번호를 눌러야 들어갈 수 있답니다. 그리고 키오스크에서 객실키를 받고 엘리베이터를 타서 객실로 들어갔습니다저번에 갔던 숙소보다는 훨씬 모던하고 깔끔한 분위기였습니다. 원래 2인실인데 저만 사용하다 보니 큰 침대를 혼자 사용할 수 있어서 좋았고요. 그리고 TV OTT 서비스를 이용할 수 있는 것도 너무 좋았답니다. 근데 .. 2024. 11. 8. 이전 1 2 3 4 5 ··· 16 다음