본문 바로가기

Pandas

판다스(pandas) - 데이터프레임 행, 열 선택/필터/삭제하기 *행/열 선택하기 기본 특정 row(행) n~m-1까지 선택 df[n:m] 가로 인덱스로 행 n~m-1까지 선택 df.loc[[n, m]] column(열) 선택 - 이름을 통해 df['열 이름'] 열 n~m-1까지 선택 df.iloc[:, n:m] *행/열 필터링하기 특정 열 값이 조건값 이상인 행만 필터링 df[df.열 > 조건값] df.query('조건내용') 과 동일 다중 조건의 경우 df[ (df.열1>조건값1) & (df.열2 == 조건값2)] 이름으로 여러 개의 열 선택 시 df.filter(items = ['열1', '열2']) 컬럼명에 a가 들어가는 컬럼만 표시 df.filter(like='a', axis=1) *행/열 삭제하기 이름으로 행 삭제 df.drop(['행 이름1', '행 이름.. 더보기
판다스(pandas) - 데이터프레임 불러오기/생성/파일로 저장 판다스 사용시 모듈 불러오기 import pandas as 약칭(보통 pd) ▶데이터프레임 불러오기 데이터프레임명 = pd.read_csv('경로.csv') 한글정보는 인코딩 오류가 난다. 옵션으로 engine='python' 붙여주는걸로 해결되었다. 이걸로 해결 안되는 경우도 있음. 상위 디렉토리로 가야하는 경우 ../ 을 이용한다. 파일 경로의 폴더 및 파일명은 가급적 영어로 맞춰두자. ▶데이터프레임 생성하기 방법1. 딕셔너리 리스트 사용 딕셔너리리스트명 = [ {'항목1' : 값1, '항목2 ': 값2 ... , '항목n' : 값n}, {'항목1' : 값1, '항목2 ': 값2 ... , '항목n' : 값n}, ... , {'항목1' : 값1, '항목2 ': 값2 ... , '항목n' : 값n} ].. 더보기