본문 바로가기

데이터

판다스(pandas) - 데이터프레임 행, 열 선택/필터/삭제하기

*행/열 선택하기 기본

특정 row(행) n~m-1까지 선택

df[n:m]

 

가로 인덱스로 행 n~m-1까지 선택

df.loc[[n, m]]

 

column(열) 선택 - 이름을 통해

df['열 이름']

 

열 n~m-1까지 선택

df.iloc[:, n:m]

 

*행/열 필터링하기

특정 열 값이 조건값 이상인 행만 필터링

df[df.열 > 조건값]
df.query('조건내용') 과 동일

 

다중 조건의 경우

df[ (df.열1>조건값1) & (df.열2 == 조건값2)]

 

이름으로 여러 개의 열 선택 시

df.filter(items = ['열1', '열2'])

컬럼명에 a가 들어가는 컬럼만 표시

df.filter(like='a', axis=1)

 

*행/열 삭제하기

이름으로 행 삭제

df.drop(['행 이름1', '행 이름2']) 

drop은 삭제된 경우의 데이터프레임을 보여만줌 df = df.~~~식으로 해야 지워짐
뒤에 옵션으로 inplace = True가 붙는경우 df에서 바로 삭제

인덱스로 행 삭제

df = df.drop(df.index[[0, 2]])

크기 조건 삭제

df = df[df.조건열 > 조건값]

열 삭제

df = df.drop('열이름', axis=1)