데이터프레임을 다루다보면 필요없는 행이나 열을 제거해야 되는 경우가 생깁니다.
이 경우 사용할 라이브러리 문법을 알아보죠.
우선 데이터프레임을 생성합니다.
df = pd.DataFrame({
'a': [4, 5, 6],
'b': [7, 8, 9],
'c': [10, 11, 12]},
index = [1, 2, 3]
)
크게 삭제할 부분은 행 or 열 일것입니다.
이는 단순하게 하나일수도 여러개일 수도 있습니다.
행과 열을 나누는 기준은 아래의 경우 중 하나를 택합니다.
1. axis=0 or axis=1 (행이나 열을 선택해줍니다.)
2. index=[], columns=[] 로 반환합니다.
예를 들어서 행의 1, 2 인덱스를 드랍하고자 합니다.
그러면 아래와 같이 두가지 방법으로 가능합니다.
# 1번 방법
df.drop([1, 2], axis=0)
# 2번 방법
df.drop(index = [1, 2])
물론 inplace=True를 해주지 않으면 데이터프레임이 변경되지는 않습니다.
다음으로 열을 바꿔볼까요
위와 똑같은 원리입니다.
이번에는 하나의 컬럼만 드랍해봅시다.
'c'열을 드랍할게요.
# 1번 방법
df.drop(['c'], axis=1)
# 2번 방법
df.drop(columns = ['c'])
둘 다 동일한 결과가 나옵니다.
데이터프레임에 적용하고자 하면 inplace=True 파라미터를 추가합니다.
요약
df.drop() 메소드를 이용하여 행이나 열을 제거할 수 있다.
axis를 통해서 행, 열을 구분한다(디폴트는 행 axis=0 이다.)
혹은 index = [], column = [] 을 통해서 구분하기도 한다.
둘 중 어느방법이든지 상관없다.