데이터프레임을 다루다보면 필요없는 행이나 열을 제거해야 되는 경우가 생깁니다.

이 경우 사용할 라이브러리 문법을 알아보죠.

 

우선 데이터프레임을 생성합니다.

df = pd.DataFrame({

    'a': [4, 5, 6],
    'b': [7, 8, 9],
    'c': [10, 11, 12]},
    index = [1, 2, 3]
)

크게 삭제할 부분은 행 or 열 일것입니다.

이는 단순하게 하나일수도 여러개일 수도 있습니다.

 

행과 열을 나누는 기준은 아래의 경우 중 하나를 택합니다.

1. axis=0 or axis=1 (행이나 열을 선택해줍니다.)

2. index=[], columns=[] 로 반환합니다.

 

예를 들어서 행의 1, 2 인덱스를 드랍하고자 합니다.

그러면 아래와 같이 두가지 방법으로 가능합니다.

# 1번 방법
df.drop([1, 2], axis=0)

# 2번 방법
df.drop(index = [1, 2])

물론 inplace=True를 해주지 않으면 데이터프레임이 변경되지는 않습니다.

 

다음으로 열을 바꿔볼까요

위와 똑같은 원리입니다.

이번에는 하나의 컬럼만 드랍해봅시다. 

'c'열을 드랍할게요.

# 1번 방법
df.drop(['c'], axis=1)

# 2번 방법
df.drop(columns = ['c'])

둘 다 동일한 결과가 나옵니다. 

데이터프레임에 적용하고자 하면 inplace=True 파라미터를 추가합니다.

 

요약

df.drop() 메소드를 이용하여 행이나 열을 제거할 수 있다.

axis를 통해서 행, 열을 구분한다(디폴트는 행 axis=0 이다.)

혹은 index = [], column = [] 을 통해서 구분하기도 한다.

둘 중 어느방법이든지 상관없다.

+ Recent posts