파이썬 판다스 라이브러리를 활용해서 데이터프레임 생성, 멀티인덱스 생성, pd.MultiIndex.from_tuples()

 

이번에는 저번시간에 이어서 멀티 인덱스를 만들려고 합니다.

기본적으로 데이터셋을 만든 뒤에, 아래의 그림과 같이 row를 한번 더 묶고 싶을 때 쓰는 방법이죠.

실전에서 많이 쓸지는 모르겠어요. pivot이나 groupby와 같은 기능들이 더 익숙하거든요.

그래도 아래와 같은 방식으로 만들어보죠.

df = pd.DataFrame({
    'a': [4, 5, 6],
    'b': [7, 8, 9],
    'c': [10, 11, 12]},
    index = pd.MultiIndex.from_tuples([('d', 1), ('d', 2), ('e', 2)],
                                     names=['n', 'v'])
)

원래는 index를 리스로 형태로 반환하면

해당 인덱스가 지정이 되는건데,

여기서는 인덱스를 pd.MultiIndex.from_tuples()라는 메소드를 보냅니다.

묶어줄 인덱스마다 튜플형식으로 묶어주는게 굉장히 번거로워 보이네요.

+ Recent posts