파이썬 판다스 라이브러리를 활용해서 데이터프레임 생성, 멀티인덱스 생성, pd.MultiIndex.from_tuples()
이번에는 저번시간에 이어서 멀티 인덱스를 만들려고 합니다.
기본적으로 데이터셋을 만든 뒤에, 아래의 그림과 같이 row를 한번 더 묶고 싶을 때 쓰는 방법이죠.
실전에서 많이 쓸지는 모르겠어요. pivot이나 groupby와 같은 기능들이 더 익숙하거든요.
그래도 아래와 같은 방식으로 만들어보죠.
df = pd.DataFrame({
'a': [4, 5, 6],
'b': [7, 8, 9],
'c': [10, 11, 12]},
index = pd.MultiIndex.from_tuples([('d', 1), ('d', 2), ('e', 2)],
names=['n', 'v'])
)
원래는 index를 리스로 형태로 반환하면
해당 인덱스가 지정이 되는건데,
여기서는 인덱스를 pd.MultiIndex.from_tuples()라는 메소드를 보냅니다.
묶어줄 인덱스마다 튜플형식으로 묶어주는게 굉장히 번거로워 보이네요.
'파이썬 & 인공지능 > pandas library' 카테고리의 다른 글
파이썬 판다스 컬럼 이름 변경하기, df.columns=[], rename(columns={}), rename 함수 (0) | 2020.04.14 |
---|---|
파이썬 판다스 데이터프레임 정렬 방법 sort_values() (0) | 2020.04.13 |
파이썬 판다스 데이터프레임 합치기, pd.concat(), 열 합치기, 행 합치기, python pandas library cheet sheet (0) | 2020.04.09 |
파이썬 판다스 melt() 사용법, pd.melt() (0) | 2020.04.06 |
파이썬 판다스 라이브러리에서 데이터프레임 생성하기, 판다스 공식문서 참조, pandas_cheat_sheet, pd.DataFrame() (0) | 2020.04.06 |