Today i learned & Week i learned/파이썬 관련

판다스 기초 .groupby() (feat.혼공데분)

데분조 2024. 1. 7. 10:19
반응형

참고 도서

 

혼자 공부하는 데이터 분석 with 파이썬 : 네이버 도서

네이버 도서 상세정보를 제공합니다.

search.shopping.naver.com


.groupby()

사용법 : 데이터프레임명.groupby(by=[그룹화할 컬럼 명], dropna = False : NaN이 있는 행 삭제하지 않음).연산함수()

-> 그룹화하기

 

예제 코드

count_df = ns_book[['도서명','저자','ISBN','권','대출건수']]
# ns_book 데이터프레임에서 '도서명','저자','ISBN','권','대출건수' 컬럼만 선택하여 
# count_df 변수라는 저장

count_df
# count_df 출력

 

출력 결과


예제 코드(case1)

group_df = count_df.groupby(by=['도서명','저자','ISBN','권'], dropna=False)
# count_df 데이터 프레임을 '도서명','저자','ISBN','권' 컬럼 기준으로 그룹화.
# dropna = False -> NaN이 있는 행 삭제하지 않음.

loan_count = group_df.sum()
# group_df에서 그룹화 기준으로 대출건수의 합을 구한 데이터프레임을 loan_count 변수에 합치기.

loan_count.head()
# loan_count 데이터 프레임 상위 5개 행 출력!

 

예제 코드(case2)

loan_count = count_df.groupby(by=['도서명','저자','ISBN','권'], dropna=False).sum()
loan_count.head()

 

출력 결과


 

반응형