Today i learned & Week i learned/파이썬 관련

판다스 기초 .duplicated()(feat.혼공데분)

데분조 2024. 1. 5. 19:47
반응형

참고 도서

 

혼자 공부하는 데이터 분석 with 파이썬 : 네이버 도서

네이버 도서 상세정보를 제공합니다.

search.shopping.naver.com


.duplicated()

사용법

"데이터프레임 명".duplicated(subset=[컬럼명], keep=True)

-> 중복된 행 찾기

 

예제 코드(1)

ns_book.duplicated()
# ns_book라는 데이터프레임에서 중복된 행을 True로 표시해줘!

 

출력 결과(1)


예제 코드(2)

sum(ns_book.duplicated())
# ns_book.duplicated()의 True 개수를 알려줘!

 

출력 결과(2)


예제 코드(3)

ns_book.duplicated(subset=['도서명','저자','ISBN'])
# ns_book라는 데이터프레임에서 '도서명','저자','ISBN' 컬럼 기준으로 중복된 행을 True로 표시해줘!

 

출력 결과(3)

 


예제 코드(4)

sum(ns_book.duplicated(subset=['도서명','저자','ISBN']))
# ns_book.duplicated(subset=['도서명','저자','ISBN'])에서 True 개수 알려줘!

 

출력 결과(4)

예제 코드(5)

dup_rows = ns_book.duplicated(subset=['도서명','저자','ISBN'], keep=False)
# ns_book.duplicated 데이터 프레임에서 '도서명','저자','ISBN'컬럼에서 중복된 행 모두 True로 표시
# dup_rows라는 변수에 저장

ns_book3 = ns_book[dup_rows]
# ns_book 데이터 프레임에서 dup_row 조건에서 True로 표시된 행 표시

ns_book3.head()
# ns_book3 데이터프레임 상위 5개 행 출력!

 

출력 결과(5)

 


반응형