반응형

전체 글 50

맷플롯립 기초 plt.figure() [feat.혼자 공부하는 데이터분석]

활용 도서 혼자 공부하는 데이터 분석 with 파이썬 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com plt.figure() 사용 방법 : plt.figure(figsize=(가로 사이즈, 세로 사이즈), dpi(해상도)=원하는 값) -> 그래프의 크기를 지정할 수 있다. 예제 코드 plt.figure(figsize=(9, 6)) # 그래프의 크기는 가로 9 , 세로 6으로 한다. plt.scatter(ns_book7['도서권수'], ns_book7['대출건수'], alpha=0.1) # x값은 ns_book7 데이터프레임의 "도서권수" 컬럼의 값들 # y값은 ns_book7 데이터프레임의 "대출건수" 컬럼의 값들 # 투명도는 0.1로 하고 # 산점도 그..

데이터 문해력 요약 4

이전 내용 데이터 문해력 요약 3 이전 내용 데이터 문해력 요약2 이전 글 데이터 문해력 요약1 도서 빅데이터 시대, 성과를 이끌어 내는 데이터 문해력 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com 데 datanaly.tistory.com 비교할 때 체크포인트 1. 결론으로 이어지는결과가 나올 것인가? (반드시 결론으로 부합하는 결과가 나온다는 보증은 없다.) 2. 비교를 통해 "차이"를 찾을 수 있는가? 3. '데이터 중심'으로 접근하는 사람의 결과물은 대체로 '결과'로 끝납니다. 4. '목적 중심'으로 접근하는 사람은 '결론'까지 말합니다. 5. '데이터를 활용한다'란, 결과가 아니라 결론을 도출하는 것입니다. 최종 목표는 '행동과 판단' 1. '현..

데이터 문해력 요약 3

이전 내용 데이터 문해력 요약2 이전 글 데이터 문해력 요약1 도서 빅데이터 시대, 성과를 이끌어 내는 데이터 문해력 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com 데이터 분석 자체가 목적이 되기 십 datanaly.tistory.com 결론 도출 프로세스 1) 평가 지표 및 기준을 결정 (어떤 요소와 지표가 더욱 목적에 부합하는가?) 2) 적합한 데이터 및 그래프 선택 (어떤 데이터 형태와 그래프가 효과적인가?) 3) 결론 (결국 무슨 말을 할 수 있는가?) 프레젠테이션 순서 1) 결론 (결국 무슨 말을 할 수 있는가?) 2) 평가 지표 및 기준을 결정 (어떤 요소와 지표가 더욱 목적에 부합하는가?) 3) 적합한 데이터 및 그래프 선택 (어떤 데이터 ..

맷플롯립 기초 scatter() [feat.혼자공부하는데이터분석]

활용 도서 혼자 공부하는 데이터 분석 with 파이썬 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com .scatter() 사용법 plt.scatter(x축 값, y축 값, alpha(투명도) =[0~1]) -> 산점도 그래프를 그릴 수 있다. 예제 코드 import matplotlib.pyplot as plt # 맷플롯립.파이플롯 라이브러리를 가져오고 plt로 칭하겠다. plt.scatter([1,2,3,4], [1,2,3,4]) # x값은 [1,2,3,4], y값은 [1,2,3,4]로 산점도 그래프를 만들어줘. plt.show() # 그래프를 보여줘 출력 결과 예제 코드 plt.scatter(ns_book7['번호'], ns_book7['대출건수']) ..

데이터 문해력 요약2

이전 글 데이터 문해력 요약1 도서 빅데이터 시대, 성과를 이끌어 내는 데이터 문해력 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com 데이터 분석 자체가 목적이 되기 십상이다. 1. 데이터와 데이터 datanaly.tistory.com 풀고자 하는 문제가 명확하지 않다. 1. 가장 먼저 해야 하는 작업은 '목적과 문제에 대한 정의' 2. 사용된 언어가 구체적이고 명확한가? 3. 데이터 안에는 어떠한 논리성도 객관성도 없다. 4. 정답은 없다! 5. '문제', '원인', '해결 방안'을 구분하고 있는가? 6. 작업을 시작하기 전에, 해결하고자 하는 '문제'와 그 '목적'에 대해 명확히 할 필요가 있습니다. 7. 자신의 편견이 들어가게 되면 상황을 정리하기가..

데이터 문해력 요약1

도서 빅데이터 시대, 성과를 이끌어 내는 데이터 문해력 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com 데이터 분석 자체가 목적이 되기 십상이다. 1. 데이터와 데이터 분석은 목적을 달성하기 위한 도구에 지나지 않습니다. 2. 그래프 중심, 데이터 중심이라 아니라 목적 중심의 데이터 분석이 중요하다. 데이터 활용 프로세스 1. 겉으로 드러난 현상 → 2. 목적 및 문제를 정의 → 3. 지표를 결정 → 4. 현재 상태를 파악 → 5. 평가 → 6. 요인을 분석 → 7. 해결 방안을 모색 데이터 활용 실패의 원인 1. 풀고자 하는 문제가 명확하지 않다. 2. 정의한 문제와 사용하는 데이터가 일치하지 않는다. 데이터를 가공한다. → 데이터에서 무엇을 알 수 있..

판다스 기초 .groupby() (feat.혼공데분)

참고 도서 혼자 공부하는 데이터 분석 with 파이썬 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com .groupby() 사용법 : 데이터프레임명.groupby(by=[그룹화할 컬럼 명], dropna = False : NaN이 있는 행 삭제하지 않음).연산함수() -> 그룹화하기 예제 코드 count_df = ns_book[['도서명','저자','ISBN','권','대출건수']] # ns_book 데이터프레임에서 '도서명','저자','ISBN','권','대출건수' 컬럼만 선택하여 # count_df 변수라는 저장 count_df # count_df 출력 출력 결과 예제 코드(case1) group_df = count_df.groupby(by=['도서명'..

스파르타 코딩 내일배움캠프 데이터분석 3주차 회고(week i learned)

- 지난 일주일 동안 가장 인상 깊었던 배움에는 뭐가 있었지? 판다스 기초! - 그 배움까지 다가가는데 어떤 어려움이 있었지? 크게 어려움은 없었지 - 그 과정에서 나는 무엇을 깨달았고, 어떤 감정/생각이 들었었지? 판다스 재밌구나! 열심히 해야겠다! - 결과적으로, 현재 나의 상태는 어떻게 되었지? 판다스 기초 마스타! - 이 상태에서 다음 일주일을 더 잘 보내려면 무엇이 필요할까? 무리하지말고 즐기자! 즐기면 된다! 이제 두 번째 프로젝트가 시작될텐데. 큰 문제 없이 잘 진행됐으면 좋겠다:) 잘하고 있어! 4주차도 파이팅이야!

판다스 기초 .duplicated()(feat.혼공데분)

참고 도서 혼자 공부하는 데이터 분석 with 파이썬 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com .duplicated() 사용법 "데이터프레임 명".duplicated(subset=[컬럼명], keep=True) -> 중복된 행 찾기 예제 코드(1) ns_book.duplicated() # ns_book라는 데이터프레임에서 중복된 행을 True로 표시해줘! 출력 결과(1) 예제 코드(2) sum(ns_book.duplicated()) # ns_book.duplicated()의 True 개수를 알려줘! 출력 결과(2) 예제 코드(3) ns_book.duplicated(subset=['도서명','저자','ISBN']) # ns_book라는 데이터프레임에..

판다스 기초 메서드 head(), drop(), dropna() (feat.혼공데분)

활용 교재 혼자 공부하는 데이터 분석 with 파이썬 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com .head() 사용법 "데이터 프레임 명".head() → 데이터 프레임의 상위 5개 행 출력 예제 코드 ns_df.head() # ns_df라는 데이터프레임의 상위 5개 행 보여줘! 출력 결과 .drop() 사용법 "데이터 프레임 명".drop("삭제하고자하는 컬럼명", axis = [0:행, 1:열], implace=[True : 덮어쓰기, False:덮어쓰지않기]) → 데이터프레임의 행과 열을 지울 수 있다. 예제 코드 (1) ns_book = ns_df.drop('Unnamed: 13', axis=1) # ns_df라는 데이터프레임에서 'Unnam..

반응형